客户端
游戏
无障碍

1

评论

收藏

分享

手机看

微信扫一扫,随时随地看

阿里云通义开源过程奖励PRM模型,7B尺寸比GPT-4o更能发现推理错误

蓝鲸新闻1月16日电,蓝鲸新闻获悉,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM。在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就可以超越GPT-4o。同时,通义团队还开源首个步骤级的评估标准 ProcessBench,填补了大模型推理过程错误评估的空白。(记者 武静静)
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部