今日有报道称李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练_朗科科技(300042)股吧

2025-02-06 22:46:04

来自江西

点赞
1
♥ 收藏
A
大中小

分享到：

今日有报道称李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型，该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似，引发广泛关注。不过很快，该s1模型被指“并非从零开始训练”，其基座模型为“阿里通义千问(Qwen)模型”。对此，记者向阿里云方面求证，阿里云方面确认了这一消息，并回应称：“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比o1-preview高出27%。”(新浪科技)

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！