成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了
zhonghua @ 2025年02月08日 财经风云
成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了 黄雯雯 AI的推理效率被大幅提高,s1在数学和编码能力测试中与OpenAI的o1和DeepSeek的R1等模型的表现不相上下。在通往AGI的路上,更高效的新方法带来了更多的创新可能。 在DeepSeek火爆全球之际,一个更低成本的AI推理模型悄然登场... 近日,一项来自斯坦福大学和华盛顿大学等机构的研究成果引起了市场关注,李飞飞等人以不到50美元的云计算费用成功训练出了一个名为s1的AI推理模型。研究成果表明,s1在数学和编码能力测试中与OpenAI的o1和DeepSeek的R1等模型的表现不相上下。 s1论文作者Niklas Muennighoff表示: "DeepSeek r1令人兴奋,但缺少OpenAI的测试时间扩展图,并且需要大量数据。我们推出了s1,仅使用1K样本和简单的测试时间干预即可重现o1的预览扩展和性能。" 简单高效的训练方法,挑战传统AI研发模式 s1的研究团队表示,s1模型是以谷歌推理模型Gemini2.0 Flash Thinking Experimental为基础模型,通过蒸馏法提炼出来的。 他们采用了一种名为test-time scaling的方法。研究团队构建了一个小型数据集s1K,通过难度、多样性和质量三个标准来筛选,其中包括1000个经过精心挑选的问题以及相应答案,并附上了"推理"过程,仅使用了16台英伟达H100 GPU,耗时26分钟就完成了训练。 这种方法与传统的大规模强化学习方法(RL)形成鲜明对比,后者的成本通常较高,DeepSeek、OpenAI都采用了这种方法。而s1的研究通过较小的数据集和监督微调(SFT)蒸馏推理模型,大大降低了训练成本并提高了效率。 此外,为了提高答案的准确度,研究团队还运用了一种"预算强制"技术,可以控制测试时间计算,通过强制提前终止模型的思考过程,或在s1推理时多次追加"等待"指令以延长思考,从而优化性能。 研究显示,新模型s1-32B在使用该技术后,性能与测试时的计算资源成正相关。 性能媲美顶级模型,引发行业关注和担忧 根据研究团队的测试结果可知,在竞赛数学问题上,s1-32B的表现较o1-preview高27%(MATH和AIME24);且该模型在AIME24上的表现几乎与Gemini 2.0 Thinking API相当,显示其蒸馏过程是有效的。 而s1的出现也引发了行业的担忧。此前,OpenAI曾指控DeepSeek不当使用其API数据进行蒸馏。 有分析人士质疑,如果任何人都可以轻易复制和超越现有的顶级模型,那么大型AI公司多年的研发投入和技术积累可能会受到威胁。而且,尽管蒸馏技术在以较低成本复现AI模型方面表现出色,但其对新AI模型性能的提升效果并不显著。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 普京称俄同意停火30天、俄美协议或重振俄天然气供..
- 美国政府关门危机解除?民主党领袖:关门只会让特..
- 摩根大通:美股这波跌势“到位了”,接下来大概率..
- 500亿量化帝国“幕后推手”:龙头券商财富业务“..
- 特朗普再度扬言“夺岛”,称:要派更多美军到格陵..
- 小金属狂潮——全球资源国觉醒及贸易摩擦下的看涨..
- 叛军突袭逼停万吨锡矿,刚果矿场紧急撤离!沪锡今..
- A股头条:央行发声!择机降准降息;育儿补贴真的..
- 关税威胁加剧,标普跌入调整区间,纳指跌近2%,英..
- 普京表态支持俄乌停火提议但诸多细节仍待商讨,泽..
- 突破3000美元/盎司!金价狂飙,产业链上演“冰火..
- 美财长贝森特:市场“些微”波动不足为虑,“排毒..
- 美股三大指数重挫!标普陷入技术回调,黄金突破3..
- 融资余额刷新2015年历史峰值,连续三日破1.9万亿..
- 南下资金疯狂,跨境ETF份额大涨
热点阅读
- 特斯拉全球销量“雪崩”,马斯克的“政治豪赌”让..
- 实探Manus总部,真“颠覆”还是假“狂欢”?..
- 段永平谈美股暴跌:投资以来第一次享受空仓的快感..
- 蛇年最疯“妖股”崩了?谁是空头王..
- 桥水中国:如果没有重大改革催化剂,欧洲资产持续..
- 美联储“重大预告”
- “制造衰退”?特朗普和贝森特几乎“明牌”了,下..
- 央行等五部门:支持民营企业通过资本市场发展壮大..
- 李嘉诚228亿美元交易的幕后……
- A股头条:华为正式组建医疗卫生军团,曾毓群出手..
- 突破3000美元/盎司!金价狂飙,产业链上演“冰火..
- AI芯片需求依旧坚挺!台积电2月营收再加速,同比..
- 不惜一切代价!大幅增加军费和基建投资,德国的“..
- Manus刷屏!全球首个AI Agent,中国制造,它能直..
- 中国驻美大使谢锋:“外资撤离中国论”宣告破产 ..