成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了
zhonghua @ 2025年02月08日 财经风云
成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了 黄雯雯 AI的推理效率被大幅提高,s1在数学和编码能力测试中与OpenAI的o1和DeepSeek的R1等模型的表现不相上下。在通往AGI的路上,更高效的新方法带来了更多的创新可能。 在DeepSeek火爆全球之际,一个更低成本的AI推理模型悄然登场... 近日,一项来自斯坦福大学和华盛顿大学等机构的研究成果引起了市场关注,李飞飞等人以不到50美元的云计算费用成功训练出了一个名为s1的AI推理模型。研究成果表明,s1在数学和编码能力测试中与OpenAI的o1和DeepSeek的R1等模型的表现不相上下。 s1论文作者Niklas Muennighoff表示: "DeepSeek r1令人兴奋,但缺少OpenAI的测试时间扩展图,并且需要大量数据。我们推出了s1,仅使用1K样本和简单的测试时间干预即可重现o1的预览扩展和性能。" 简单高效的训练方法,挑战传统AI研发模式 s1的研究团队表示,s1模型是以谷歌推理模型Gemini2.0 Flash Thinking Experimental为基础模型,通过蒸馏法提炼出来的。 他们采用了一种名为test-time scaling的方法。研究团队构建了一个小型数据集s1K,通过难度、多样性和质量三个标准来筛选,其中包括1000个经过精心挑选的问题以及相应答案,并附上了"推理"过程,仅使用了16台英伟达H100 GPU,耗时26分钟就完成了训练。 这种方法与传统的大规模强化学习方法(RL)形成鲜明对比,后者的成本通常较高,DeepSeek、OpenAI都采用了这种方法。而s1的研究通过较小的数据集和监督微调(SFT)蒸馏推理模型,大大降低了训练成本并提高了效率。 此外,为了提高答案的准确度,研究团队还运用了一种"预算强制"技术,可以控制测试时间计算,通过强制提前终止模型的思考过程,或在s1推理时多次追加"等待"指令以延长思考,从而优化性能。 研究显示,新模型s1-32B在使用该技术后,性能与测试时的计算资源成正相关。 性能媲美顶级模型,引发行业关注和担忧 根据研究团队的测试结果可知,在竞赛数学问题上,s1-32B的表现较o1-preview高27%(MATH和AIME24);且该模型在AIME24上的表现几乎与Gemini 2.0 Thinking API相当,显示其蒸馏过程是有效的。 而s1的出现也引发了行业的担忧。此前,OpenAI曾指控DeepSeek不当使用其API数据进行蒸馏。 有分析人士质疑,如果任何人都可以轻易复制和超越现有的顶级模型,那么大型AI公司多年的研发投入和技术积累可能会受到威胁。而且,尽管蒸馏技术在以较低成本复现AI模型方面表现出色,但其对新AI模型性能的提升效果并不显著。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
相关内容
-
暂无...
推荐内容
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 特朗普“大重置”:债务化解、脱虚向实、美元贬值..
- 美股三大指数冲高回落,中概股重挫,纳斯达克中国..
- 深夜,重挫!近一个月最大跌幅;鸿蒙智行,连推爆..
- 活久见!美国商务部长上电视“推票”:买特斯拉股..
- 华尔街解读美联储决议:鸽派的亮点与迷你“鲍威尔..
- 深海经济利好持续加码,与商业航天、低空经济并列..
- 美联储的“关键一战”在5月,届时降不了息,那今..
- 李嘉诚押注创新药!和黄医药明星抗癌药海外大卖近..
- “三巫日”前美股反弹一日游,量子计算股暴跌,拼..
- 鲍威尔给经济焦虑“灭火”,标普创八个月来美联储..
- 腾讯要为AI砸千亿重金
- 政治危机升级,反对派领袖被捕引发土耳其股债汇三..
- 3月LPR报价出炉!1年期、5年期均维持不变..
- 五部门:依法稳步推进绿证强制消费,逐步提高绿色..
热点阅读
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 90年代日本应届生职场启示录:一步踏空,步步落后..
- 大摩看印股今年涨18%的三大理由:经济、盈利、散..
- 多股涨停,国产GPU回春?国产GPU集体奔赴A股,25..
- 中国险资试点投黄金,怎么看?
- 刷新纪录!认购1万获配12.29元,近1300亿资金疯抢..
- 蜜雪冰城“杀”疯了!总市值超千亿港元,32倍奈雪..
- 美国量化基金知多少?
- 融资余额刷新2015年历史峰值,连续三日破1.9万亿..
- 如何看AH和美股科技回调——美股七巨头牛市调整复..
- 到底什么是“海湖庄园协议”?
- 大宗商品强势上冲!铜铝带头上涨 豆粕与A股猪产业..
- 量化私募迎来“至暗时刻”:巨头“刀口舔血”被罚..
- 莫迪的“经济大饼”:印度2047年成为发达国家..
- ASIC火爆,科技巨头角逐3纳米项目!大摩:台积电..