又一个媲美o1的“开源推理模型”来了!训练成本竟然不到450美元
taiyang @ 2025年01月13日 财经风云
| 又一个媲美o1的"开源推理模型"来了!训练成本竟然不到450美元 蒋紫涵 开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky团队利用阿里巴巴的QwQ-32B-Preview模型生成了初始训练数据,随后"整理"数据混合,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式,最终形成了可用的训练集。 低成本训练人工智能推理模型的时代到来了? 近日,加州大学伯克利分校Sky Computing Lab的研究团队NovaSky发布了一个名为Sky-T1-32B-Preview的开源人工智能推理模型,这一模型在多项关键基准测试中表现出与OpenAI早期o1版本相当的水平,更令人瞩目的是,其开发成本仅为450美元! 相较于不久前动辄数百万美元的模型开发费用,Sky-T1-32B-Preview可谓是一个巨大的进步。NovaSky团队在博客文章中表示: "Sky-T1-32B-Preview的训练成本不到450美元,这证明了以低成本、高效率复制高级推理能力是可行的。" 那么,为什么NovaSky团队能大幅降低训练成本? 根据NovaSky团队的报告,开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky团队利用阿里巴巴的QwQ-32B-Preview模型,生成了Sky-T1-32B-Preview的初始训练数据,随后"整理"数据混合,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式,最终形成了可用的训练集。使用8个Nvidia H100 GPU机架训练320亿参数的Sky-T1-32B-Preview模型,大约需要19个小时。 报告还提到,Sky-T1-32B-Preview在MATH500(一套竞赛级数学挑战题)和LiveCodeBench(一个编程评估集)的部分难题上,表现优于o1的早期预览版;在GPQA-Diamond(包含PhD级别的物理、生物和化学问题)测试中,Sky-T1-32B-Preview1的表现略逊于o1预览版。 不过需要注意的是,OpenAI正式发布的o1版本性能更强,且预计将在未来几周内推出更先进的o3模型。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
相关内容
-
暂无...
推荐内容
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 特朗普“大重置”:债务化解、脱虚向实、美元贬值..
- 美股三大指数冲高回落,中概股重挫,纳斯达克中国..
- 深夜,重挫!近一个月最大跌幅;鸿蒙智行,连推爆..
- 活久见!美国商务部长上电视“推票”:买特斯拉股..
- 华尔街解读美联储决议:鸽派的亮点与迷你“鲍威尔..
- 深海经济利好持续加码,与商业航天、低空经济并列..
- 美联储的“关键一战”在5月,届时降不了息,那今..
- 李嘉诚押注创新药!和黄医药明星抗癌药海外大卖近..
- “三巫日”前美股反弹一日游,量子计算股暴跌,拼..
- 鲍威尔给经济焦虑“灭火”,标普创八个月来美联储..
- 腾讯要为AI砸千亿重金
- 政治危机升级,反对派领袖被捕引发土耳其股债汇三..
- 3月LPR报价出炉!1年期、5年期均维持不变..
- 五部门:依法稳步推进绿证强制消费,逐步提高绿色..
热点阅读
- 比特币一度涨穿6.9万美元创历史新高,此后大幅回..
- 以史为鉴,A股史上第一牛股竟是它,涨了274倍!..
- AIGC概念指数创新高!多只主题基金出手,开始限大..
- 利率飙升,资金撤离!美债抛售潮正向美国信贷市场..
- 拉美多国持续加息 大宗商品价格回落 经济不确定性..
- 国家医保局:引导种植牙牙冠形成合理价格 组建种..
- 国务院国资委:将出台新版授权放权清单..
- 监管人士:“一二五”是方向性目标,信贷标准没放..
- 击鼓传鞋,你敢接吗?央行上海分行警示炒鞋风险..
- 沙特:正在“密切监控”新型冠状病毒对原油市场影..
- 一季度IPO盘点: 上交所跃升全球上市地首位 港股..
- LPR未调整意料之中 6月“降息”空间有多大..
- 美国商务部:本周五起对33家中国机构实行限制措施..
- 北上资金调仓迹象明显银行股成重点加仓方向..
- 史上最严!“双减”文件说了什么?..