又一个媲美o1的“开源推理模型”来了!训练成本竟然不到450美元
taiyang @ 2025年01月13日 财经风云
又一个媲美o1的"开源推理模型"来了!训练成本竟然不到450美元 蒋紫涵 开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky团队利用阿里巴巴的QwQ-32B-Preview模型生成了初始训练数据,随后"整理"数据混合,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式,最终形成了可用的训练集。 低成本训练人工智能推理模型的时代到来了? 近日,加州大学伯克利分校Sky Computing Lab的研究团队NovaSky发布了一个名为Sky-T1-32B-Preview的开源人工智能推理模型,这一模型在多项关键基准测试中表现出与OpenAI早期o1版本相当的水平,更令人瞩目的是,其开发成本仅为450美元! 相较于不久前动辄数百万美元的模型开发费用,Sky-T1-32B-Preview可谓是一个巨大的进步。NovaSky团队在博客文章中表示: "Sky-T1-32B-Preview的训练成本不到450美元,这证明了以低成本、高效率复制高级推理能力是可行的。" 那么,为什么NovaSky团队能大幅降低训练成本? 根据NovaSky团队的报告,开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky团队利用阿里巴巴的QwQ-32B-Preview模型,生成了Sky-T1-32B-Preview的初始训练数据,随后"整理"数据混合,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式,最终形成了可用的训练集。使用8个Nvidia H100 GPU机架训练320亿参数的Sky-T1-32B-Preview模型,大约需要19个小时。 报告还提到,Sky-T1-32B-Preview在MATH500(一套竞赛级数学挑战题)和LiveCodeBench(一个编程评估集)的部分难题上,表现优于o1的早期预览版;在GPQA-Diamond(包含PhD级别的物理、生物和化学问题)测试中,Sky-T1-32B-Preview1的表现略逊于o1预览版。 不过需要注意的是,OpenAI正式发布的o1版本性能更强,且预计将在未来几周内推出更先进的o3模型。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 商务部重拳制裁基因测序巨头,国产基因测序迎黄金..
- DeepSeek与AI烧钱大战--赢家的诅咒!
- 成本仅50美元,性能媲美Deepseek-R1,李飞飞带着..
- 中国主导身体,英伟达要做大脑,特斯拉“做整合”..
- 中国央行连续第三个月增持黄金,1月黄金储备环比..
- 亚马逊电话会:AI是“千载难逢”的商业机会,202..
- 特斯拉正式招聘工程师等岗位,为量产机器人做准备..
- 突发利空!特朗普:将压低油价,“接管”加沙!原..
- 做好金融“五篇大文章”,证监会发布资本市场实施..
- 鲍威尔下周赴国会作证,降息将成焦点..
- 美媒称美国下周公布结束俄乌冲突计划,俄方:正在..
- 今晚,“历史性修订”的非农,对市场意味着什么?..
- DeepSeek研究员在线爆料:R1训练仅用两到三周,春..
- 特朗普“政府瘦身”大计蔓延至情报机构 中情局提..
- 谷歌预计今年资本开支高达750亿美元,远超市场预..
热点阅读
- 注意!2月5日起国内航线燃油附加费全面上调,出行..
- 交易所春节休市安排公布:A股除夕休市,大年初八..
- 马斯克动手了!DOGE要全面控制美国政府?..
- 科技股拖累美股涨势暂歇,中概、人民币大涨,特朗..
- AI巨变就在未来2,3年了,这位大佬说的很清楚了:..
- 春节后A股将会如何演绎?以史为鉴这四大行业上涨..
- 跌宕起伏的一周,尽管英伟达被重创,美股Mag 7整..
- 开启全面贸易战?特朗普“新开战线”:最早于2月..
- 创造历史!DeepSeek超越ChatGPT登顶中美AppStore..
- AI已经越过红线?复旦大学研究表明:在知道自己将..
- 贸易战爆发!报复美国征税,加拿大将对1550亿加元..
- DeepSeek研究员在线爆料:R1训练仅用两到三周,春..
- 美股芯片股大涨,台积电ADR涨近2.5%至新高,Arm控..
- 2025年银行股还能再涨吗?
- 川普2.0最佳资产?金价迎来十年来最强的一月..