“大模型的安卓”也不好过,Meta内部“算力宫斗”,一半Llama核心团队已离职!
gangqin @ 2023年09月07日 财经风云
"大模型的安卓"也不好过,Meta内部"算力宫斗",一半Llama核心团队已离职! 常嘉帅 Meta是市场上最出色的开源大模型提供方,但据报道,该公司内部存在混乱和内斗,许多工程师和科学家已经离职,主要原因是Meta内部团队之间在算力分配上存在分歧。 在过去半年的AI混战里,提供免费开源大模型的Meta,成了与眼里只有生意的谷歌、微软&OpenAI截然相反的平民英雄。 然而,尽管凭借Llama,Meta已经拿下了"大模型里的安卓"的名头,但据科技媒体The Information报道,团队内部实际上充满了混乱和内斗,许多参与开发的工程师和科学家都已经离职。知情人士表示,2月份发表的Llama原始研究论文的14位作者中,有一半以上已经离开了公司,有几位去了人工智能初创公司或其他大公司。 算力宫斗 导致Meta内斗的主因,是算力。 以图灵奖得主Yann LeCun为首的The Fundamental AI Research (FAIR) 实验室,主导着Meta的AI研究和开发。FAIR在加州、纽约、巴黎、伦敦等地都有分支机构,但各地实验室之间缺乏统筹,甚至可以称得上山头林立。 例如,2022年5月,一个主要位于美国的FAIR团队发布OPT-175B,对标OpenAI的GPT-3,据称能耗比GPT更低,这个团队也在开发对标谷歌PaLM、参数量级更大的模型。 与此同时,FAIR巴黎团队也在开发他们的大模型——即Llama,后者的参数比OPT要小,因为巴黎团队相信,小模型在推理方面效率更高。 多线并进没有给Meta带来好结果。英伟达的算力供给昂贵而有限,即使是Meta,也没有足够的GPU满足两个团队同时推进。 两位直接知情人士对The Information表示,由于Meta的GPU资源不足,巴黎团队和美国团队关系变得越来越紧张。据知情人士透露,巴黎团队获得的算力配额比美国团队要少。 FAIR负责人Joelle Pineau对The Information表示,算力分配是由多部门的中层领导每月开一次会来决定的,主要考虑的是组织的优先级,以及项目发布日期。如果员工们对算力分配有异议,需要层层上报等Pineau来定夺。 在采访中,Pineau承认Llama与OPT各自的开发团队在这个问题上"有些紧张"。 据The Information了解,许多研究人员实际上都不理解FAIR为什么要采取多线并进的方式。两个团队都在做大模型,看起来似乎是在鼓励内部竞争。 内斗再加上Meta去年底的大裁员和公司组织调整,Llama和OPT的开发团队都出现了士气问题,多位关键研究人员选择离职加入其他大科技公司或AI初创企业。 直到今年2月份,FAIR终于把两家人马收拢到一起,全力开发Llama2,而OPT模型则被彻底放弃。原因倒不在于Llama比OPT出色,而是因为没人了——5月份OPT论文的19位作者中,已经有一半离开了Meta。 商业化转向提速 FAIR未来命运存疑 从去年11月开始,Meta CEO 扎克伯格开始在全公司范围内进行裁员,FAIR也未能幸免。 此外,今年2月,Meta成立了一个新团队,专注于自家App开发AI功能。新团队由苹果前高管Ahmad Al-Dahle负责,从FAIR吸纳了大量人员。据Pineau称,其中包括开发Llama 2的团队。 更重要的是,AI热潮之下,FAIR所肩负的使命也发生了微妙的变化。之前,它和OpenAI一样,是一个由研究人员领导的学术研究机构,以人工智能领域技术攻坚为核心使命。但扎克伯格后来愈发希望加速令AI技术商业化。 即使有了Llama 2后来的大获成功,也没有改变FAIR的命运。开源模型变成了Meta打造声誉、吸引用户、创造营收的有力工具。 在上半年Llama 2爆红,AI研究人员纷纷对其进行魔改之际,扎克伯格就已经开始憧憬,随着开发者对模型的改进,他可以进一步把AI融入广告和消费产品中。未来,像OpenAI一样背负商业化压力,可能是FAIR必然的道路。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
相关内容
-
暂无...
推荐内容
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 特朗普“大重置”:债务化解、脱虚向实、美元贬值..
- 美股三大指数冲高回落,中概股重挫,纳斯达克中国..
- 深夜,重挫!近一个月最大跌幅;鸿蒙智行,连推爆..
- 活久见!美国商务部长上电视“推票”:买特斯拉股..
- 华尔街解读美联储决议:鸽派的亮点与迷你“鲍威尔..
- 深海经济利好持续加码,与商业航天、低空经济并列..
- 美联储的“关键一战”在5月,届时降不了息,那今..
- 李嘉诚押注创新药!和黄医药明星抗癌药海外大卖近..
- “三巫日”前美股反弹一日游,量子计算股暴跌,拼..
- 鲍威尔给经济焦虑“灭火”,标普创八个月来美联储..
- 腾讯要为AI砸千亿重金
- 政治危机升级,反对派领袖被捕引发土耳其股债汇三..
- 3月LPR报价出炉!1年期、5年期均维持不变..
- 五部门:依法稳步推进绿证强制消费,逐步提高绿色..
热点阅读
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 政府工作报告:2025年GDP增长目标5%左右,CPI涨幅..
- 大摩看印股今年涨18%的三大理由:经济、盈利、散..
- 500亿量化帝国“幕后推手”:龙头券商财富业务“..
- 国家统计局:2024年GDP为1349084亿元,比上年增长..
- 理财人的至暗时刻:资产荒的资产荒,钱荒的钱荒..
- 历史性一刻!顶级域名ai.com重定向到DeepSeek官网..
- 社保基金投资路线图曝光,重仓96家公司持股市值超..
- 中芯国际18天闪电过会 拟募资200亿创科创板之最..
- 2022年百大牛股画像
- 细看各地两会报告,化债、债务调配……..
- 中央经济工作会议在北京举行
- DeepSeek发布后的美国科技投资八大预测..
- 一线城市购房“休假模式”会向三线、四线蔓延吗?..
- 暴风危机还没完光大证券又出事 接连踩雷康美、华..