Lex Fridman 播客节选:DeepSeek 到底用了多少张显卡训练?
gentle @ 2025年02月09日 世界观
在本期 Lex Fridman 播客中,嘉宾深入探讨了中国对冲基金幻方及其 AI 子公司 DeepSeek 的发展历程。幻方历史上专注于量化交易,拥有大量 GPU 资源。早在 2021 年,他们宣布拥有中国首个由 10,000 张 A100 GPU 组成的集群。这些资源不仅用于交易,还用于训练大型语言模型等 AI 项目。 DeepSeek 的 CEO 梁文锋被视为中国的 AI 先锋,致力于推动中国在 AI 生态系统中的领先地位。截至目前,DeepSeek 拥有约 50,000 张 GPU,分布于对冲基金运营、AI 研究和模型训练等多个领域。在最新的 V3 模型训练中,他们使用了 2,000 张 H800 GPU,展示了在资源优化和 AI 研发方面的卓越能力。 揭示了幻方和 DeepSeek 在 AI 领域的战略布局,以及他们如何利用现有资源推动技术创新。 bogolyx:总结:觉得这个采访很中肯。 1.他们放的梁的照片还是错误的吧? 2.他们猜测整个幻方有5万张卡。(感觉还是准的。但是比起其他的MEta等还是少了,而且人家真的还要用在对冲基金上的) 吃成胖子子:量化基金,不是对冲基金 (视频) |
推荐内容
- Genie 3 能从文字或图片即时生成可玩的 3D 互动世..
- 从mtDNA看人类迁徙 (2021) 水山汉化
- 你敢把命交给车吗?|懂车智炼场
- 谷歌DeepMind CEO 哈萨比斯2小时播客深度访谈..
- 天工开物:B-2幽灵式轰炸机 (2024)
- 哈佛校长2025年毕业典礼致辞
- 美国障碍闯关真人秀上,一名女高中生创下最速通关..
- 有人用谷歌Veo3创作了《提示词创世论》..
- 查尔斯国王是如何从手下败将逆袭成“狗子王”!..
- 瑞士一家公司推出的家务机器人Loki..
- 阿联酋人迎接特朗普的特别方式:摇头舞..
- “你一定听过我的声音”里最权威的一集..
- 小囧秀:特朗普与驱逐
- 哈里斯卸任后首次公开演讲
- 希拉里当年竞选总统时,狂喷特朗普半小时..
热点阅读
- 刘烨 + 胡军《蓝宇》4K 数字修复片段..
- 这个靠拐卖妇女“发家致富”的村庄,曾有着中国最..
- Genie 3 能从文字或图片即时生成可玩的 3D 互动世..
- 1963年黑白版本的铁臂阿童木TV
- 谷歌DeepMind CEO 哈萨比斯2小时播客深度访谈..
- 用AI生成世界名画《蒙娜丽莎》创作前后的画面..
- 弹出式、隐藏式前照灯汽车,这一堆钢铁睁眼的瞬间..
- Lex Fridman 播客节选:DeepSeek 到底用了多少张..
- 这个视频进到我的脑子里需要加关税!!!..
- 罗翔:女性故意报复男性?性侵犯罪是一种高诬陷率..
- 哪吒3之《魔童大战好莱坞》
- 李永乐老师:《皇帝的新装》
- 歌者:《范进中举》
- 特鲁多称加拿大被美国侮辱了很生气..
- 鲁比奥这段话已经明确了:俄乌战争终究和美国无关..