Lex Fridman 播客节选:DeepSeek 到底用了多少张显卡训练?
gentle @ 2025年02月09日 世界观
| 在本期 Lex Fridman 播客中,嘉宾深入探讨了中国对冲基金幻方及其 AI 子公司 DeepSeek 的发展历程。幻方历史上专注于量化交易,拥有大量 GPU 资源。早在 2021 年,他们宣布拥有中国首个由 10,000 张 A100 GPU 组成的集群。这些资源不仅用于交易,还用于训练大型语言模型等 AI 项目。 DeepSeek 的 CEO 梁文锋被视为中国的 AI 先锋,致力于推动中国在 AI 生态系统中的领先地位。截至目前,DeepSeek 拥有约 50,000 张 GPU,分布于对冲基金运营、AI 研究和模型训练等多个领域。在最新的 V3 模型训练中,他们使用了 2,000 张 H800 GPU,展示了在资源优化和 AI 研发方面的卓越能力。 揭示了幻方和 DeepSeek 在 AI 领域的战略布局,以及他们如何利用现有资源推动技术创新。 bogolyx:总结:觉得这个采访很中肯。 1.他们放的梁的照片还是错误的吧? 2.他们猜测整个幻方有5万张卡。(感觉还是准的。但是比起其他的MEta等还是少了,而且人家真的还要用在对冲基金上的) 吃成胖子子:量化基金,不是对冲基金 (视频) |
热点阅读
- 刘烨 + 胡军《蓝宇》4K 数字修复片段..
- 1987年,全国首届健美大赛,女子身穿比基尼..
- 遵义的六毛网吧
- 《性教育》第三季发布正式预告
- 我们小时候做错到离谱的题,都被AI具像化了..
- 希拉里就爱泼斯坦案接受美国国会闭门质询后的演讲..
- 10月11日,拜登接受CNN记者塔珀专访..
- 民族主义只教会了你,去恨你见都沒见过的人..
- 花6万请月嫂被感染幽门螺旋杆菌 月子会所:是不是..
- 睿智歌曲:方舱医院真神奇
- NHK纪录片《膨胀的欲望 :互联网金融的光与影 20..
- 四川话配音:猩猩喝水
- @我是郭杰瑞:实拍美国抗议现场,街访纽约示威者!..
- 中国福建籍死囚挖洞越狱仍在逃:系跨国贩毒头目,..
- 蓬松哥Fluffy疯狂吐槽卫生间里的感应装置..
![[二哈] [二哈]](https://face.t.sinajs.cn/t4/appstyle/expression/ext/normal/22/2018new_erha_org.png)