Lex Fridman 播客节选:DeepSeek 到底用了多少张显卡训练?
gentle @ 2025年02月09日 世界观
| 在本期 Lex Fridman 播客中,嘉宾深入探讨了中国对冲基金幻方及其 AI 子公司 DeepSeek 的发展历程。幻方历史上专注于量化交易,拥有大量 GPU 资源。早在 2021 年,他们宣布拥有中国首个由 10,000 张 A100 GPU 组成的集群。这些资源不仅用于交易,还用于训练大型语言模型等 AI 项目。 DeepSeek 的 CEO 梁文锋被视为中国的 AI 先锋,致力于推动中国在 AI 生态系统中的领先地位。截至目前,DeepSeek 拥有约 50,000 张 GPU,分布于对冲基金运营、AI 研究和模型训练等多个领域。在最新的 V3 模型训练中,他们使用了 2,000 张 H800 GPU,展示了在资源优化和 AI 研发方面的卓越能力。 揭示了幻方和 DeepSeek 在 AI 领域的战略布局,以及他们如何利用现有资源推动技术创新。 bogolyx:总结:觉得这个采访很中肯。 1.他们放的梁的照片还是错误的吧? 2.他们猜测整个幻方有5万张卡。(感觉还是准的。但是比起其他的MEta等还是少了,而且人家真的还要用在对冲基金上的) 吃成胖子子:量化基金,不是对冲基金 (视频) |
推荐内容
- 国宴上真的给川川演奏了Y.M.C.A
- 20个国家的104名跳伞者,拼出来的全新伞阵世界纪..
- A-Lin黄丽玲担任37届金曲奖的主持人影片来了..
- 黄仁勋在人民大会堂短暂回答记者提问..
- 马斯克与儿子X Æ A-12在人民大会堂
- 过去几年保时捷激发了高度统一的中国汽车设计审美..
- 白宫在社交媒体平台发布特朗普抵京视频..
- 电工小谢
- 李安:孝顺是一种很过时的观念
- 宇树G1机器人展示医疗照顾和家务工作场景..
- 白宫晚宴枪击发生后,有人趁乱偷酒..
- 全球首个由 AI 主讲的 TED 演讲
- 戛纳获奖导演用 AI 拍了部 22 分钟的恐怖动作短片..
- 黄仁勋:人工智能会摧毁就业的说法为什么是错的..
- 蔡磊新药让29 岁渐冻症女孩重迈脚步..
热点阅读
- 10月11日,拜登接受CNN记者塔珀专访..
- 武汉新型肺炎的潜伏期
- 张雪峰开导抑郁女孩这段值得反复听,他太理解现在..
- 潜入水底,忘记呼吸
- 李稻葵:要把改革开放四十年经验写进美国教科书..
- 《超级全能住宅改造王》物件139:6人共用6坪的家..
- 27岁小伙从世界500强辞职回家考公务员:加班和房..
- 白宫晚宴枪击发生后,有人趁乱偷酒..
- 李安:孝顺是一种很过时的观念
- 女子随手带走飞机餐中的免费苹果,被罚500美元取..
- 马云力荐《绿皮书》: 好电影不是靠钱堆出来的 已..
- 强大的彝族习惯法(奴隶制),这真是某些人的愿望..
- 疫苗之殇
- 马云:数字经济将远远超越电子商务,中国需要一部..
- 一部纪录片揭露残酷真相:父母越不努力,孩子越没..
![[二哈] [二哈]](https://face.t.sinajs.cn/t4/appstyle/expression/ext/normal/22/2018new_erha_org.png)