AI iPhone前奏?苹果发表论文,解决“在手机内存上运行大模型”
laodang @ 2023年12月21日 财经风云
AI iPhone前奏?苹果发表论文,解决"在手机内存上运行大模型" 李笑寅 这项新研究支持有限容量的设备运行内存2倍大小的LLM,GPU的推理速度可以提升数十倍。媒体称,苹果将生成式AI集成到iOS 18的计划或将加快推进。 AI iPhone要来了? 据媒体报道,近日,苹果发布了一篇论文,介绍了一种可以再超出可用DRAM容量的设备上运行LLM(大语言模型)的方法。 通过大幅提高内存使用效率,这项新研究支持有限容量的设备运行内存2倍大小的LLM,GPU的推理速度可以提升数十倍。 论文称,LLM密集的计算量和内存要求对于DRAM容量来说是一大挑战,该论文构建了一个以闪存为基础的推理成本模型,将在两个关键领域进行优化:减少从闪存中传输的数据量、更多更流畅地读取数据块。 这意味着,该项突破性研究扩大了LLM适用性和可及性,苹果将生成式AI集成到iOS 18的计划或将加快推进。 LLM能在手机上运行了? 一般来说,DRAM就是我们常说的"内存",而flash(闪存)指的是硬盘。 运算数据时,CPU通常会以DRAM为"中间桥梁",把硬盘中的数据复制到内存中来,再在内存中做数据处理,这样速度可以提升至数百万倍。 但在容量上,DRAM相较于硬盘要小一个数量级。而LLM运行时,需要同时处理的数据量庞大,对容量有限的设备来说构成了极大的挑战。 但这篇论文提出的新框架似乎发现了突破点。该框架旨在将模型参数存储在闪存中,在需要的时候再将数据调入DRAM,解决了LLM运行时数据处理量超过DRAM可用容量的的难题。 具体而言,苹果主要运用了两种技术: (1)"窗口化"技术:重复使用此前激活过的神经元,以此减少数据传输; (2)"行列捆绑"技术:针对闪存的数据特征,定制访问数据块的顺序,从而增加从闪存读取的数据块大小。 论文提及,一个70亿参数的模型就需要超过14GB的内存来加载半精度浮点格式的参数,超过了大多数网络端点的承受能力。但是通过该框架,能够实现最小化数据传输并最大化闪存吞吐量,从而减少数据负载、提高内存使用效率。 研究结果显示,与传统的加载方法相比,该框架支持DRAM两倍大小的模型,在CPU和GPU中推理速度可分别提升4-5倍、20-25倍。研究团队在文末总结道: "这项突破性技术对于在资源有限的环境中部署先进的LLM尤为重要,从而扩大LLM适用性和可及性。" 手机巨头们瞄准了AI 在AI潮下,各大手机制造纷纷开始布局"人工智能+手机"。 据此前市场消息,苹果将在其iOS 18中引入AI,主要用于Siri和通讯应用程序的智能问答、生成语句等功能,此外,苹果还在探索AI在Apple Music、Page、Keynote和Xcode等应用中的潜能。 三星于11月初推出其生成式AI模型Samsung Gauss,报道称该模型将纳入即将于2024年初发布的Galaxy S24系列手机中,三星旗下笔记本电脑、平板电脑也有可能集成该模型。 谷歌的双子星大模型(Gemini)也将集成到谷歌旗下产品,11月,谷歌官宣Gemini1.0将在谷歌产品中逐步推出;Gemini Pro将集成到Bard中以进行高级推理和规划;Gemini Nano将为Pixel 8 Pro智能手机的功能提供支持。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
相关内容
-
暂无...
推荐内容
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 特朗普“大重置”:债务化解、脱虚向实、美元贬值..
- 美股三大指数冲高回落,中概股重挫,纳斯达克中国..
- 深夜,重挫!近一个月最大跌幅;鸿蒙智行,连推爆..
- 活久见!美国商务部长上电视“推票”:买特斯拉股..
- 华尔街解读美联储决议:鸽派的亮点与迷你“鲍威尔..
- 深海经济利好持续加码,与商业航天、低空经济并列..
- 美联储的“关键一战”在5月,届时降不了息,那今..
- 李嘉诚押注创新药!和黄医药明星抗癌药海外大卖近..
- “三巫日”前美股反弹一日游,量子计算股暴跌,拼..
- 鲍威尔给经济焦虑“灭火”,标普创八个月来美联储..
- 腾讯要为AI砸千亿重金
- 政治危机升级,反对派领袖被捕引发土耳其股债汇三..
- 3月LPR报价出炉!1年期、5年期均维持不变..
- 五部门:依法稳步推进绿证强制消费,逐步提高绿色..
热点阅读
- “商品旗手”高盛:三大驱动力刺激,铜或迎来新一..
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 500亿量化帝国“幕后推手”:龙头券商财富业务“..
- 特朗普、泽连斯基与北约动态交织,A股军工股掀涨..
- AI驱动商业化加速,2025智驾拐点正在到来..
- 国家统计局:2024年GDP为1349084亿元,比上年增长..
- Cliff Asness:这是一封写在2035年的十年资产配置..
- 超千家公司将被ST?真实数据来了,66股符合ST新规..
- 历史上的“货币化安置”,拉动了多少投资?..
- 大摩看印股今年涨18%的三大理由:经济、盈利、散..
- A股荒唐一幕!前三季度收入仅1.85亿元 总市值却超..
- 比特币暴跌,发生了什么?
- 美国量化基金知多少?
- 小金属狂潮——全球资源国觉醒及贸易摩擦下的看涨..
- 人民币为何走弱?如何理解央行“稳汇率”?..