数学界的AlphaGo时刻:谷歌DeepMind AI 19秒解 IMO几何题,仅差1分即可摘金牌
taiyang @ 2024年07月27日 财经风云
数学界的AlphaGo时刻:谷歌DeepMind AI 19秒解 IMO几何题,仅差1分即可摘金牌 AI寒武纪 IMO被视为衡量人工智能系统高级数学推理能力的标杆,而谷歌DeepMind是第一个以银牌级别解决国际数学奥林匹克问题的人工智能。 高级数学推理是现代人工智能的关键能力。今天,Google宣布了一项长期重大挑战中的一个重要里程碑:Google混合人工智能系统在今年的国际数学奥林匹克竞赛(IMO)中获得了相当于银牌的成绩 具体来说google展示了第一个以银牌级别解决国际数学奥林匹克问题的人工智能 它结合了 AlphaProof(一种新的突破性形式推理模型)和 AlphaGeometry 2(之前系统的改进版本) 国际数学奥林匹克竞赛是全球最悠久、规模最大、最具声望的青年数学家比赛,自1959年起每年举办一次。参赛者需要解决六道涉及代数、组合学、几何和数论的极其困难的问题。许多菲尔兹奖得主曾在青年时期代表国家参加过IMO。近年来,IMO也成为了机器学习领域的一个重要挑战,被视为衡量人工智能系统高级数学推理能力的标杆 在今年的比赛中,DeepMind的AI系统获得了28分(满分42分),相当于银牌获得者的水平。这一成绩仅差1分就能达到金牌标准,而在今年的609名参赛者中,只有58人获得了金牌 AlphaProof:形式化数学推理的突破 AlphaProof系统采用强化学习方法,将预训练的语言模型与AlphaZero算法相结合。这种方法的优势在于可以正式验证涉及数学推理的证明的正确性。为了克服形式化语言训练数据不足的问题,研究团队通过微调Gemini模型,创建了一个包含各种难度的形式化问题库 AlphaProof是一个自学习系统,专门用于在形式化数学语言Lean中证明数学陈述。它的核心创新在于结合了预训练语言模型和AlphaZero强化学习算法 工作流程如下: 1.问题转化:首先,使用经过微调的Gemini模型将自然语言的数学问题自动转换为Lean的形式化语言。这一步骤创建了一个大型的形式化问题库,涵盖不同难度级别 2.解决方案生成:面对一个新问题时,AlphaProof会生成可能的解决方案 3.证明搜索:系统在Lean中搜索可能的证明步骤,试图证明或反驳这些解决方案 4.强化学习:每找到并验证一个证明,就用它来强化AlphaProof的语言模型,提高系统解决后续更具挑战性问题的能力 5.持续训练:在准备IMO比赛期间,AlphaProof在数周内证明或反驳了数百万个问题,覆盖各种难度和数学主题。在比赛过程中,它还继续应用这个训练循环,通过证明自己生成的比赛问题变体来增强能力,直到找到完整解决方案 AlphaGeometry 2 AlphaGeometry 2是AlphaGeometry的改进版本,它的语言模型基于Gemini,并在比前代多一个数量级的合成数据上进行了训练 AlphaGeometry 2是一个神经符号混合系统。主要改进包括: 1.增强的语言模型:基于Gemini,从头开始训练,使用了比前代多一个数量级的合成数据。这大大提高了模型处理复杂几何问题的能力,包括物体运动、角度方程、比例或距离等问题 2.更快的符号引擎:新版本的符号处理引擎速度提高了两个数量级,大大加快了问题解决速度 3.知识共享机制:引入了新的知识共享机制,能够高级组合不同的搜索树,以解决更复杂的问题 4.性能提升:在接受今年IMO比赛前,AlphaGeometry 2能够解决过去25年IMO几何问题的83%,远超前代系统53%的解决率 5.实时表现:在今年的IMO中,AlphaGeometry 2在接收到形式化的第4题后,仅用19秒就解决了这个问题 6.DeepMind的研究团队还在探索基于自然语言推理的系统,这种系统不需要将问题转换为形式化语言,可能与其他AI系统结合使用。这种方法在今年的IMO问题上也显示出了巨大的潜力 本文作者:AI寒武纪,来源:AI寒武纪,原文标题:《数学界的AlphaGo时刻:谷歌DeepMind AI 19秒解 IMO几何题,仅差1分即可摘金牌》 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
相关内容
-
暂无...
推荐内容
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 特朗普“大重置”:债务化解、脱虚向实、美元贬值..
- 美股三大指数冲高回落,中概股重挫,纳斯达克中国..
- 深夜,重挫!近一个月最大跌幅;鸿蒙智行,连推爆..
- 活久见!美国商务部长上电视“推票”:买特斯拉股..
- 华尔街解读美联储决议:鸽派的亮点与迷你“鲍威尔..
- 深海经济利好持续加码,与商业航天、低空经济并列..
- 美联储的“关键一战”在5月,届时降不了息,那今..
- 李嘉诚押注创新药!和黄医药明星抗癌药海外大卖近..
- “三巫日”前美股反弹一日游,量子计算股暴跌,拼..
- 鲍威尔给经济焦虑“灭火”,标普创八个月来美联储..
- 腾讯要为AI砸千亿重金
- 政治危机升级,反对派领袖被捕引发土耳其股债汇三..
- 3月LPR报价出炉!1年期、5年期均维持不变..
- 五部门:依法稳步推进绿证强制消费,逐步提高绿色..
热点阅读
- 500亿量化帝国“幕后推手”:龙头券商财富业务“..
- 超千家公司将被ST?真实数据来了,66股符合ST新规..
- 股市应该每年赚多少?
- 如何看待这波“人形机器人”行情?..
- A股荒唐一幕!前三季度收入仅1.85亿元 总市值却超..
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 月活超千万,国产大模型应用海外杀疯?..
- A股激荡2020年 总市值上涨20万亿
- 历史上的“货币化安置”,拉动了多少投资?..
- 历史性一刻!顶级域名ai.com重定向到DeepSeek官网..
- Cliff Asness:这是一封写在2035年的十年资产配置..
- 刷新纪录!认购1万获配12.29元,近1300亿资金疯抢..
- 珠海前副市长公子的20亿地产生意
- 国务院:从严控制铜、氧化铝等冶炼新增产能,逐步..
- 大厂持续加量采购,英伟达H20“逆袭”..