AI见闻日报:大模型思想克隆!让AI像人类一样思维,学习泛化能力大幅提升;SAM视觉模型升级,分割能力大幅提升
gangqin @ 2023年06月06日 财经风云
AI见闻日报:大模型思想克隆!让AI像人类一样思维,学习泛化能力大幅提升;SAM视觉模型升级,分割能力大幅提升 | 见智研究 申思琦 1、下一代模型训练方法:不是预测下一个字,而是模仿人类思维学习在行动中思考 2、SAM视觉模型升级,分割能力再提升,将进一步提升多模态能力 3、微软Office 365 Copilot已经扩大试用范围,开启涨价 4、谷歌发布AI学习课程,专为初学者设计 今日要点: 1、下一代模型训练方法:不是预测下一个字,而是模仿人类思维学习在行动中思考 2、SAM视觉模型升级,分割能力再提升,将进一步提升多模态能力 3、微软Office 365 Copilot已经扩大试用范围,开启涨价 4、谷歌发布AI学习课程,专为初学者设计 见闻视角 海外AI 1、下一代模型训练方法:不是预测下一个字,而是模仿人类思维学习在行动中思考 要点: 动机:提出一种新的模仿学习框架,Thought Cloning,通过模仿人类思考过程来改进强化学习智能体的表现。研究者认为,强化学智能体在泛化能力、探索能力、规划能力、适应新情境的能力等方面远远不及人类,其中一个原因是缺乏语言思考的收益。 方法:提出Thought Cloning,不仅克隆人类示范者的行为,还克隆人类在执行这些行为时的思考过程。通过在大规模的包含人类思考过程的数据集上训练,论文验证了Thought Cloning相比行为克隆方法在学习速度和处理新情境能力上的优势。 优势:Thought Cloning相较于行为克隆方法具有更快的学习速度,并且在面对新情境任务时具有更大的性能优势。此外,Thought Cloning还对AI安全性和可解释性有重要益处,可以更容易地诊断问题、纠正代理的思考或阻止代理执行不安全的计划。 思想数据来源:研究者选取了YouTube视频和文字录音,有大约数百万小时,包含了人们行动、计划、决定和重新规划背后的思想。 见智研究一句话总结: Shengran Hu, Jeff Clune(前OPEN AI成员)提出了一种名为Thought Cloning的模仿学习框架,通过模仿人类思考过程来训练AI智能体,提高其学习速度、泛化能力和处理新情境的能力,同时提供重要的AI安全性和可解释性优势。 在Jeff Clune看来,思想克隆有助于人工智能的安全。因可以观察到智能体的思想:(1)可以更容易地诊断出事情出错的原因,(2)通过纠正智能体的思想来引导它,(3)或者阻止它做所计划的不安全的事情。 2、SAM视觉模型升级,分割能力再提升,将进一步提升多模态能力 HQ-SAM,使 SAM 具备准确分割任何物体的能力,同时保持 SAM 原有的提示设计、效率和零样本泛化能力。我们的精心设计重用并保留了 SAM 的预训练模型权重,同时只引入了最少的额外参数和计算。 研究人员设计了一个可学习的高质量输出令牌,它被注入到 SAM 的掩码解码器中,并负责预测高质量掩码。我们不是仅将其应用于掩码解码器功能,而是首先将它们与早期和最终 ViT 功能融合以改进掩码细节。为了训练我们引入的可学习参数,研究人员从多个来源组成了一个 44K 细粒度掩码数据集。 HQ-SAM 仅在引入的 44k 掩模 detaset 上进行训练,在 8 个 GPU 上仅需 4 小时。我们展示了 HQ-SAM 在跨不同下游任务的一组 9 个不同分割数据集中的功效,其中 7 个在零镜头传输协议中进行了评估。 见智研究认为,SAM模型的出现让视觉模型的范式发生改变,让原本在视觉领域有所积累的AI公司被迅速拉平距离,甚至让相当一部分此前积累的技术变得毫无意义。而此次SAM模型的升级,将是分割能力再次大幅提升。同时保持 SAM 原有的提示设计、效率和零样本泛化能力。通用大模型多模态领域的进化将再次升级。 3、微软Office 365 Copilot已经扩大试用范围,开启涨价 包括美国银行、沃尔玛、福特和埃森哲在内的600多家微软最大的客户预计将试用Microsoft Office 365中的人工智能功能,其中至少已有100家客户已经额外分别为1000个订阅账户支付了高达10万美元的年费。(在原有的Office 365年费基础上,每个账户多支出100美元) 与经典版本相比,这一AI版本的Office 365价格至少高出了40%,具有自动在Word文档中撰写文字和自动创建PPT等增值功能。 见智研究认为,目前阶段,微软为office AI定价较高的其中一个原因是这些功能通常需要更多的GPU服务器算力,比传统的服务器消耗更多资源成本。市场普遍看好AI将为微软带来一次新的用户付费改善飞跃,但市场仍需观察微软是否能在该项产品上做的足够好,以及在现有GPU短缺的情况如何扩展用户数量的桎梏。 4、谷歌发布AI学习课程,专为初学者设计 谷歌发布了一个名为 "Generative AI learning path" 的学习路径课程,专门为初学者设计。它从基础概念开始,如什么是生成式AI,然后逐步深入到更复杂的主题,如创建图像字幕模型和使用Vertex AI的生成式AI工作室。目标是帮助初学者理解生成式AI的基础知识,以及如何在Google Cloud上使用生成式AI。 明日看点: 苹果WWDC将在北京时间6月6日凌晨2点召开,据悉,本次WWDC将是苹果有史以来最长的一次。XR是否能成为下一个iPhone,全世界都在期待这次的one more thing. 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 套息交易正从新兴市场逃离
- 瑞银下调对美国科技股“六巨头”的评级 高盛:维..
- 黄金,一轮盛大跌势开始?
- 津巴布韦股市蒸发99.95%!都怪新版货币ZIG..
- “不会跌”的股票ETF要上市了
- 小摩警告:美股回调尚未结束
- 5万亿外资巨头加码中国市场!信安数据中心投资基..
- 紧盯155?如果日本央行干预,最可能怎么做?..
- 外盘贵金属大跌!黄金期货跌超3%,近期受到两大因..
- 近两年最大跌幅!金价遭重锤,发生了什么?..
- 美联储一年内加息可能性上升至20%!投资者不再“..
- 央行有关部门负责人:央行在二级市场开展国债买卖..
- 首次!美国要制裁以军,以总理:将“尽全力反击”..
- 公募基金重仓“新面孔”!曾经的“爱答不理”,现..
- 没有“七姐妹”们,欧美股市表现还会好吗?..
热点阅读
- 苏宁张氏父子,退无可退
- 罕见!监管层大动作
- 下周重磅日程:中国4月LPR出炉、科技巨头财报潮来..
- 4月LPR继续按兵不动!机构:短期内缺乏进一步下调..
- 跌掉了一个AMD!英伟达本周市值蒸发3000亿美元,..
- 以色列打了吗?美国:打了!伊朗:没有!以色列说..
- 美油多头持仓骤减3.5万手,市场情况有变?..
- 白银最大涨幅已超黄金,业内提醒:不要盲目追高!..
- 海通策略:A股即将迎来一季报密集披露期,科技周..
- 以色列突发!王毅最新表态,日本传来大消息!美国..
- 内讧、业绩变脸、终止收购!AI牛股们掀起暴雷潮,..
- 为AI发电,对全球意味着什么?
- 清华系大模型蛰伏五周年:1位先锋串起半部创业史..
- 工信部:加快6G、万兆光网研发力度..
- 黄金的公允价值,这个模型可以解释!今年的金价上..