DeepSeek 乱杀一通后,OpenAI 们终于坐不住了
今年过年,年味浓不浓俺不好说,但 AI 味肯定是够够的了。 小到年夜饭桌,大到热搜新闻,哪哪都是 DeepSeek,就连世超家族群里平时不咋关注科技的亲戚,也在说中国的人工智能这次胜了老美一筹。 这么说吧, DeepSeek 凭一己之力,拉高了全国对 AI 的认知程度。 至于 DeepSeek 到底有多厉害,想必这段时间哥几个也已经上手体验过了,说它是 目前最懂中文互联网的 AI 模型,应该没人有意见吧? 反正从身边人统计学来看,这段时间什么 Claude 、 ChatGPT 通通都不香了。 不过大伙儿也先别急着开香槟,这次 DeepSeek 一冒头,对手们就从四面八方吻了上来。 OpenAI 大年初四发 o3 推理模型,今天又免费开放了搜索功能,谷歌的 Gemini2.0 全量开放,还有阿里的 Qwen2.5-Max 也发力打榜 DeepSeek 。。。 要我说,这些科技公司还是得逼一把,不然你都不知道他们的实力到底有多少。 先说 OpenAI 的 o3 ,去年底的发布会就传出了消息,说今年 1 月份要上线。 但奥特曼估计也没想到,被 DeepSeek 狙了一手,现在这个发布的时间节点,多少就有点耐人寻味了。包括世超也觉着, o3-mini 的发布是为了反击 DeepSeek 。 当然回到正题啊,这次的 o3-mini ,号称是他们的推理系列中最具成本效益的模型,还尤其擅长科学、数学和编码,响应的速度也更快。 一句话总结, o3-mini 就像一个家庭条件一般,但智商很高的理科学霸。 就拿编程来说,除了 o3-mini ( low )打不过 o1 以外, o3-mini 三个档位的模型,基本乱杀前辈 o1 系列。 竞赛数学也不在话下, o3-mini ( high )的表现都要好过 o1 系列。 就连博士级别的题目, o3-mini 也能跟 o1 系列打得有来有回。 x 上有老哥用同一组 prompt 测试了 o3-mini 和 DeepSeek R1 ,得出的结论是 "o3-mini ( 编程能力 )碾压 DeepSeek R1" 。 说实话,光看视频的话,确实是 o3-mini 的效果更逼真。 另外一位老哥也测试了一把 o3-mini 的物理理解能力( prompt :编写一个球在超立方体内弹跳的 Python 脚本 ),直接夸 o3-mini 可能是物理学得最好的模型。 反正看了一波大伙儿的测试,世超觉着 o3-mini 似乎更接近咱们一直在说的,能够理解物理世界、模拟物理规律的世界模型。 重点是, o3-mini 现在免费就能用上,可比之前的 o1 要大方的多了。 而且, o3-mini 只是 o3 系列的第一个版本,后面还会有满血版的 o3 出来。我的建议是让 DeepSeek 再整个大活,给奥特曼上点强度,到时候指不定还会有大升级。 这不,除了发布 o3-mini 外, OpenAI 又趁着咱们开工的这两天,免费开放了 ChatGPT 搜索。 现在你甚至都不需要注册,就能直接用。 过年那阵,微软也让所有的 Copilot 用户免费用上了 o1 推理模型,要不说还得谢谢 DeepSeek 呢。 另外一边,谷歌也有点坐不住了。 同样是去年 12 月发布 Gemini 2.0 ,但那会儿只有开发者和一部分测试者能用,一直咕咕咕也不见有动静。 结果被 DeepSeek 这么一激, 一口气发了三个版本的 Gemini2.0 模型。 基准测试中,各方面性能也都优于前代模型。 但相比 DeepSeek 和 OpenAI 的热度,谷歌这边多少就显得有些无人在意了。 再来看国内的情况,阿里云算是第一个对 DeepSeek 发起 "进攻" 的公司。 根据阿里云官方的说法, Qwen2.5-Max 在多个基准测试中,超越 DeepSeek V3 、 o1-mini 等多个模型。 并且在 Chatbot Arena 的大模型盲测排行榜上, Qwen2.5-Max 冲到了第七的位置。 具体看模型的 数学和编程能力,甚至还能拿第一。 所以 Qwen2.5-Max 在发布后,国内有不少媒体都出来捧了一波。 反正世超看下来,这次由 DeepSeek 掀起的新一轮 AI 军备竞赛,领头的这一批公司已经掏出了不少真家伙。 不过说实在的, DeepSeek 这出后来者居上的戏码,的确给咱上了一课。 指不定后边儿还会有更加出色的模型出现, 毕竟有 DeepSeek R1 的珠玉在前,如果再不拿出点实力相当,或者足够炸场的东西来,那就没啥意思了。 咱们坐着等就成,今年的模型大战肯定有的看了。 来源:公众号 差评 |
- 江南皮革厂的黄鹤到底是谁?有没有带着小姨子跑路..
- 恒大的钱都去哪里了?烂尾楼解决了吗?一张图看懂..
- 牛市几个迷失心性的特征
- 《流浪地球 3》再不上映,移山计划就要成现实了!..
- 阿根廷经济一片大好,米莱奇迹已被公认..
- 晚点 LatePost 爆料字节要出「豆包手机」..
- 给外卖员送外卖,华强北小孩赚到了人生第一桶金..
- 搜索引擎可能完蛋,但谷歌的广告费一分不少..
- 巴菲特再卖苹果:股票 “太贵”,不如换钱?..
- 对普通人来说,去掉了所有比学历更好的选项之后,..
- 两张图看懂这次峰会本质
- 于东来:有的人唱衰中国经济,说消费低迷..
- 如果穿越回 1997 年手搓一台 windows 掌机..
- 叔叔卸任 B 站法人,又被当成了一个大新闻..
- 至今为止,让你感到最荒谬的事是什么?..
- 亡命之徒
- 马云时代正式结束,蚂蚁集团完成权利重构告别 “..
- 回力男鞋运动鞋2025新款网面休闲鞋子 29.9 元包邮..
- 45 岁城市女白领,失业以后,可以从事哪些工作?..
- 湖南湘西绿心猕猴桃大果5斤整箱 13.41 元包邮..
- 库克和马斯克都没做错什么,但是历史把麦克风交给..
- 下半年市场不乐观的话,春节就是大逃杀了..
- 原来还有不少朋友不知道,冬虫夏草早就被踢出保健..
- 80 后与 70 后人口对比
- 中国 AI 情趣机器人,“杀” 向全球..
- 辛巴为何突然 “不播了”?
- AI 编造的信息正在污染中文互联网
- 【吴京代言】大窑嘉宾450ml*9瓶0糖汽水 19.9 元包..
- 【无穷】盐焗爆鸡蛋16枚 16 元包邮
- 工资少,落差大,985 文科硕士,逃离民办大学教师..