AI圈的卷王之王,非Anthropic莫属了。
上个月,他们刚刚发布了旗舰模型Claude Opus 4.7。本来大家都以为按照科技圈的节奏,怎么也得歇几个月。网上连剧透都说,下一次更新最快也是在6月中旬。
结果Anthropic完全不按常理出牌,直接提前把全新升级的Claude Opus 4.8给扔了出来。
这次升级可不是简单的修修补补,而是直接放出了几个能彻底颠覆咱们日常工作方式的超级大招。

大招一,就是思考投入可以自己控制了。
以前咱们用AI,无论问多简单还是多复杂的问题,它的脑神经运转模式都是固定的,你要么嫌它太贵,要么嫌它想得不够深。但现在,Opus 4.8把这个油门的控制权交给了你。
简单的日常琐事,你可以调低它的思考投入,省下大笔的Token费用。如果是极其复杂的金融建模或者写海量代码,你可以把油门踩到底,让它用最高的推理强度死磕这个问题,用算力换取极其高质量的答案。甚至他们还推出了速度飙升2.5倍的快速模式,价格却只有以前模型的三分之一。
大招二,也是我觉得最逆天的一个功能,叫做动态工作流。
大家注意了,这标志着AI已经从一个只会跟你一问一答的聊天软件,进化成了能自动干大项目的超级包工头。
在这个模式下,Opus 4.8可以在后台同时协调几百个子AI智能体。比如你要迁移一个几十万行的庞大代码库,你只要给它派个大任务,它自己就会去规划、拆解成无数个小任务,分发给这几百个AI分身同时干活,最后它还负责合并检查。这简直就是凭空造出了一支24小时不睡觉的顶级工程师团队。
大招三,就是这个AI变得前所未有的诚实。
经常用AI的人都知道,大模型有个致命的毛病,叫幻觉。就是它有时候明明不知道,但非要一本正经地胡说八道骗你。
但据Anthropic官方测试,Opus 4.8在诚实度上有了史诗级的提升。当它遇到证据不足或者不确定的信息时,它不会再强行瞎编,而是会主动告诉你:“这里可能有问题,我不太确定。”甚至连它自己写的代码如果有缺陷,它未加提示就蒙混过关的概率,也足足下降了四分之三。这就意味着,未来把它用在法律分析、金融研究这些容不得半点沙子的高端行业里,会极其靠谱。
那么,Anthropic为什么要在现在这个节骨眼上,疯狂加速发布新模型呢?
很显然,他们不想再单纯地跟OpenAI比拼谁的模型考试分数高了。从这次更新的指挥几百个AI分身干活、调整思考强度就能看出来,Anthropic的野心,是想彻底吃下那些极度复杂、利润极高的企业级智能体市场。甚至在几周内,他们马上还要公开发布那个令安全专家胆寒的黑客级模型Mythos。



