Anthropic发布了Claude Opus 4.8,预告Mythos级别模型即将全面开放。
同一天,宣布完成650亿美元H轮融资,估值9650亿美元首次超越OpenAI。
Opus 4.8:更聪明也更诚实
Claude Opus 4.8距离上一代Opus 4.7仅6周,速度比Anthropic以往的发布节奏更快。
价格不变,每百万输入token 5美元,每百万输出token 25美元,100万token上下文窗口。
先看基准测试。
7项测试中Opus 4.8赢了6项。SWE-Bench Pro提升4.9个百分点,从64.3%到69.2%,这是工程师日常感知最明显的指标。连Claude Code之父都来安利。
Terminal-Bench 2.1是唯一输给GPT-5.5的项目,GPT-5.5拿了78.2%,Opus 4.8为74.6%。
但数字之外有一个更值得关注的特质:诚实。
Anthropic内部评估显示,Opus 4.8放行代码缺陷而不自报的概率,只有前代的四分之一。
它更愿意告诉你哪里不确定,更少在代码有瑕疵时声称已经完成。
Opus 4.8默认努力等级从上一代的xhigh降至high,编码任务消耗的token数量相近,但得分更高。
用户还可以选择extra(Claude Code中为xhigh)或max,让模型在难题上花更多token换更好结果。Fast模式速度约为标准模式的2.5倍,价格是上一代Fast模式的三分之一。
Claude Code新增了动态工作流(Dynamic Workflows)功能,目前处于研究预览阶段。他们内部工程师(常写爆文教程那个)都被迷住了,表示将出文章。
模型可以把一个大任务拆分,派出数百个并行子Agent分别推进,子Agent之间互相验证、反驳、迭代,最终收敛后再汇报结果。
用Opus 4.8的动态工作流,Claude Code能完成跨数十万行代码的库级迁移,从启动到合入,全程以现有测试套件为验收标准。
此外,claude.ai和Cowork新增了努力程度控制,用户可以选择让Claude在回复时投入多少思考。
Messages API也支持在消息数组中插入system条目,开发者可以在Agent运行中途更新指令,不用打破prompt缓存或绕道user turn。
Mythos:比Opus高一个层级的模型
Opus 4.8发布文章最后提到了Anthropic的下一步计划:开发比Opus更便宜的同能力模型,同时发布比Opus更聪明的新一类模型。
这个新一类模型就是Claude Mythos。
Mythos在Anthropic的模型层级中位于第四层,代号为Copybara,位于Haiku、Sonnet、Opus之上。Anthropic对其描述是:优于目前任何现有前沿AI模型。
4月7日,Anthropic正式宣布Mythos Preview,并启动了Project Glasswing(玻璃翼计划)。
Project Glasswing是一个网络安全倡议,联合了Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA和Palo Alto Networks等组织,目标是在AI驱动的网络攻防中给防守方建立持久优势。
Mythos Preview展示出的安全能力令人警醒。过去几周,它自主发现了上万个高危漏洞,覆盖所有主流操作系统和浏览器。
在网络安全复现基准CyberGym上,Mythos Preview得分83.1%,Opus 4.6为66.6%,差距接近17个百分点。
正因为能力太强,Anthropic没有直接公开Mythos。
目前只有Glasswing计划中的合作机构能使用Mythos Preview,用于防御性安全工作。
Anthropic在Opus 4.8文章中表示,Mythos级别模型预计在未来几周内向所有客户开放,安全防护方面的进展正在加速推进。
9650亿美元超越OpenAI
Anthropic完成650亿美元H轮融资,投后估值9650亿美元,首次超越OpenAI今年3月融资时创下的8520亿美元估值,成为全球估值最高的AI初创企业。
本轮领投方包括Altimeter Capital、Dragoneer、Greenoaks和红杉资本,每家出资超过20亿美元。D.E. Shaw、黑石集团、DST Global等跟投。
Google投入数十亿美元,属于此前承诺的最高400亿美元长期投资的一部分。亚马逊投资50亿美元,同样来自此前承诺。
值得注意的是,美光科技、三星电子和SK海力士也参与了本轮融资,芯片巨头出现,说明产业链正在向上游整合。
OpenAI预计在数日至数周内秘密提交上市草案文件,Anthropic最早也可能于今年秋季寻求公开上市。谁能率先IPO,可能成为这场AI竞速的下一个关键节点。
把Opus 4.8、Mythos、650亿美元融资放在一起看。
Opus 4.8是当前主力产品的常规升级,价格不变,性能提升,诚实度改善,动态工作流让Claude Code能处理更大规模的任务,这些是面向现有用户的实际交付。
Mythos是下一代能力的预演。它的编码和安全能力远超Opus,AI模型的攻防能力正在快速接近甚至超过人类顶尖水平,时间窗口有限。
650亿美元融资则是资本市场对这条技术路线的确认。Claude Code在企业级市场的渗透率快速攀升,投资者下注的不是Anthropic某一个模型的能力,而是它在模型能力、安全策略、商业转化三条线上同时推进的整体节奏。
AI行业的竞争,已经不是单点突破能赢的了。
参考资料:
https://www.anthropic.com/news/claude-opus-4-8
https://x.com/claudeai/status/2060042702150930686
https://x.com/AnthropicAI/status/2060061347522433422