首先是全局概览:6月9日,"可商用的最强模型"正式解禁

2026年6月9日(美国时间·周二),Anthropic正式发布了Claude Fable 5。用该公司自己的话说,这是一款"超越迄今为止所有正式发布模型能力"的前沿模型,在软件开发、知识型工作、图像识别(视觉)、科学研究等几乎所有测试基准上均达到了最先进水平(state of the art)。该模型即日起可通过Claude.ai聊天界面、API(模型名称为claude-fable-5)、Amazon Web Services、Google Cloud、Microsoft Foundry等各大云平台,以及编程智能体Claude Code和Claude Managed Agents使用。

发布时间的选择颇具深意。本文发布当日——6月10日——Anthropic开发者大会"Code with Claude"的东京会场正式开幕,次日11日还将举办面向独立开发者和早期创业者的"Extended Tokyo"专场。继旧金山(5月6日)、伦敦(5月19日)之后,这是今年的第三座城市,新模型发布的热度尚未消散,便直接传递到了日本开发者社区。活动设有同声传译,并支持在线观看。硅谷的"全球最强模型"在发布仅隔一天便在东京登台亮相——这种紧密的距离感本身,便是2026年AI开发竞争速度的缩影。

另外,本文标题虽写的是"Claude Code的最新模型",但准确来说,Fable 5是一款可横跨聊天到API全场景使用的通用前沿模型,而其中尤为突出的是,它被专门设计为在Claude Code这类自主智能体环境中充分发挥其真正价值。以下将首先结合具体示例,深入浅出地介绍这两个模型究竟"是什么"。

Mythos 5与Fable 5是什么——"相同的大脑,不同的安全装置"

首先需要把握的最重要的一点是,Fable 5与Mythos 5的内核(基础模型)完全相同。两者的区别只有一点:是否具备安全装置。Anthropic官方解释称:"Fable源自拉丁语*fabula*(被讲述之物),与希腊语*mythos*(神话・故事)同根同源。区分两款模型的,正是安全护栏。"换言之,这个命名的含义是:将"神话(Mythos)"这块危险而强大的原石,打磨成了可以安全讲述的"寓言(Fable)"。

这一系列的源头可追溯至2026年4月7日。那一天,Anthropic在其研究部门网站(red.anthropic.com)上发布了"Claude Mythos Preview"。据称,该模型作为通用语言模型,在计算机安全领域展现出尤为突出的能力,并在所有主流操作系统和Web浏览器中发现了零日漏洞。它能够自主构建JIT堆喷射、沙箱逃逸,乃至将多个漏洞串联起来的高级攻击链;据称即便是非安全专业人员,只需说一句"帮我在一晚上内做个远程代码执行的利用程序",第二天早上就能收到可运行的代码。在Firefox漏洞利用开发方面,成功数量达到181件,远远压制了上一代Opus 4.6仅有的2件。报告中还有一则令人不寒而栗的内容:该模型甚至挖掘出了隐藏在以安全著称的OpenBSD中"长达27年未被发现的漏洞"。

由于其能力过于强大,Anthropic并未将其公开发布,而是启动了名为Project Glasswing的限定计划。该计划的构想是:仅向守护全球关键基础设施的防御方(cyber defender)优先开放Mythos的使用权,以便在攻击者占据优势之前,帮助防御方做好充分准备。参与企业包括AWS、Microsoft、Apple、CrowdStrike、Cisco等。

此次6月9日发布的版本,以两段式结构向大众市场开放了这一格局。面向普通用户和企业销售的Fable 5,内置了由模型自身屏蔽危险领域回答的机制,并在触发时自动回退(fallback)至传统安全模型"Claude Opus 4.8"来处理请求。而Mythos 5则是解除了部分安全装置的同一模型,仅供通过事前审核的组织——包括网络防御者、关键基础设施运营商、生物医学研究人员等——通过Project Glasswing使用。Mythos 5被定位为"全球拥有最强大网络安全能力的模型"。打个比方:Fable 5是配备安全阀、任何人都可以驾驶的量产车;Mythos 5则是搭载同款引擎、仅限赛道使用的专用赛车。

具体能做什么——"能独自工作数日的同事"

让我们避开抽象论述,具体看看 Fable 5 在实际工作中能为我们做什么。Anthropic 反复强调的一点是:可以将人类需要数小时、数天乃至数周才能完成的端到端任务,几乎完全放手交给它处理。在 Claude Code 或 Claude Managed Agents 等智能体环境中部署后,Fable 5 能够持续工作数日,按阶段规划任务,向子智能体(下属 AI)分配工作,并自行验证成果。

官方文档列出的改进点十分具体。第一是长时间自主运行,能够在跨越多天的目标导向任务中保持指令记忆并完成任务。第二是一次命中率——早期测试者报告称,对于规格明确的复杂问题,以往需要数天反复试错才能搭建的系统,现在可以"一次实现"。第三是视觉理解,能够解读嵌入文件或 PDF 中的图表、图形和表格,还能"用眼睛"验证自己编写的代码的运行界面。据悉,模型还经过专门训练,能够自主调用 bash 工具或图像裁剪工具来处理倾斜、模糊或噪点较多的图像。

来自第三方平台的评价同样具体。编程辅助工具 Cursor 的 CEO Michael Truell 表示:"Claude Fable 5 是我们 CursorBench 上最先进的模型。"GitHub 首席产品官 Mario Rodriguez 评论道:"在初步测试中,它以超越以往标准的自主性和可靠性,完成了复杂且耗时的编程任务。"氛围编程领域的 Base44 称其"擅长一次性生成完整应用(one-shotting full apps),工具调用能力也十分出色";AI 工作空间 Genspark 则报告称"在 UI 设计和游戏编程方面,明显优于其他任何模型"。总而言之,各家公司的共同感受是:它已不再是单次问答的工具,而是更接近于一位能够独立完成从设计、实现到验证、修正全流程的"同事"。

基准测试的压倒性优势

数字上,其优势同样清晰。最受关注的是高难度软件工程基准测试SWE-bench Pro,Fable 5/Mythos 5录得80.3%。同一指标下,OpenAI最新通用模型GPT-5.5为58.6%,Anthropic自家上代模型Opus 4.8为69.2%,Google的Gemini 3.1 Pro为54.2%(数据来源:TechCrunch及专业媒体对Anthropic公开表格的整理)。在这类日趋饱和的基准测试中,超过20个百分点的差距实属罕见。

更具象征意义的是Cognition公司的FrontierCode Diamond(用于衡量高质量、高可维护性的智能体式编程能力的高难测试),Fable 5/Mythos 5取得29.3%,相比Opus 4.8的13.4%和GPT-5.5的5.7%,可谓"数量级上的差异"。数据分析平台Hex在其针对长时复杂分析任务的核心基准测试中,将Fable 5评价为"首个突破90%的模型";在金融分析基准Hebbia Finance Benchmark中,据称也录得"所有模型中的最高分"。

以下对主要公开基准测试做一整理(来源为各媒体转载、整理自Anthropic公开基准表的数值。★标注为Mythos 5的数值,需注意Fable 5因安全机制在相关领域的得分会降至Opus 4.8水平):

基准测试(评测能力)Fable 5/Mythos 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-bench Pro(实务代码修复)80.3%69.2%58.6%54.2%
FrontierCode Diamond(高质量智能体开发)29.3%13.4%5.7%
Terminal-Bench 2.1(CLI操作)88.0%★82.7%83.4%70.7%
GDPval-AA(实务知识工作·Elo评分)1932189017691314
Humanity's Last Exam(无工具·高难知识)59.0%★49.8%41.4%44.4%
OSWorld-Verified(PC自动化操作)85.0%83.4%78.7%76.2%

在此,笔者想指出一个一线工程师才会注意到、而其他网站的软文往往忽略的关键点。ExploitBench(攻击代码生成)78.0%、各类生物领域基准测试中的突出表现——这些"最耀眼的数字",实际上是Mythos 5的成绩,而Mythos 5并不对外公开销售。Fable 5对网络安全及生物/化学领域的请求启用了安全机制,会将其转交Opus 4.8处理,因此在这些领域的得分会相应下降。反过来说,Fable 5真正展现实力的,正是实际可付费使用的领域——编程、知识工作、视觉理解等。阅读基准测试表格时,多问一句"这是Fable的数字,还是Mythos的数字",才是行家的读法。

另作参考:媒体公司Every运营的"高级工程师基准测试"中,Fable 5取得91分(满分100),达到人类高级工程师水准,大幅超越此前最高纪录Opus 4.8的63分(来源:Every/Digg报道。需注意这是第三方独立指标,应酌情参考)。

Fable 5的收费体系与未来展望

定价清晰明了。每百万输入token收费10美元(约1,600日元),每百万输出token收费50美元(约8,000日元),Fable 5与Mythos 5定价相同。这恰好是上一代Opus 4.8(输入5美元/约800日元,输出25美元/约4,000日元)的两倍。与此同时,Anthropic也表示"低于Claude Mythos Preview定价的一半",以此强调相较于此前独家试用阶段的价格已大幅下降。启用提示缓存后,输入token可享受90%的折扣,对于需要反复引用长上下文的智能体应用场景,可大幅压缩实际成本。此外,仅限美国境内推理的选项在输入和输出上均需乘以1.1的系数。值得称道的是,因安全机制而被转发至Opus 4.8处理的请求,将按Opus 4.8的定价收费,而非Fable的定价。

值得关注的是分阶段提供方式。为应对预期中的需求过热,从6月9日至6月22日,Pro、Max、Team及按席位计费的Enterprise各订阅方案均免费包含Fable 5。6月23日起将改为消耗用量积分(usage credits)的形式,路线图显示"待计算资源充足后"将恢复将其纳入标准套餐。通过API及Consumption型Enterprise则从第一天起即可完全使用。

这种"先免费开放,后转为付费"的设计在Hacker News上引发了褒贬不一的讨论。有用户指出"有种'先给再收回'(offer, then remove)的感觉,令人皱眉,看起来像是要把订阅用户引导向按量付费",另一位开发者则直言"眼看着要被价格挡在顶级LLM门外,心里很不是滋味"。不过,换个角度来看,这恰恰证明了"首日需求极度旺盛,计算资源的供给甚至难以跟上"的产品实力。在即将到来的IPO前夕,这对Anthropic而言也具有重要的示范意义——向投资者证明公司"能够在不引发灾难性滥用的前提下,将前沿智能规模化地交付给用户"。定价与算力之间的博弈,在相当一段时间内仍将是这一新模型运营的核心议题。

安全装置的"设计理念"——为何与OpenAI和Google不同

谈到Fable 5,与性能并列被推向前台的安全设计是不可回避的话题。Fable 5内置了三个安全分类器(classifier)。分别是:进攻性网络(创建漏洞利用程序、恶意软件及攻击工具)、生物与生命科学(实验方法、分子机制等存在滥用风险的内容),以及模型摘要思维内容的提取(distillation/reasoning_extraction)三大领域。针对属于这些范畴的查询,模型将自动停止作答,并回退至安全的Opus 4.8。Anthropic表示,该机制的触发比例不超过全部会话的5%95%以上的会话完全由Fable本身的回答来完成

鲁棒性验证同样十分彻底。外部漏洞赏金计划经过超过1,000小时的测试后报告称"零通用越狱(万能脱狱手法)",而英国AI安全研究所(UK AISI)则记录其在短暂的初期测试窗口内"更近了一步",措辞上带有警示过度自信的意味。此外,Mythos级别的流量被要求保留30天数据,但这仅用于防御新型攻击和降低误报(false positive)等安全目的,不用于模型训练,并在期限届满后予以删除。

这里清晰地呈现出Anthropic与OpenAI、Google之间的战略差异。事实上,就在本次发布仅仅5天前的6月4日,Anthropic发布了一篇博客,警告称"AI正在逼近递归自我改进(recursive self-improvement,即AI开始在无需人类介入的情况下设计并构建后继AI的阶段)"。联合创始人Jack Clark等人撰写的这篇文章,以"Claude如今已撰写Anthropic内部合并代码的80%以上(在2025年初推出Claude Code之前仅为个位数百分比)"这一事实为据,援引冷战时期中程核导弹裁军的比喻,呼吁世界应当拥有能够暂停前沿开发的"选项"。

在发出"AI正变得危险"的警告仅5天后便推出"史上最强模型"——TechCrunch以略带讽刺的笔触将这一表面上的矛盾写入标题。然而从业内视角解读,两者其实是一以贯之的。将配备安全装置的Fable(可商用)与解除限制的Mythos(仅限防御方)相分离——此次设计的核心,正是Anthropic对6月4日所提问题的具体回应:如何在不被滥用的前提下,让"危险而强大的能力"依然服务于防御与生产力。不靠能力的硬碰硬,而是将"能力×安全性的兼顾"作为品牌核心——这正是该公司在硅谷构建其独特定位的根本所在。

掌握使用技巧——将"最困难的任务"交给它

释放性能的关键,在于抛弃对传统模型的固有印象。Anthropic官方提示词指南开篇即指出:"取得最佳成果的团队,都是将Fable 5用于解决最难的未解决问题。如果只用简单任务来测试,往往会低估其能力的广度。"换言之,诀窍在于主动选择那些"前代模型难以胜任"的任务,并将从需求定义到执行的全流程交由其处理。

控制的核心是effort(努力度)这一参数。它可以一键调节智能、速度与成本之间的权衡——大多数任务默认使用high,对能力要求极高的场景使用xhigh,常规作业则使用mediumlow。据称即便是较低的effort设置,也往往超越传统模型的最高配置。另一方面,由于难题可能导致单次请求耗时数分钟、自主运行甚至数小时,因此建议重新审视客户端的超时设置、流式传输及进度展示,并将架构改造为不阻塞处理流程、以异步方式"轮询状态"的harness设计。

官方文档也明确记载了防止长时间运行崩溃的实务要点。第一,提供记忆系统——将每条经验教训以单独的Markdown文件保存,文件开头附一行摘要,让模型参考过往学习成果,可显著提升性能(这与本文写作环境的记忆管理思路不谋而合)。第二,要求核实进度——若提示"在汇报前,将每项主张与本次会话的工具执行结果逐一比对;只汇报有据可查的内容,未经验证的事项需如实说明",Anthropic的测试显示,虚假进度报告几乎销声匿迹。第三,善用子代理——Fable 5会比以往更积极地启动并行子代理,因此独立的小任务适合委托出去,而验证工作交由"上下文全新的独立验证代理"来完成,比让模型本体自我批判更能提升精度。

还有一些意想不到的陷阱值得了解。在长时间会话的深层阶段,Fable 5偶尔会只声明"接下来执行X",却不调用工具便结束轮次;此时只需一句"continue"或"请从头到尾完成(go ahead and do it end to end)"即可恢复。此外,让模型将自身思考过程作为答案输出的旧式提示词或技能,可能误触reasoning_extraction(思维抽取)的拒绝类别,从而增加回退至Opus 4.8的频率。在迁移时,建议清查"给我看你的思考过程""逐一解释原因"等旧式指令,若确实需要可视化思维过程,应改为读取结构化thinking块的方式,这是避免无谓回退的标准做法。总体而言,针对旧模型精心打造的过于细碎的技能,反而可能适得其反——向"减少指令、放手委托"方向改造,往往更为奏效。

硅谷如何报道此事——狂热与"被价格拒之门外"的忧虑

各媒体与网站的基调,是对能力的赞叹与对运营、安全现实层面的担忧并存,呈现出一种成熟的接纳姿态。VentureBeat以"Anthropic将Mythos带向大众——史上最强公开版模型Claude Fable 5"这一最高规格的标题进行报道,TechCrunch、CNBC、NBC News、Inc.、IT Pro等媒体,在聚焦能力飞跃的同时,也在文章开篇着重提及"回退至Opus 4.8"这一安全机制。将安全装置置于新闻主角级别加以报道,本身就说明2026年AI报道的重心已从"速度"转向"速度与安全的兼顾"。

开发者社区的真实声音汇聚于Hacker News。在赞誉之外,此前提及的"6月22日终止免费提供"这一定价设计所引发的警惕,以及对安全装置过度反应(误报)的不满,显得尤为突出。有用户反映"尝试使用时,系统警告称可能正在试图制造生物武器,并被切换回Opus 4.8",还有声音指出,正当的代码审查和安全测试也遭到了拦截。Fable 5的安全阀确实可能误伤无害的防御性网络安全工作和有益的生命科学任务——这种"便利与安全的权衡取舍",正是Anthropic在后续运营中亟需精细调校的最前沿课题。

尽管如此,整体基调仍是积极的。正如Every的评论者所写:"在Fable中,AI开始从执行我方指令的'工具',逐渐变得像是共同思考的'协作伙伴'。"类似这样超越量化分数、切实感受到"工作方式质的变化"的报告接连涌现。尽管价格与安全装置带来了一定摩擦,但几乎没有人对其所达到的能力本身提出质疑——这可以说是硅谷对此次发布的最大公约数式评价。

未来展望——IPO、代币经济,以及"何时会发生什么"

最后,整理一下今后预计何时会有哪些动向。最大的背景是IPO(首次公开募股)。据Fortune和CNBC报道,Anthropic于6月1日向美国SEC以机密方式提交了S-1注册文件。在最近一轮650亿美元(约10.4万亿日元)规模的H轮融资中,估值达到约9,650亿美元(约154万亿日元),据报道首次超越了OpenAI(截至3月约为8,520亿美元≈136万亿日元)。年化收入(run-rate)在2026年5月时已达约470亿美元(约7.5万亿日元),较上年约100亿美元(约1.6万亿日元)大幅飙升,第二季度单季预计营收达109亿美元(约1.74万亿日元)。但由于属于机密提交,正式招股书和经审计的财务数据均未公开,需注意这些数字仅基于媒体报道和私募轮融资。上市时间最早预计为2026年10月,即今年秋天。此次Fable 5的发布,为这一上市故事增添了决定性的一章——"能够在不被滥用的前提下将顶尖能力商业化"。

产品层面近期需关注的动向有三点。第一是算力扩容,即6月23日之后转为限额制的Fable 5,随着计算资源得到保障,重新纳入标准订阅计划的时间节点。第二是Project Glasswing的扩展,Anthropic计划向更系统化的"信任访问计划"过渡,将Mythos Preview用户升级至Mythos 5,同时在保留网络安全防护的前提下,新设一个解除生物、化学限制的"生物学专项计划"。Engadget等媒体还报道称,Glasswing的覆盖范围将扩大至约150个新组织,并新增可进行代码库扫描和补丁建议的"Claude Security"。第三,在本日6月10日的Code with Claude东京及翌日11日的Extended Tokyo活动上,基于新模型的使用技巧和新功能实时演示将直接面向日本开发者分享。

从工程师的视角展望未来,关注的焦点将从"基准测试数字"转向"自主运行的实际运营数据"。Fable 5的真正价值,在于能否稳定完成历时数小时乃至数日的长时间任务,以及能在多大程度上抑制因误判引发的回退。Anthropic自身公开表示"公司内部超过80%的代码由Claude编写",并已就递归自我改进发出警示,那么接下来全球应当衡量的,正是"人类监督可以被削减到何种程度而不至于崩溃"这一核心问题。定价博弈、安全机制调校,以及IPO这三个变量相互交织,2026年下半年的AI开发竞赛将以Fable 5为基准点开始运转。而这场竞赛最前线的气息,恰恰可以在发布翌日的东京亲身感受——对于日本开发者而言,这无疑是"史上最强模型解禁"最完美的时机。