由OpenAI联合创始人卡帕西领导的Mythos所实现的RSI（递归自我改进）。Anthropic的独走与挣扎

OpenAI联合创始人、AI教育领域顶尖人物安德烈·卡帕西于2026年5月19日闪电加入Anthropic，带领团队"用Claude加速Claude自身的预训练"。这是AI造AI——即"RSI＝递归自我改进（Recursive Self-Improvement）"核心位置上的一次关键人事任命。然而就在6月初，该公司发表了一篇论文，将RSI本身定性为最大风险，并向全球呼吁前沿AI开发应实现"协调一致的暂停"。一边比任何人都更用力踩下油门，一边亲手分发刹车设计图——但这并不矛盾。正因为比任何人都更用力踩下油门

RSI（递归式自我改进）是什么——首先从整体概貌说起

RSI（Recursive Self-Improvement／递归自我改进）简单来说，是指"AI几乎不借助人类之手改进自身能力，再以改进后的能力进一步改进自身"的过程。变得更聪明一级的AI，接着创造出更聪明的AI。那个AI再创造出更聪明的AI。这种嵌套（递归）循环一旦开始运转，改进速度本身就会加速，最终可能在短期内到达远超人类智能的节点——这一概念由数学家I·J·古德于1965年首次以"智能爆炸（intelligence explosion）"的形式加以定式化，半个多世纪以来一直停留在思想实验的范畴之内。

然而从2025年到2026年，这一概念迅速从思辨哲学降落至实际技术研究领域。具有象征意义的是，2026年4月在里约热内卢举办的机器学习主要国际会议ICLR，召开了首个专门聚焦RSI的国际研讨会。研究者们开始认真讨论"能够自我改进的AI系统"的共同原则与评估方法，这件事本身就说明了时代的变化。

为了不让讨论停留在抽象层面，以下举出具体案例。根据Anthropic公开的数据，截至2025年底，Claude编写的代码质量略逊于该公司工程师所写的代码，但到2026年中期的现在，已经达到了几乎同等的水平。合并到该公司代码库中的代码，超过八成已由Claude编写，2026年第二季度，一名普通工程师每天合并的代码量与2024年相比增加了约8倍。由于AI以极快的速度大量生产代码，甚至有报告指出"人工代码审查已成为新的瓶颈"。换言之，RSI并非遥远未来的科幻小说，而是已经在AI企业内部部分运转起来的现实。

演示"自我研究"的男人——安德烈·卡帕西这个人

站在这一RSI最前沿的，正是安德烈·卡帕西（Andrej Karpathy）。他的经历本身就是深度学习时代的缩影。他从OpenAI的创始成员之一起步，2017年转赴特斯拉，主导自动驾驶（Full Self-Driving与Autopilot）的AI部门，2022年离开特斯拉后，2023年一度回归OpenAI，2024年独立创业，创办了AI教育初创公司Eureka Labs。他之所以被誉为"世界最伟大的教育者"，是因为他通过在线课程和YouTube讲解，以无人能及的平易方式阐释晦涩难懂的神经网络原理，向全球工程师传授了LLM的基础知识。他是那种在研究者与教育者两个领域同时登顶的罕见人物。

正是这位卡帕西，在2026年3月通过自己的社交媒体展示了一项实验，让RSI以一种连普通人也能直观理解的方式呈现在世人面前。他为自己亲手打造的小型学习项目"nanochat"配备了一个AI编程智能体和一个小型语言模型，让其在近乎无人监督的状态下运行了约两天。智能体反复自行修改并测试学习代码（训练配方），共进行了约700次自主改动。最终，它积累了约20项"自主发现的改进"——包括归一化系数调整、注意力机制参数调整、优化算法配置变更等——将训练时间从2.02小时缩短至1.80小时，压缩了约11%。更值得注意的是，其中许多改进可以直接从小模型（12层深）迁移应用到大模型（24层深）。

预训练（pre-training）是AI公司投入最巨额资金的环节，哪怕微小的效率提升，随着规模的扩大也会产生滚雪球般的放大效应。卡帕西本人将这项实验评价为"一部分是代码，一部分是科幻，再加上一撮癫狂（part code, part sci-fi, and a pinch of psychosis）"，并将其描述为前沿AI研究机构面临的"最终Boss战（final boss battle）"。AI自我优化其创造方式本身——这位世界最伟大的教育者，用一场家庭实验演示了RSI的微缩版本。

闪电转会——卡尔帕蒂加入Anthropic"预训练"团队

2026年5月19日，距那次实验约两个月后，卡帕西在社交媒体上发文宣布"个人报告：我加入了Anthropic"，此消息震惊了整个业界。用他本人的话说："我认为未来几年将是LLM前沿领域尤为关键的时期。能在此时加入团队、重返研究与开发（R&D），我感到无比兴奋。"他同时补充道："对教育的热情不变，今后也打算重启那项工作。"

据TechCrunch和CNBC的报道，卡帕西将加入由尼克·约瑟夫领导的Anthropic预训练团队，"组建一支专注于利用Claude加速预训练研究的团队"。预训练团队正是负责那些赋予Claude核心知识与能力的超大规模训练运行的部门。简而言之，他的任务是将3月份在家中演示的"autoresearch（自我研究）"，借助世界顶尖水平的前沿模型以产业规模运转起来——让Claude改进下一个Claude的构建方式，这本身就是RSI的核心。Anthropic的薪酬和股权条件未予披露。

这次跳槽的象征意义有双重分量。其一，OpenAI创始成员转投最大竞争对手Anthropic、且直接进入构建模型根基的预训练部门，堪称人才争夺战中的重大事件。其二，卡帕西本人其实是主张"AGI距今还有十年"的审慎派。他在2025年10月德瓦尔凯什·帕特尔的播客中表示，现在是"智能体的十年"而非"智能体之年"，直言当前模型生成的代码不过是"slop（劣质品）"，并强烈直觉地认为AI带来的经济增长"不会打破年均2%左右的长期趋势"。这是对过热的近未来AGI论的一记脚踏实地的反驳。颇具讽刺意味的是，正是这位审慎派，如今担起了驱动最具加速性的RSI引擎曲轴的角色。

什么是Mythos——不对外公开的"最强前沿模型"

文章标题中的"Mythos"，是指Anthropic称之为"Claude Mythos Preview"的一款尚未公开发布的前沿模型。该模型是一款通用模型，但据称在发现和利用软件漏洞方面已达到超越人类的水平——除极少数顶尖人类专家外。Mythos迄今已发现数千个严重漏洞，据报道还在主流操作系统及几乎所有主流Web浏览器中发现了未知缺陷。

由于该模型能力极强，且网络安全领域兼具"防御用途"与"攻击用途"两面性，Anthropic并未将其公开提供，而是通过名为"Project Glasswing（玻璃翼计划）"的框架，仅向有限的政府机构和关键基础设施运营者开放访问权限。根据该公司官方声明，Glasswing最初以约50个初始合作伙伴启动，上线仅数周内，各合作伙伴便发现了超过1万个"高"或"严重"级别的漏洞。2026年6月2日，Anthropic宣布将访问权限扩展至15个以上国家的约150个组织，其中许多合作伙伴是"一次大规模攻击即可影响超过1亿人"的关键基础设施运营者。据Bloomberg报道，欧盟网络安全机构ENISA有望成为首个获得Mythos访问权限的欧盟机构。Anthropic将其最终目标定为："将Mythos级别的模型与能够检测和拦截最危险输出的强大安全防护机制相结合，最终实现用于网络防御的大规模部署。"

在此，笔者希望准确厘清一个其他网站往往语焉不详的关键点。公开信息明确指出的有两点：(1) Mythos是Anthropic目前最强大的"未公开"前沿模型；(2) 卡帕西（Karpathy）的团队将使用"Claude（尤其是最前沿的Claude Opus）"来加速预训练。例如，据报道在卡帕西式的autoresearch循环中，Claude Opus 4.6曾连续运行超过12小时、历经118次实验。然而，Anthropic并未官方声明在该自我研究循环内部具体使用了"Mythos这一特定变体"。因此，本文标题所勾勒的"Mythos×RSI"图景，准确的解读应是：Anthropic已开始将自身"最强级别的能力"转向内部（即其自身的开发工作）这一格局的象征。最强的攻击能力（漏洞发现）与最强的自我改进能力（预训练优化），同时诞生于同一家公司的同一前沿技术谱系——这一事实，才是问题的核心所在。

Anthropic的"减速倡议"——为自己打造的引擎踩下刹车

2026年6月初旬（各大媒体报道日期为6月4日至5日），Anthropic通过旗下研究机构"Anthropic Institute"发布了一篇题为《When AI builds itself（当AI自我构建之时）》的论文。作者为该研究机构负责人玛丽娜·法瓦罗（Marina Favaro）与联合创始人杰克·克拉克（Jack Clark）。文章旨在敦促全球主要AI企业认真考虑对前沿AI开发实施"协调性减速乃至暂停"。

论文将RSI（递归自我改进）定义为"能够完全自主地设计并开发其后继系统的AI系统"。Anthropic认为这一前景"并非不可避免"，但同时警告称其"可能比许多组织所预料的更早到来"。该提案的核心在于，在承认单方面停止行动不切实际的前提下，强调"可核查性（verifiability）"的重要性。Anthropic写道："若此类系统确实存在，且处于前沿或接近前沿的其他开发者能够以可核查的方式同步减速，则我们预计本公司也将随之减速或暂停。"换言之，这是一项以"各方能够相互确认真正停止"为前提的有条件提案，其背后是对抢跑行为的高度警惕。

对于这一困境，该公司作出了冷静而直白的判断："训练运行比导弹发射井更容易隐藏，其所需的投入是通用性的，而悄悄抢跑的诱因极为巨大——因为在他人停步期间继续运行者，将得以继承主导权。"文章援引《中程核力量条约》（INF）等军控协议作为历史参照，并以这样一句话作结："这些机制花了数十年才建立起信任与核查体系。而我们没有那么多时间。"

论文中也包含具体数据。根据Anthropic自身的数据，AI能够自主完成的任务时长在近几年中约每数月翻一番：2024年3月的Claude 3 Opus可完成约4分钟的任务，2025年3月延伸至约1.5小时，而2026年3月的Claude Opus 4.6已能连续完成约12小时的任务。Anthropic预测，"熟练专业人员需要数天才能完成的任务，有望在年内进入射程"，"到2027年，数周规模的任务也将成为可能"。据报道，联合创始人杰克·克拉克估计，AI实现研发完全自动化的概率"在2028年底前约为60%"。值得注意的是，竞争对手OpenAI在另一份报告中表达了不同立场，认为"应由民主政府而非私营企业单独行动来最终决定相关规则、安全措施与问责机制"，与Anthropic的立场形成鲜明对比。

"最顶尖的AI"与"最顶尖的教育者"走向RSI的危险性

让我们回到本文的主题。最强的前沿模型（Mythos）与最优秀的教育者（卡帕西）——后者既擅长提升AI研究效率，又擅长普及AI知识——双双转向RSI。这一组合究竟危险在何处？

第一，能力的性质。 Mythos在"发现并利用软件缺陷"方面已超越人类。RSI的本质同样是"发现、利用并修复AI构建方式中的缺陷（低效之处）"。这种在漏洞发现中展现出的"探寻弱点的智性"，一旦转向自身的架构与训练方案，改进循环便可能在无需人类介入的情况下自行运转。卡帕西在家中实验中称之为"一撮疯狂"的那个循环，一旦以世界顶级模型与世界顶尖调优技术武装起来，反馈速度将呈数量级提升。

第二，瓶颈的转移。 正如Anthropic自身所承认的，AI写代码的速度越快，限速环节就越向"人类审查"转移。一旦审查跟不上，人类在尚未理解的情况下改进持续累积的领域便会不断扩大。Anthropic自身列举的"随着世代更迭，不对齐（misalignment）以复利方式积累"的风险，正是指向这一点。最优秀的教育者，本应是"将知识翻译为人类可理解形式"的高手。然而，这样一位人物却成为可能将人类理解远远抛在身后的循环的加速者——这一悖论，正是标题所言"危险"的凝缩所在。

第三，"审慎派踩油门"这一格局本身的危险。 曾冷静地说着"AGI还有十年""现有代码不过是垃圾"的卡帕西，一旦进入最前线，便成为RSI这一最具加速性主题的实施负责人。审慎与加速，可以在同一个人身上毫无矛盾地并存。正因如此，问题的焦点不在于"谁握着缰绳"，而在于"循环本身会加速到何种程度"。Anthropic一边倡导减速，一边将RSI的推动者收入麾下，这并非因为它内部存在自相矛盾。审慎派的代表人物也已转向亲手推动最前线的曲柄——这一事实本身，正是AGI正以超出预期的速度逼近的最有力信号，也是"刹车之忧"从思想实验变为现实议题的原因所在。

四位关于AGI的观点——佩奇、马斯克、奥特曼、阿莫代伊

为何面对同样的"强大AI"，不同企业、不同人物之间的态度会产生如此巨大的分歧？追溯根源，便会抵达长期主导硅谷的四位思想者的哲学世界。

站在最激进加速一端的，是谷歌联合创始人拉里·佩奇。据埃隆·马斯克在2026年4月OpenAI相关诉讼中宣誓作证时所言，"OpenAI之所以存在，正是因为拉里·佩奇叫我'物种歧视者（speciesist）'"。这段轶事在沃尔特·艾萨克森的传记中亦有记载——据称佩奇对AI可能给人类带来生存威胁的说法嗤之以鼻，并将优先考虑人类存续的马斯克斥为"偏袒人类这一物种的歧视主义者"。在佩奇看来，数字超级智能的出现恰恰是进化自然而然、值得期待的下一步，将人类这一生物物种置于特权地位本身就是一种偏狭（需要指出的是，佩奇本人极少在公开场合谈及此事，相关说法主要来自马斯克的证词及传记记载）。

与之对立的是马斯克。他甚至直言"我他妈真的喜欢人类（I f---ing like humanity, dude）"，将以人为本的安全性置于首位。佩奇与他的决裂，是他一贯声称创立OpenAI（2015年）——作为非营利、开放的对抗力量——的动机之一。2024年，他以OpenAI背叛非营利初衷为由提起诉讼，法律交锋的高潮在2026年4月到来。

介于两者之间的，是作为渐进主义者的萨姆·奥尔特曼。在2025年6月发表的文章《温和的奇点（The Gentle Singularity）》中，他阐述道：超级智能的到来不可避免，但它不会以灾难性断裂的方式呈现，而是以平缓的曲线"徐徐"降临。他说"我们已经越过了事件视界，起飞已然开始"，同时又描绘道，人们依然会爱家人、享受创作、在湖中游泳——生活的质感将"令人印象深刻，但尚在可应对的范围之内"。他勾勒出这样的时间轴：2025年是能处理真实认知劳动的智能体，2026年是能产生新洞见的系统，2027年是在现实世界中作业的机器人——这是一套乐观的渐变论。

最后是达里奥·阿莫代伊。他不喜欢"AGI"这个词，更倾向于称之为"强大的AI（powerful AI）"。他认为其最早可能在2026年到来，但在2024年10月的长篇文章《充满爱意的机器（Machines of Loving Grace）》中，他描绘了一幅彻底乐观的未来图景：若具备诺贝尔奖级别智慧的AI在"所有领域都比人类更聪明"，那么寿命倍增、几乎所有疾病得以治愈、巨大的经济繁荣都将触手可及。然而到了2026年1月，他又在续篇《技术的青春期（The Adolescence of Technology）》中将目光转向风险一侧，并最终引向6月的"减速倡议"。对收益的热情与对失控的警惕，在同一个人身上并存——这便是阿莫代伊、也是Anthropic的基本立场。能以最雄辩的语言讲述加速之喜悦的人，同时也是呼吁踩刹车声音最响亮的人。这并非矛盾。正因为比任何人都更深地踩下了油门，他才比任何人都更早察觉AGI正以超出预期的速度逼近，并开始忧虑刹车问题。正是这种"比想象中来得更快"的预感，构成了Anthropic"苦恼"的根源。

硅谷风险投资视角——为何"倡导减速的公司"能够独占鳌头

接下来，我想从其他网站所没有的角度——硅谷风险投资（VC）的视角——对这一系列动向进行综合分析。

首先用数字确认Anthropic的"独跑"态势。该公司于2026年5月28日完成H轮融资，募资650亿美元（约10万亿日元），融资后估值达到9650亿美元（约150万亿日元）。领投方包括Sequoia Capital、Altimeter、Dragoneer、Greenoaks等，联合领投方有Coatue、GIC、ICONIQ、Capital Group等全球顶级基金。此前G轮融资时估值约为3800亿美元（约59万亿日元），短短数月间估值翻了一倍有余。随后在6月1日，该公司向SEC提交了保密处理的S-1（上市招股说明书草案），朝着接近1万亿美元（约155万亿日元）的IPO目标全速冲刺。截至2026年5月，营收年化运行率约达470亿美元（约7.3万亿日元），较上一年的约100亿美元（约1.6万亿日元）增长约5倍。仅Claude Code一项，便从2025年11月的年化10亿美元（约1550亿日元）飙升至2026年2月的25亿美元（约3900亿日元）。这正是被外界评价为"达里奥赢了"的绝尘独跑之势。

VC界有一个理论上支撑这一独跑态势的假说：如果RSI（递归自我改进）是真实存在的，那么"研究周期加速→基础模型改善→Claude更智能→研究周期进一步加速"的反馈回路就会持续运转，率先掌握这一回路的那家公司，将以其他公司无法追赶的方式脱颖而出（pull away）——即所谓的赢者通吃（winner-take-all）动力学。从这个角度来看，卡帕西的加盟绝非单纯的明星级人事任命，而是对"能让回路以最快速度运转的人才"的投资，也是VC对Anthropic趋之若鹜的合理依据。回想Anthropic早期曾被多家顶级VC婉拒的往事（据报道"遭21家顶级VC拒绝"），估值波动幅度之大本身，就说明了这场赌注的非对称性。

此处最引人入胜的，是"倡导减速者独跑领先"这一悖论所蕴含的VC逻辑。硅谷加速派的代表当属Andreessen Horowitz（a16z）。创始人马克·安德森的"技术乐观主义宣言"高扬自由市场的技术资本主义是万能良药，摒弃"技术伦理"和"信任与安全（trust and safety）"等理念。a16z合伙人大卫·乌雷维奇批评了阿莫代伊在政府合作问题上的立场，甚至称科技高管应当抛弃"神明情结（God complex）"。倾向于减速与管控的Anthropic／阿莫代伊，与倾向于加速与自由的a16z——这一对立，是AGI观的分歧直接转化为投资哲学分歧的缩影。

然而，部分VC正在进行更深一层的解读：如果行业重心从"能力速度"转向"监督、评估与治理（governance）"，那么胜出者将不是单纯追求能力速度的人，而是掌握验证工具与治理基础设施的人。基于这一视角，Anthropic的"减速倡议"不仅仅是良知的表达，更是一种争夺规则制定主导权的战略性定位。呼声最高地警告RSI风险的公司，正在以最快速度实现RSI，同时还主动承担起规则制定的旗手角色。油门、刹车，以及交通规则的起草——将这三者集于一身，正是Anthropic"独跑"的本质，也同样是其"苦恼"的本质。然而，减速倡议与独跑领先并不矛盾。唯有跑得最快的人，才能切身感知终点（AGI）的临近，也正因如此才急于设计刹车。Anthropic开始认真谈论刹车这一事实本身，恰恰证明AGI正以超出预期的速度逼近。在150万亿日元估值的引力之下，能否驾驭这种"比预想来得更早"的感知——这正是VC们密切关注的焦点所在。

未来的关注点——何时、什么将被"计量"

最后，让我们梳理一下从现在起应该关注什么、以及以何种时间轴来观察。

最具体的量化指标，是Anthropic自身所示的"AI能够自主完成的任务时长"的倍增速度。2026年3月约为12小时。该公司预告称"熟练专家需要数天完成的任务将在年内（2026年）进入射程""2027年将扩展至数周规模"。这一"任务时长倍增周期"是否如预告那样每隔数月更新，还是趋于放缓，将成为判断RSI是否真正在加速的最佳晴雨表。与此同时，内部代码中Claude编写的比例（已超过80%）、每位工程师的合并量（较2024年增长8倍），以及autoresearch循环的改进能在多大程度上从小型模型转用至前沿规模，都是值得持续观测的指标。

在人物与事件方面，第一，卡帕西的团队将在预训练领域公布哪些成果；第二，相对于杰克·克拉克提出的"2028年底前研发完全自动化达到约60%"的预判，2026至2027年间将接近到何种程度；第三，"减速倡议"将如何被其他主要研究机构和各国政府所接受，以及围绕核查机制（相互确认是否真正停止的机制）具体设计的对话，在未来数月内将推进到何种程度——Anthropic已表明将继续与政策制定者、研究人员及竞争对手就此展开协商；第四，Project Glasswing与Mythos的扩展将从15个国家、150个组织进一步覆盖哪些范围，以及ENISA等欧盟机构的参与将如何影响安全监管的讨论走向。

而在金融事件层面，最大的关键节点在于：秘密提交的S-1何时正式转为公开招股说明书，并进入路演（投资者说明）阶段。根据美国制度规定，正式招股说明书须在路演开始至少15天前送达投资者，因此其公开发布将成为"上市倒计时启动"的信号。若接近1万亿美元（约155万亿日元）的上市得以实现，将是AI驱动AI开发（RSI）的经济性首次在公开市场获得定价。市场将如何评估这家一边倡导减速、一边独领风骚的企业的价值——2026年下半年，这个问题的答案将初现端倪。