为什么硅谷的工程师选择袖手旁观

2026年4月1日清晨,Claude Code的源代码(并非后端,而是前端CLI工具部分)遭到泄露。这是继2025年2月之后的第二次,但硅谷的工程师们对此保持观望态度。

这或许意味着,以Claude Code为首的AI已经具备理解机器语言(二进制/汇编)的能力,隐藏发行模块源代码已毫无意义,Anthropic似乎在传递这样一个信息:即便被还原也无妨。实际上,Gemini也表示"即使使用了混淆工具,2026年的AI识破它的概率也在不断提升"。

2025年2月首次泄露时,Geoffrey Huntley公开了一个洁净室方式的反混淆项目,并如此表示:

"这些LLM在反混淆、转译、结构间转换方面出乎意料地擅长。"

一年后,这句话愈发显得分量十足。2026年的AI已大幅提升了从二进制还原源代码的能力。我们自以为"隐藏着"的源代码,真的被隐藏了吗?问题已不再是"能否用AI还原源代码",而是"能以怎样的精度、还原到何种程度"。

AI驱动的二进制→源代码还原——2026年的技术现状

LLM4Decompile——基于专用模型的二进制反编译

LLM4Decompile是一款专为从二进制代码还原源代码而设计的开源LLM。它提供从1.3B到33B的参数规模,支持GCC O0至O3优化级别的Linux x86_64二进制文件。

其性能正在快速演进。6.7B模型在HumanEval基准测试中达到45.4%的精度,6B模型记录了90%的可重新编译率——即还原的C代码中有90%能够通过编译——这比GPT-4提升了50%。此外,最新的LLM4Decompile-9Bv2将可重新执行率进一步提升至64.94%。还原代码中约三分之二能够再现原程序的相同输入输出。

Decompile-Bench项目提供了百万级规模的二进制-源代码函数对,以真实世界数据训练的LLM4Decompile与仅使用合成数据训练的情况相比,R2I得分高出21.5%。用真实代码训练,就能更准确地还原真实代码——这是理所当然的结论,但其效果之显著仍值得关注。

Mizuchi——字节级完全匹配的反编译

2026年问世的Mizuchi,是一款利用Claude API实现的自动化匹配反编译流水线。该工具的目标是:将还原的C代码编译后,得到与原始二进制文件字节级完全一致的输出。

上下文感知的重试机制将编译错误反馈给LLM,并自动反复修正。最终在60个函数中的53个——88%的一致性——实现了相同结果。这不仅仅是"看似合理地"还原源代码,而是能够忠实再现包括编译器优化模式在内的原始实现。

ReCopilot与SK2Decompile——语义还原的演进

2025年发布的ReCopilot,在函数名还原和变量类型推断方面比现有工具和LLM高出13%的性能。对二进制进行反编译时,最容易丢失的是变量名、函数名、类型信息等语义信息。ReCopilot专注于这一领域,致力于推动代码"可读性"的还原。

SK2Decompile(2025年10月)采用结构还原(Structure Recovery)与标识符命名(Identifier Naming)两阶段方法,将二进制/伪代码转换为人类可读水平的源代码。

humanify——AI辅助还原混淆JavaScript

专注于JavaScript/TypeScript去混淆的humanify,利用LLM(ChatGPT、llama等)在保持语义的同时还原变量名和函数名。它在Babel AST层面进行结构转换,由LLM提供命名线索——即语法转换采用确定性方式,语义还原交由AI处理的混合方案。

对于像Claude Code这样经过打包和压缩的JavaScript包,这种方法极为有效。即使变量名被缩短为abc,LLM也能从上下文中高精度地推断出pageselectortimeout等原始名称。

具体的还原步骤——用AI将二进制文件逆向还原为源代码的实际工作流程

截至2026年,使用AI进行逆向工程的实际工作流程由以下五个步骤构成。

步骤1:反汇编/反编译。将二进制文件导入Ghidra或IDA Pro,获取伪代码(反编译器输出)。Ghidra 11.2(2025年下半年发布)强化了AI辅助分析,IDA Pro 8.5将反编译器精度提升了23%。此阶段获得的是编译器生成的低级伪C代码——变量名已丢失,控制流因优化而变形。

步骤2:AI助手辅助分析。DAILA(Decompiler Artificially Intelligent Language Assistant)是一款将GPT-4、Claude及本地模型集成到Ghidra/IDA Pro中的插件。NDSS 2026(网络与分布式系统安全研讨会)论文《Decompiling the Synergy: An Empirical Study of Human-LLM Teaming in Software Reverse Engineering》实证了人类与LLM协作进行逆向工程的有效性。DAILA只需点击一个按钮,即可将反编译器输出发送给LLM,并获得函数语义、变量名推测及漏洞提示。

步骤3:以函数为单位的高精度还原。将反汇编结果导入LLM4Decompile或Mizuchi,还原C源代码。Mizuchi的上下文感知重试机制可自动修正编译错误,在88%的函数中实现字节级完全匹配。Claude的"一次性反编译"在游戏(Snowboard Kids 2)的分析中,以较高的匹配率还原了1,000个以上的函数

步骤4:语义信息还原。变量名、函数名、注释及类型注解的推断是LLM最擅长的领域。ReCopilot在函数名还原和变量类型推断方面比现有方法高出13%。humanify可根据上下文还原经过压缩混淆的JavaScript变量名。经过这一阶段,代码从"编译器输出"转变为"看起来像人类编写的源代码"。

步骤5:验证与迭代。将还原后的代码编译,并与原始二进制文件进行比对。若存在差异,则将该信息反馈给LLM并反复修正。Mizuchi将这一过程完全自动化——无需人工干预,从二进制到源代码,再从源代码到字节级完全匹配的二进制文件,整个循环得以持续运转。

可恢复的节点与当前的局限性

整理2026年AI擅长的还原点以及仍然困难的领域。

可高精度还原的内容:

  • 控制流(if/else、for/while循环、switch语句)的结构
  • 函数的调用关系与参数
  • 数值运算、字符串操作的逻辑
  • 标准库的函数调用模式
  • 变量名·函数名的语义推断(根据上下文)
  • 注释的推测(根据处理内容以自然语言生成)

难以还原的内容:

  • 宏展开前的预处理器定义
  • 模板元编程的原始结构
  • 高度优化的数值计算(SIMD指令等)
  • 应用了三层以上多重混淆的代码(但Claude Opus 4.5可达24%)
  • 施加了自定义加密或打包的二进制文件

混淆 vs AI——10个模型的基准测试

挪威应用安全公司Promon在2026年Q1的《App Threat Report》中公布了一项重要基准测试。他们让10个AI模型对阵经Obfuscator-LLVM(OLLVM)混淆处理的二进制文件。测试对象包括:Claude Opus 4.5、Sonnet 4.5、Haiku 4.5、GPT-5、GPT-4o、Gemini 3 Pro、3 Flash、2.5 Pro、DeepSeek Chat及DeepSeek Reasoner。

针对未混淆(纯净)ARM汇编的平均成功率为63.7%。没有任何模型超过86%。这意味着,即使没有混淆,AI也无法完全理解汇编代码。

应用三重混淆(SUB+FLA+BCF)后,针对x86二进制文件的平均成功率降至20~36%,针对ARM二进制文件则降至8.5%。FLA(控制流平坦化)与BCF(虚假分支插入)的组合,相较BCF单独使用,在x86上形成了4.18倍、ARM上形成了5.50倍的更强壁垒。

值得关注的是Claude Opus 4.5的表现。面对三重混淆ARM二进制文件,其通过伪代码还原的成功率达50%,通过原始汇编还原的成功率达24%。GPT-4o的成绩为伪代码10%、原始汇编2%,而较弱的模型仅停留在1~2%。Claude Opus 4.5将第二名以下远远甩在身后。

Promon的结论是:军备竞赛并未结束,而是在持续演进。但其走向是单向的。从2025年GPT-4o的2%,到Claude Opus 4.5的24%——一年内实现了12倍的提升。如果这一增长曲线持续下去,多层混淆的有效期将以年为单位不断缩短。

从VC的视角——"功能护城河已死"

硅谷的风险投资人已清醒地认识到,依赖源代码保密的商业模式正走向终结。

TechCrunch于2026年3月报道的投资人言论颇具代表性。

"AI智能体目前能做的一切,都'相当无聊'。"

"所有功能性护城河——UI、后端逻辑、API集成——几乎已被压缩至零。当LLM将界面商品化之后,剩下的只有纯粹的数据价值。如果数据不具备独特性,什么都不会留下。"

在a16z的投资组合中,拥有以独有数据构建的护城河的企业,正以最快速度实现从零到一亿美元的营收。a16z主导了AI时代知识产权保护平台Story Protocol(PIP Labs)的B轮融资8000万美元,Marc Andreessen表示:"开源AI应自由传播、自由竞争。"

另一位投资人直击核心。

"当任何人都能在一夜之间构建任何东西时,AI无法复制的唯一护城河,就是SEO、品牌、品味、速度、数据和信任。防御力如今不在于技术上的不透明,而在于关系的深度。"

不具备独有数据护城河的通用垂直SaaS,已不再受风险投资人青睐。在代码可被还原的世界里,代码本身已不再是竞争优势。

企业应采取的措施——2026年软件知识产权保护战略

面对AI逆向工程的演进,企业应采取哪些应对措施。从技术、法务、战略三个维度加以梳理。

技术对策

1. 全面迁移至服务器端执行。最可靠的对策,是将专有逻辑从客户端设备中彻底剥离。通过API优先架构,客户端仅保留轻量前端。若逆向工程的对象在物理上根本不存在,自然无从还原。颇具讽刺意味的是,Claude Code本身正是采用了这一架构——泄露的只是前端CLI工具部分,AI模型本身仍运行在Anthropic的服务器之上。

2. 机密计算(Confidential Computing)。Gartner预测,到2029年,在不受信任基础设施上处理的数据中,75%以上将采用机密计算技术。AMD、Intel基于硬件的可信执行环境(TEE),不仅能保护存储中和传输中的数据,还能在处理过程中提供保护。HPE于2026年3月宣布将Confidential Computing集成至Morpheus Software。

3. 维持多层混淆(作为争取时间的手段)。正如Promon报告所示,FLA与BCF的组合对AI仍具有有效的防护作用。针对三重混淆ARM二进制文件的平均攻破成功率为8.5%。但这并非根本解决方案,而只是争取时间的手段,其有效期每年都在缩短。

4. 原生客户端认证与证明(Attestation)。在硬件层面对合法客户端进行认证。泄露的Claude Code本身也实现了一套类DRM的认证系统,采用Bun的Zig HTTP栈构建。然而,一旦源代码泄露,该机制同样会被绕过——因为认证本身的实现也将成为还原的对象。

法律对策

5. 更新营业秘密法律保护策略。美国的《保护商业秘密法》(DTSA)和各州的《统一商业秘密法》(UTSA)是主要法律保护手段,但AI正在从根本上改变"容易确定(readily ascertainable)"这一标准。Greenberg Traurig律师事务所对此发出警告:

"2023年之前制定商业秘密保护方案的企业,很可能完全没有将AI纳入考量。"

过去被认定为"不易确定"的软件内部逻辑,一旦可通过AI轻易获取,就面临丧失商业秘密法律保护的风险。

6. 利用判例。摩托罗拉诉海能达案(Motorola v. Hytera,2025年)驳回了"重新设计"抗辩,并判令支付7000万美元的额外版税。该先例有可能同样适用于经AI修改的非法获取代码。法院已开始将提示注入与合法逆向工程区分认定为"不正当手段"。

7. 应对加利福尼亚州AI透明度法(2026年1月施行)。该法律要求披露训练数据摘要。企业需要建立监控机制,以追踪自身代码是否被纳入AI训练数据。

战略对策

8. 构建数据护城河。正如风险投资人异口同声所指出的,在代码可被还原的世界里,专有数据才是唯一可持续的竞争优势。专有数据集、与客户的深度关系、网络效应——这些都是AI无法在一天之内复制的。

9. 以速度与迭代效率取胜。即便代码被还原,只要具备每周持续演进产品的速度,追随者始终只能落后一步。Claude Code本身就是最好的佐证——即使源代码泄露,ARR 25亿美元的增长势头也未曾停止。原因在于,价值并不在于代码,而在于后端的AI模型。

10. 转向"以被还原为前提的设计"理念。看似矛盾,但最稳健的策略恰恰是以源代码泄露为前提来设计架构。分发给客户端的代码不包含任何专有知识产权,所有差异化要素一律置于服务器端。也可以借鉴Red Hat或HashiCorp的BSL模式,将代码开放,同时通过支持服务、托管和企业级功能实现商业变现。

积极的展望与消极的展望

从积极的角度来看,源代码保密性的无效化有可能提升整个软件产业的透明度与安全性。隐藏的后门和漏洞变得更容易被AI发现,这对网络安全而言是一种正向反馈。正如开源运动所表明的那样,透明度能够加速创新。

从消极的角度来看,知识产权保护的弱化可能会损害研发激励,尤其是对初创企业和中小企业而言。若耗费巨额开发成本的软件能够被轻易还原,那么专有软件的投资回收模式将难以为继。此外,恶意软件分析变得更加容易,而正规软件的保护也随之愈发困难,这正是一把双刃剑。

Claude Mythos(弥索斯)——"神话"所指向的未来

就在Claude Code源代码泄露的仅仅5天前,Anthropic下一代模型Claude Mythos(弥索斯)的存在通过信息泄露被披露。LayerX Security的Roy Paz与剑桥大学的Alexandre Pauwels,从一个因CMS配置错误而可被公开检索的数据库中发现了约3,000个文件。

Mythos是位于Opus之上的全新类别,而非版本升级。关于这个冠以"神话"之名的模型,内部文件如此描述:

"目前在网络能力方面已大幅超越其他所有AI模型。"

Mythos在Linux内核中发现了多个堆缓冲区溢出漏洞,内部文件记录道:

"语言模型能够自主地、无需复杂脚手架地,发现并利用极为关键软件中的零日漏洞。"

Anthropic非正式地向政府官员发出警告,称Mythos"将在2026年大幅提高大规模网络攻击的可能性"。

请在此停下来思考一下。对于一个能够自主发现Linux内核零日漏洞的模型而言,分析经过混淆的JavaScript打包文件——或者反编译经O3优化的二进制文件——究竟有多大的"难度"?

在Promon的基准测试中,Claude Opus 4.5对三重混淆ARM二进制文件达到了24%的成绩。而Mythos位于其上位类别。如果LLM4Decompile的9B模型已能达到64.94%的可重新执行率,那么当Mythos级别的模型挑战同一任务时,能达到百分之几?80%?90%?还是更高?

结论——我们的信源究竟是否被隐藏

Claude Code的51.2万行TypeScript源代码因.npmignore配置疏漏而外泄。然而,即便没有外泄,这个问题的答案也是一样的。

LLM4Decompile已实现64.94%的可重新执行率。Mizuchi在88%的函数上实现了字节完全一致的反编译。Claude Opus 4.5对三重混淆ARM二进制文件的还原成功率达到24%——是GPT-4o的12倍。而Claude Mythos即将到来——一个超越Opus、冠以"神话"之名的全新级别。

本地分发模块的源代码,已无从隐藏。

我们编译、混淆、压缩、打包的代码,在AI面前不过是薄薄的一层雾。这层雾年复一年地消散,终将消失殆尽。

企业应采取的行动已然明确:将核心逻辑迁移至服务端,客户端分发的内容应以"终将被还原"为前提进行设计。竞争优势不在于隐藏代码,而在于数据的独特性、客户关系的深度以及迭代的速度。

Anthropic发出的这一"信号"是否出于故意,已不再重要。重要的是,我们要扪心自问——我们的源代码,究竟有没有真正被隐藏?

对行业的影响

第一,软件IP保护的经济学正在发生不可逆转的变化。与其花费成本进行混淆处理和代码隐藏,不如将资源投入到服务器端执行和数据护城河的构建中——这样的时代已经到来。正如Promon报告所示,多层混淆作为拖延手段仍然有效,但考虑到AI的进化速度,其有效期将持续以年为单位缩短。

第二,Anthropic的财务成功在这一背景下具有重大意义。仅Claude Code一项就在9个月内实现了25亿美元的ARR,即便源代码泄露,增长也未曾停止。这是"无法隐藏源代码的世界"中生存策略的有力验证。价值不在于前端代码,而在于后端AI模型与数据。

第三,风险投资的决策方向已明显转变。不具备独有数据护城河的通用型SaaS正逐渐退出投资视野,正如a16z向Story Protocol(IP保护平台)投资8000万美元所示,"AI时代的IP保护"本身已成为新的投资主题。

第四,法律框架的更新迫在眉睫。AI改变了"易于确认"的认定标准,商业秘密的法律保护面临被削弱的风险。Motorola v. Hytera判决作为先例具有重要意义,但针对AI时代的专项立法尚在起步阶段。

第五,Claude Mythos的存在预示着这一变化将加速到来。若能自主发现零日漏洞的模型得到普及,一切二进制文件实际上都将成为开源的世界将会成为现实。在那个世界中,能够生存下来的,是那些凭借数据与关系而非代码实现差异化的企业。


参考资料:Axios《Anthropic leaked its own Claude source code》(2026/3/31),VentureBeat《Claude Code's source code appears to have leaked》(2026/3/31),Fortune《Anthropic leaks source code in second major security breach》(2026/3/31),The Hacker News《Claude Code Source Leaked via npm》(2026/4),Bleeping Computer《Claude Code source accidentally leaked in npm package》(2026/4),Layer5《512,000 Lines and the Fastest-Growing Repo in GitHub History》(2026/4),Geoffrey Huntley《Claude Code deobfuscation tradecraft》(2025/3),Fortune《Anthropic Mythos revealed in data leak》(2026/3/26),Euronews《Mythos poses unprecedented cybersecurity risks》(2026/3/30),Futurism《Anthropic leaked model with unprecedented risks》(2026/3),CoinDesk《Anthropic massive Claude Mythos leak》(2026/3/27),GitHub: LLM4Decompile(albertan017/LLM4Decompile),BrightCoding《Mizuchi LLM Pipeline for Perfect Decompilation》(2026/3),arxiv: ReCopilot(2505.16366v1),RevEng.AI《Training an LLM to Decompile Assembly Code》,arxiv: LLM4Decompile paper(2403.05286v2),GitHub: humanify(jehna/humanify),GitHub: DAILA(mahaloz/DAILA),NDSS 2026《Decompiling the Synergy: An Empirical Study of Human-LLM Teaming in Software Reverse Engineering》,Secybers《Ghidra vs IDA Pro 2026》,Promon《App Threat Report 2026 Q1: The State of Code Obfuscation Against AI》,Promon《AI deobfuscators won't help hackers yet》,Google Cloud Blog《Scaling Up Malware Analysis with Gemini 1.5 Pro》,Google Cloud Blog《Gemini for Malware Analysis》,TechCrunch《Investors spill what they aren't looking for in AI SaaS》(2026/3),CNBC《Story raises funds from a16z to stop IP theft by AI》(2024/8),KoreaTechDesk《a16z $80M for IP Protection in Age of AI》,Greenberg Traurig《Reverse Engineering in the Age of AI: Are Your Trade Secrets Still Safe?》(2025/12),Intel Confidential Computing Whitepaper(2025),HPE Security Advancements(2026/3),JDSupra《2025 AI and Trade Secret Law Retrospective》,Anthropic《acquires Bun as Claude Code reaches $1B milestone》(2025/12),Yahoo Finance《Anthropic ARR surges to $19 billion》(2026),TechCrunch《Anthropic raises $30B Series G at $380B valuation》(2026/2)