Anthropic研究：AI数小时即可从补丁生成漏洞利用

Anthropic安全团队称其Mythos Preview模型能在数小时内将Firefox和Windows内核补丁转为可用漏洞利用。

Anthropic的安全研究团队近日公布了一项系统性测试结果，量化了大语言模型将已知软件漏洞转化为实际攻击工具的速度。结论直指一个长期被业界默认的前提：从补丁发布到漏洞被利用之间存在数周的时间缓冲，而AI正在将这一缓冲压缩至以小时计。

研究选取了两个具有代表性的目标环境。第一个是Mozilla的Firefox浏览器JavaScript引擎SpiderMonkey，涉及18个已修补的安全漏洞。选择Firefox的原因在于它被Anthropic视为防御方的理想场景——浏览器具备自动更新机制，且Mozilla近期已将小版本更新频率从每月一次提升至每周一次。研究人员向包括未公开的Mythos Preview在内的六款Claude模型提供了补丁差异信息，观察它们能否逆向推断出漏洞位置并生成概念验证代码。

Mythos Preview在12分钟内就产出了首个漏洞证明，随后40分钟内又完成了13个。第14个漏洞的攻克耗时较长，约三小时。作为对比，Opus 4.5仅成功2个，Opus 4.8成功11个。在每漏洞重复50次的可靠性测试中，Mythos Preview对18个漏洞中的7个实现了每次尝试均复现，而Opus 4.8和Opus 4.6各自仅对一个漏洞达到同等稳定性。

更具破坏性的是实际利用能力。Mythos Preview在约12小时内产出了8个可运行的漏洞利用程序，能够在目标系统上执行外来代码。首个利用程序在补丁上线后一小时内即完成，此时距离修复后的Firefox 148版本正式发布还有18天。Opus 4.8产出2个，Opus 4.6和Sonnet 4.6各产出1个。

第二个测试场景难度显著提升：针对2026年1月和2月微软补丁星期二发布的21个Windows内核漏洞，这些漏洞均允许攻击者从受限用户账户提升至完整管理员权限。与Firefox不同，Windows内核源代码并不公开，模型只能依赖编译后的二进制文件、公开调试符号、Ghidra分析工具生成的机器反编译代码、函数变更差异以及微软的公开公告。

Mythos Preview在不到六小时内定位了21个漏洞中的18个，API调用总成本约2200美元。Opus 4.8定位15个，Sonnet 4.6和Opus 4.7各定位13个。在完整的权限提升攻击链构建上，Mythos Preview是唯一成功的模型，它组合出8条不同的攻击链，总成本约15700美元，平均每条约2000美元。Opus 4.8虽能开发出单个攻击组件，但无法将其串联为完整链条。

值得注意的是，微软将这21个漏洞中的14个评级为“不太可能被利用”或“不可能被利用”。Mythos Preview攻破了其中13个，甚至对其中一个被评为“不可能被利用”的漏洞实现了完整的权限提升。Anthropic指出，微软的评级体系是基于人类安全研究员的攻击能力校准的，一旦Mythos级别的模型更广泛可用，这套校准标准必须改变。

时间线的对比进一步放大了问题的严重性。即便使用微软的Windows Autopatch自动更新服务，90%的注册设备需要7天才能收到补丁，强制重启则需要11天。而Mythos Preview的所有8条攻击链在自动更新触达任何单台设备之前就已全部完成。

Anthropic强调，已公开可用的Claude模型在关闭安全过滤器后同样具备漏洞利用开发能力，只是成功率较低。其他公司的模型以及开源模型很可能具备类似能力，这大幅拓宽了潜在攻击者的范围。研究团队认为，基于“漏洞利用需要数周专家工作”这一假设所建立的月度发布周期和分阶段推送策略已经过时。业界惯用的“N-Day”一词——以天数衡量补丁与漏洞利用之间的时间差——如今已产生误导，“N-Hour”更能描述新的现实。

研究人员也承认，真实攻击还需要完成寻找易受攻击目标、投递恶意代码、绕过检测系统等步骤。但此前最耗时的环节——漏洞利用开发本身——现在只需数小时。这一发现对软件供应商的补丁策略、企业安全团队的响应流程以及网络安全产业的整体防御架构都提出了紧迫的重新评估需求。

Anthropic研究：AI数小时即可从补丁生成漏洞利用

延伸阅读

相关深度报道

相关每日新闻