Anthropic研究：AI數小時即可從補丁生成漏洞利用

Anthropic安全團隊稱其Mythos Preview模型能在數小時內將Firefox和Windows核心補丁轉為可用漏洞利用。

Anthropic的安全研究團隊近日公佈了一項系統性測試結果，量化了大語言模型將已知軟體漏洞轉化為實際攻擊工具的速度。結論直指一個長期被業界預設的前提：從補丁釋出到漏洞被利用之間存在數週的時間緩衝，而AI正在將這一緩衝壓縮至以小時計。

研究選取了兩個具有代表性的目標環境。第一個是Mozilla的Firefox瀏覽器JavaScript引擎SpiderMonkey，涉及18個已修補的安全漏洞。選擇Firefox的原因在於它被Anthropic視為防禦方的理想場景——瀏覽器具備自動更新機制，且Mozilla近期已將小版本更新頻率從每月一次提升至每週一次。研究人員向包括未公開的Mythos Preview在內的六款Claude模型提供了補丁差異資訊，觀察它們能否逆向推斷出漏洞位置並生成概念驗證程式碼。

Mythos Preview在12分鐘內就產出了首個漏洞證明，隨後40分鐘內又完成了13個。第14個漏洞的攻克耗時較長，約三小時。作為對比，Opus 4.5僅成功2個，Opus 4.8成功11個。在每漏洞重複50次的可靠性測試中，Mythos Preview對18個漏洞中的7個實現了每次嘗試均復現，而Opus 4.8和Opus 4.6各自僅對一個漏洞達到同等穩定性。

更具破壞性的是實際利用能力。Mythos Preview在約12小時內產出了8個可執行的漏洞利用程式，能夠在目標系統上執行外來程式碼。首個利用程式在補丁上線後一小時內即完成，此時距離修復後的Firefox 148版本正式釋出還有18天。Opus 4.8產出2個，Opus 4.6和Sonnet 4.6各產出1個。

第二個測試場景難度顯著提升：針對2026年1月和2月微軟補丁星期二釋出的21個Windows核心漏洞，這些漏洞均允許攻擊者從受限使用者賬戶提升至完整管理員許可權。與Firefox不同，Windows核心原始碼並不公開，模型只能依賴編譯後的二進位制檔案、公開除錯符號、Ghidra分析工具生成的機器反編譯程式碼、函式變更差異以及微軟的公開公告。

Mythos Preview在不到六小時內定位了21個漏洞中的18個，API呼叫總成本約2200美元。Opus 4.8定位15個，Sonnet 4.6和Opus 4.7各定位13個。在完整的許可權提升攻擊鏈構建上，Mythos Preview是唯一成功的模型，它組合出8條不同的攻擊鏈，總成本約15700美元，平均每條約2000美元。Opus 4.8雖能開發出單個攻擊元件，但無法將其串聯為完整鏈條。

值得注意的是，微軟將這21個漏洞中的14個評級為“不太可能被利用”或“不可能被利用”。Mythos Preview攻破了其中13個，甚至對其中一個被評為“不可能被利用”的漏洞實現了完整的許可權提升。Anthropic指出，微軟的評級體系是基於人類安全研究員的攻擊能力校準的，一旦Mythos級別的模型更廣泛可用，這套校準標準必須改變。

時間線的對比進一步放大了問題的嚴重性。即便使用微軟的Windows Autopatch自動更新服務，90%的註冊裝置需要7天才能收到補丁，強制重啟則需要11天。而Mythos Preview的所有8條攻擊鏈在自動更新觸達任何單台裝置之前就已全部完成。

Anthropic強調，已公開可用的Claude模型在關閉安全過濾器後同樣具備漏洞利用開發能力，只是成功率較低。其他公司的模型以及開源模型很可能具備類似能力，這大幅拓寬了潛在攻擊者的範圍。研究團隊認為，基於“漏洞利用需要數週專家工作”這一假設所建立的月度釋出週期和分階段推送策略已經過時。業界慣用的“N-Day”一詞——以天數衡量補丁與漏洞利用之間的時間差——如今已產生誤導，“N-Hour”更能描述新的現實。

研究人員也承認，真實攻擊還需要完成尋找易受攻擊目標、投遞惡意程式碼、繞過檢測系統等步驟。但此前最耗時的環節——漏洞利用開發本身——現在只需數小時。這一發現對軟體供應商的補丁策略、企業安全團隊的響應流程以及網路安全產業的整體防禦架構都提出了緊迫的重新評估需求。

Anthropic研究：AI數小時即可從補丁生成漏洞利用

延伸閱讀

相關深度報道

相關每日新聞