一場圍繞AI模型出口管制的爭議正在美國網絡安全圈迅速升溫。數十名網絡安全資深從業者聯合發表公開信,敦促白宮撤銷針對Anthropic旗下兩款前沿模型Fable與Mythos的出口限制令,直言這一決策正在將最強大的防禦工具從安全團隊手中奪走。

公開信措辭嚴厲地指出,在對手快速推進攻擊能力的背景下,將最佳模型能力從防禦方剝離且缺乏充分理由,是“危險”的舉動。信中強調,網絡安全防禦者原本可以利用這些模型高效地發現漏洞、加固軟件與產品,而管制令直接切斷了這一關鍵能力供給。

事件的導火索發生在上週五。美國政府以國家安全為由,下令Anthropic限制Fable與Mythos的出口,但據Anthropic方面透露,政府並未詳細解釋具體原因。作為回應,Anthropic隨即暫停了這兩款模型在全球範圍內對所有用戶的訪問權限。

截至公開信發佈時,已有76名網絡安全專家簽名支持,陣容堪稱豪華。其中包括前Facebook安全主管Alex Stamos、漏洞賞金平臺Bugcrowd創始人Casey Ellis、知名密碼學家兼前蘋果安全設計架構經理Jon Callas、計算機科學家Paul Vixie、Block前應用安全工程負責人Dino Dai Zovi、Luta Security創始人Katie Moussouris,以及安全意識培訓公司SocialProof Security首席執行官Rachel Tobac等業界重量級人物。

Mythos模型自今年4月以預覽版形式推出時,Anthropic就曾宣稱其在發現安全漏洞方面能力極為強大,以至於公司必須嚴格限制訪問,以防惡意黑客或外國對手利用其在互聯網上製造混亂。在實際操作中,Anthropic最初僅向約50家公司開放Mythos的初始訪問權限,近期才將範圍擴大至15個國家的約150家組織。

上週,Anthropic發佈了Fable模型,定位為Mythos的公開版本。公司聲稱Fable內置了嚴格的防護欄,旨在阻止其在生物、化學和網絡安全領域的應用,同時防止他人通過蒸餾等手段重建模型。然而這些防護欄在實際使用中顯得過於嚴苛,許多網絡安全專家發現,Fable幾乎攔截了所有與網絡安全相關的提示請求,導致其在實際防禦場景中難以發揮作用。

據Anthropic透露,白宮的出口管制令可能源於一份報告,該報告聲稱存在一種方法可以繞過Fable的防護欄,即所謂的“越獄”,從而解鎖其強大的Mythos級別能力。

公開信簽署人之一Katie Moussouris進一步揭示了這一說法的來源。她指出,該方法由亞馬遜研究人員在一篇尚未公開的論文中展示,她本人已審閱過該論文。但Moussouris在一篇博文中明確表示,該論文實際上並未展示真正的越獄行為。她描述道,研究人員只是在模型最初拒絕“審查代碼安全問題時”,轉而要求Fable修復包含公開已知漏洞以及“故意植入漏洞”的開源代碼。

Moussouris認為,論文中描述的行為無法被有意義地修復,任何修復嘗試都只會削弱模型的防禦能力。她寫道:“防禦者需要能夠要求AI修復文件中的漏洞、解釋修復的重要性,並編寫測試以確認補丁有效。這不是防護欄繞過,而是AI模型能為防禦性安全所做的最有價值的事情——執行防禦者每天都在運行的查找、修復和測試循環。”

這一觀點在公開信中得到呼應。信中還指出,專家們認為亞馬遜論文中的方法可以在OpenAI的GPT-5.5、Anthropic自身公開可用的Claude Opus 4.8與Sonnet,乃至中國模型如Kimi 2.7上覆現。這暗示問題並非Anthropic模型獨有,而是當前大語言模型在安全防護機制上的普遍挑戰。

公開信進一步提出政策訴求,要求建立透明、公平執行的監管規則,這些規則應通過“民主的規則制定程序”產生,並以產業界和學術界專家的科學研究為基礎,且“僅在確保美國公眾安全所必需的最小限度內使用”。

這場爭議折射出AI治理中的一個深層矛盾:如何在防止先進模型被惡意利用與保障合法防禦需求之間取得平衡。對於AI產業投資者而言,出口管制政策的走向將直接影響模型層企業的商業化路徑與全球市場佈局。過於寬泛的限制可能削弱美國AI企業在國際市場的競爭力,同時催生更多繞過管制的灰色渠道;而過於寬鬆則可能引發國家安全層面的擔憂。此次網絡安全界的集體發聲,或將推動政策制定者重新審視管制令的合理邊界與實施細則。