一场围绕AI模型出口管制的争议正在美国网络安全圈迅速升温。数十名网络安全资深从业者联合发表公开信,敦促白宫撤销针对Anthropic旗下两款前沿模型Fable与Mythos的出口限制令,直言这一决策正在将最强大的防御工具从安全团队手中夺走。

公开信措辞严厉地指出,在对手快速推进攻击能力的背景下,将最佳模型能力从防御方剥离且缺乏充分理由,是“危险”的举动。信中强调,网络安全防御者原本可以利用这些模型高效地发现漏洞、加固软件与产品,而管制令直接切断了这一关键能力供给。

事件的导火索发生在上周五。美国政府以国家安全为由,下令Anthropic限制Fable与Mythos的出口,但据Anthropic方面透露,政府并未详细解释具体原因。作为回应,Anthropic随即暂停了这两款模型在全球范围内对所有用户的访问权限。

截至公开信发布时,已有76名网络安全专家签名支持,阵容堪称豪华。其中包括前Facebook安全主管Alex Stamos、漏洞赏金平台Bugcrowd创始人Casey Ellis、知名密码学家兼前苹果安全设计架构经理Jon Callas、计算机科学家Paul Vixie、Block前应用安全工程负责人Dino Dai Zovi、Luta Security创始人Katie Moussouris,以及安全意识培训公司SocialProof Security首席执行官Rachel Tobac等业界重量级人物。

Mythos模型自今年4月以预览版形式推出时,Anthropic就曾宣称其在发现安全漏洞方面能力极为强大,以至于公司必须严格限制访问,以防恶意黑客或外国对手利用其在互联网上制造混乱。在实际操作中,Anthropic最初仅向约50家公司开放Mythos的初始访问权限,近期才将范围扩大至15个国家的约150家组织。

上周,Anthropic发布了Fable模型,定位为Mythos的公开版本。公司声称Fable内置了严格的防护栏,旨在阻止其在生物、化学和网络安全领域的应用,同时防止他人通过蒸馏等手段重建模型。然而这些防护栏在实际使用中显得过于严苛,许多网络安全专家发现,Fable几乎拦截了所有与网络安全相关的提示请求,导致其在实际防御场景中难以发挥作用。

据Anthropic透露,白宫的出口管制令可能源于一份报告,该报告声称存在一种方法可以绕过Fable的防护栏,即所谓的“越狱”,从而解锁其强大的Mythos级别能力。

公开信签署人之一Katie Moussouris进一步揭示了这一说法的来源。她指出,该方法由亚马逊研究人员在一篇尚未公开的论文中展示,她本人已审阅过该论文。但Moussouris在一篇博文中明确表示,该论文实际上并未展示真正的越狱行为。她描述道,研究人员只是在模型最初拒绝“审查代码安全问题时”,转而要求Fable修复包含公开已知漏洞以及“故意植入漏洞”的开源代码。

Moussouris认为,论文中描述的行为无法被有意义地修复,任何修复尝试都只会削弱模型的防御能力。她写道:“防御者需要能够要求AI修复文件中的漏洞、解释修复的重要性,并编写测试以确认补丁有效。这不是防护栏绕过,而是AI模型能为防御性安全所做的最有价值的事情——执行防御者每天都在运行的查找、修复和测试循环。”

这一观点在公开信中得到呼应。信中还指出,专家们认为亚马逊论文中的方法可以在OpenAI的GPT-5.5、Anthropic自身公开可用的Claude Opus 4.8与Sonnet,乃至中国模型如Kimi 2.7上复现。这暗示问题并非Anthropic模型独有,而是当前大语言模型在安全防护机制上的普遍挑战。

公开信进一步提出政策诉求,要求建立透明、公平执行的监管规则,这些规则应通过“民主的规则制定程序”产生,并以产业界和学术界专家的科学研究为基础,且“仅在确保美国公众安全所必需的最小限度内使用”。

这场争议折射出AI治理中的一个深层矛盾:如何在防止先进模型被恶意利用与保障合法防御需求之间取得平衡。对于AI产业投资者而言,出口管制政策的走向将直接影响模型层企业的商业化路径与全球市场布局。过于宽泛的限制可能削弱美国AI企业在国际市场的竞争力,同时催生更多绕过管制的灰色渠道;而过于宽松则可能引发国家安全层面的担忧。此次网络安全界的集体发声,或将推动政策制定者重新审视管制令的合理边界与实施细则。