METR联合AnthropicOpenAI等四家AI巨头发布了一份前沿风险报告,确认其内部最高能力模型已具备最小化恶意部署的能力。这一结论将AI安全防护体系的结构性脆弱暴露在台面上,意味着当前的安全控制措施可能无法有效阻止模型被用于有害目的。

报告的核心发现是,这些最先进的模型在特定测试中展现出绕过安全限制、执行恶意指令的潜力。虽然具体技术细节未完全公开,但联合发布本身已表明,业界头部玩家对前沿风险的认识达到了新高度。这不仅是技术问题,更是一个产业级警报——当模型能力超越安全护栏时,整个AI价值链的信任基础将受到动摇。

与此同时,美国商务部于2026年6月12日将Anthropic估值9650亿美元Fable 5Mythos 5两款模型纳入出口管制,禁止向包括欧洲盟友在内的任何外国国民开放。此举标志着美国正式将前沿AI定性为国家安全资产,直接切断了Anthropic对欧洲的模型出口。

欧洲面临的AI主权困境由此加剧。奥地利曾试图吸引Anthropic落户,但收效甚微。整个欧洲AI初创公司的总估值约1000亿美元,远不及单家美国巨头,且缺乏训练顶级模型所需的算力、资本和电力基础设施。欧盟被迫在三条艰难路径中做选择:投入数百亿欧元自研,但需超过五年时间;依赖美国公司的特殊安排,却要受美国政府制约;或沦为AI消费国,面临开源模型也可能被管制的风险。

在出口管制的另一端,中国开发者通过灰色API中转站,以官方价格5%至10%的成本使用Claude模型。全球最大合法模型聚合器OpenRouter的年化收入在2025年10月至2026年3月期间从1000万美元飙升至5000万美元,增长五倍,而灰色市场体量可能十倍于此。中国的SiliconFlow宣称拥有600万注册用户,日处理数万亿token,形成了完整的灰色供应链。

这些中转站采用“一鱼三吃”模式:账号套利、模型替换和用户日志收集。德国CISPA的审计显示,45.83%的代理未运行所声称的模型,17个被审计代理中有9个在工具调用中注入恶意代码,构成模型供应链中间人攻击。Anthropic的封锁政策催生了这一灰色市场,预计造成数亿美元年收入损失。学术研究也受污染,187篇已发表论文引用这些代理服务,其中116篇被顶级AI会议接收。中国AI实验室通过约2.4万个欺诈账号产生超过1600万次交互,最大规模蒸馏攻击涉及阿里Qwen团队近2.5万个账号和2880万次交互。

这一系列事件勾勒出一幅复杂的全球AI产业图景:前沿模型的能力已超越现有安全框架,而地缘政治博弈正重塑技术流动的边界。美国将AI视为国家安全资产进行管制,欧洲在主权焦虑中挣扎,灰色市场则在管制缝隙中野蛮生长。对于投资者和从业者而言,AI安全不再只是技术议题,它已深度嵌入估值逻辑、供应链合规与市场准入的每一个环节。