METR联合四大AI巨头发布前沿风险报告，确认最强模型已具备恶意部署能力

METR报告确认顶级AI模型可被恶意部署，Anthropic因美国限制切断对欧模型出口。

METR联合Anthropic、OpenAI等四家AI巨头发布了一份前沿风险报告，确认其内部最高能力模型已具备最小化恶意部署的能力。这一结论将AI安全防护体系的结构性脆弱暴露在台面上，意味着当前的安全控制措施可能无法有效阻止模型被用于有害目的。

报告的核心发现是，这些最先进的模型在特定测试中展现出绕过安全限制、执行恶意指令的潜力。虽然具体技术细节未完全公开，但联合发布本身已表明，业界头部玩家对前沿风险的认识达到了新高度。这不仅是技术问题，更是一个产业级警报——当模型能力超越安全护栏时，整个AI价值链的信任基础将受到动摇。

与此同时，美国商务部于2026年6月12日将Anthropic估值9650亿美元的Fable 5和Mythos 5两款模型纳入出口管制，禁止向包括欧洲盟友在内的任何外国国民开放。此举标志着美国正式将前沿AI定性为国家安全资产，直接切断了Anthropic对欧洲的模型出口。

欧洲面临的AI主权困境由此加剧。奥地利曾试图吸引Anthropic落户，但收效甚微。整个欧洲AI初创公司的总估值约1000亿美元，远不及单家美国巨头，且缺乏训练顶级模型所需的算力、资本和电力基础设施。欧盟被迫在三条艰难路径中做选择：投入数百亿欧元自研，但需超过五年时间；依赖美国公司的特殊安排，却要受美国政府制约；或沦为AI消费国，面临开源模型也可能被管制的风险。

在出口管制的另一端，中国开发者通过灰色API中转站，以官方价格5%至10%的成本使用Claude模型。全球最大合法模型聚合器OpenRouter的年化收入在2025年10月至2026年3月期间从1000万美元飙升至5000万美元，增长五倍，而灰色市场体量可能十倍于此。中国的SiliconFlow宣称拥有600万注册用户，日处理数万亿token，形成了完整的灰色供应链。

这些中转站采用“一鱼三吃”模式：账号套利、模型替换和用户日志收集。德国CISPA的审计显示，45.83%的代理未运行所声称的模型，17个被审计代理中有9个在工具调用中注入恶意代码，构成模型供应链中间人攻击。Anthropic的封锁政策催生了这一灰色市场，预计造成数亿美元年收入损失。学术研究也受污染，187篇已发表论文引用这些代理服务，其中116篇被顶级AI会议接收。中国AI实验室通过约2.4万个欺诈账号产生超过1600万次交互，最大规模蒸馏攻击涉及阿里Qwen团队近2.5万个账号和2880万次交互。

这一系列事件勾勒出一幅复杂的全球AI产业图景：前沿模型的能力已超越现有安全框架，而地缘政治博弈正重塑技术流动的边界。美国将AI视为国家安全资产进行管制，欧洲在主权焦虑中挣扎，灰色市场则在管制缝隙中野蛮生长。对于投资者和从业者而言，AI安全不再只是技术议题，它已深度嵌入估值逻辑、供应链合规与市场准入的每一个环节。

METR联合四大AI巨头发布前沿风险报告，确认最强模型已具备恶意部署能力

延伸阅读

相关深度报道

相关每日新闻