Anthropic指控阿里Qwen团队大规模模型蒸馏

Anthropic称阿里Qwen团队45天内用2.5万账号完成2880万次交互，涉嫌模型蒸馏。

Anthropic对中国AI公司的模型蒸馏指控正在急剧升级。2026年6月10日，这家美国AI实验室向美国参议院银行委员会递交信件，将矛头对准阿里Qwen团队，披露了一组惊人数据：从4月22日到6月5日的45天里，阿里相关运营者动用2.5万个账号，对Anthropic最新旗舰模型Mythos Preview发起了2880万次交互。

这是Anthropic迄今公开的最大规模模型蒸馏案。作为参照，当前主流的高质量监督微调数据集规模通常在数十万到几百万条之间，而2880万次针对软件工程与智能体推理能力的定向交互，足以在特定任务域内低成本训练出一个极具竞争力的专用模型。Anthropic在信中将其定性为“迄今为止，中国公司试图搭美国顶尖实验室便车的最大规模尝试”。

短短四个月内，这已是第四家被Anthropic点名的中国AI公司。2026年2月，Anthropic曾发布博文，公开指控DeepSeek、月之暗面和MiniMax利用约2.4万个账号对Claude发起超1600万次交互，其中MiniMax超1300万次，月之暗面超340万次，DeepSeek超15万次。从1600万次到2880万次，规模翻倍的同时，Anthropic的应对策略也从技术曝光转向政治施压。

此次收信人——银行委员会主席蒂姆·斯科特和首席成员伊丽莎白·沃伦——均是美国政坛负责对外经济制裁与金融监管的关键人物。据彭博社报道，信件递交后，参议员比尔·哈格蒂和安迪·金迅速跟进，计划推动一项修正案纳入《国防法案》：对任何“不当获取美国AI模型输出以训练竞争系统”的中国公司实施严厉制裁或列入黑名单。

Anthropic的真正目标并非单纯商业维权，而是要在美国政界与产业界确立一条新的红线：用API输出训练竞争模型即属越界违法。这一动向与近期Fable 5与Mythos 5紧急下架事件暗中呼应，显示美国政府对AI技术的封锁正在急剧收紧。硅谷内部也在结成防御同盟，Anthropic、OpenAI和谷歌已开始共享关于违规数据抓取的情报。

然而在开发者社区，Anthropic的指控引发了截然不同的反应。在Reddit等技术论坛上，大量用户指出Anthropic自身曾因非法下载数百万册受保护书籍训练模型，陷入美国史上最大AI侵权盗版案，最终支付15亿美元和解金。马斯克也在今年2月公开批评Anthropic才是“北美最大的偷子”。更有网友翻出Claude 4.8模型曾自曝“由阿里巴巴开发的Qwen模型”的业内回旋镖，质疑其指控的正当性。

技术层面，整场争议的核心是对抗性蒸馏。传统蒸馏是用大模型当“老师”训练轻量“学生”模型，而对抗性蒸馏则通过持续向目标模型发送精心设计的问题，批量获取高质量回答作为训练样本。按Claude公开API定价粗算，2880万次交互成本约几百万美元，但与从零训练同等能力的大模型相比，可能仅是预算的零头。Anthropic愤怒的根源正在于此：对方用极小成本跳过了多年的技术积累与巨额投入。

Anthropic在报告中还特别强调了安全对齐问题。模型的安全规则需通过精细的行为矫正训练建立，而蒸馏过程只复制成功回答，过滤掉所有被系统拦截的高危问题。结果就是学生模型只学会了顶级能力，却没学到“什么不该说”，一旦部署到真实世界，能力越强失控风险越大。

在API安全攻防上，Anthropic此次检测依赖行为模式分析——账号注册时间集中、IP地址异常扎堆、提问内容高度相似、请求频率不像人类。但防御天然滞后于进攻，封禁账号后对方可用虚拟信用卡和动态代理IP分散注册，通过模拟真人停顿和废话伪装查询模式，甚至用二次改写和增噪洗掉输出指纹。这场猫鼠游戏没有技术终局，只有成本的此消彼长。

真正改变游戏规则的将是制裁清单落地。一旦模型训练数据来源成为严苛的监管审查对象，所有LLM工程链条上的人都将面临新的合规边界：哪些数据来源合法，哪些模型行为会被追溯，哪些公司可能因训练数据“来路不明”被列入黑名单。这或许才是Anthropic的深层野心——在技术对抗的废墟上，建立一套由它定义并由政治力量执行的全球AI新秩序。

Anthropic指控阿里Qwen团队大规模模型蒸馏

延伸阅读

相关深度报道

相关每日新闻