据 The Information 获取的内部文件显示,Meta 正在对工程师使用外部 AI 编程工具施加严格限制,涉及 Anthropic 的 Claude Code 和 OpenAI 的 Codex。核心目的是防止这些竞品模型的输出内容被无意中混入 Meta 自身的训练数据,从而引发法律与商业风险。
一份内部备忘录警告称,如果竞品模型的输出泄露到 Meta 的训练数据中,可能导致与合作伙伴公司出现严重升级事态。为此,Meta 甚至暂时叫停了部分涉及这些外部模型的工作。公司政策明确禁止工程师利用 AI 输出结果来创建测试任务或进行代码分析,且相关工作仍须经过人工审核。
这一动作背后是行业对“蒸馏”行为日益加剧的担忧。所谓蒸馏,指的是未经授权地将一个模型的能力转移到另一个模型。近期,Anthropic 曾指控阿里巴巴实施了迄今最大规模的蒸馏攻击;而 Elon Musk 也在今年 4 月承认,其 xAI 曾部分蒸馏了 OpenAI 的模型。目前,OpenAI、Anthropic 和 Google 的服务条款均明确禁止使用其模型输出来构建竞争系统。
对 Meta 而言,限制外部工具不仅是合规考量,更与自身战略布局紧密相关。公司正在全力打造自有编程助手 MetaCode,旨在降低对外部工具的依赖。内部备忘录指出,仅今年一年,Meta 在内部 AI 使用上的支出预计就将达到数十亿美元,削减外部工具成本成为当务之急。
从产业视角看,Meta 的禁令折射出 AI 竞赛中数据边界意识的强化。随着模型能力趋同,训练数据的纯净度与来源合规性正成为新的竞争壁垒。任何数据污染都可能削弱模型性能,甚至引发知识产权诉讼。对于投资者而言,这一事件凸显了大型科技公司在构建自有 AI 栈时,对数据主权和供应链安全的重视程度正在急剧上升。
Meta 官方回应称,公司对 AI 工具的负责任使用设有明确规则。但内部文件的曝光,无疑让外界更清晰地看到,在争夺下一代 AI 优势的过程中,巨头们正筑起更高的数据围墙。