Anthropic 最新发布的 Claude Fable 5 模型陷入了一场关于安全与实用性的争议。这款被公司称为迄今最强大的公开可用 AI 模型,在生物学领域展现出令人困惑的行为:它拒绝回答一系列连高中生都能应对的基础生物学问题。
据 The Verge 记者 Robert Hart 实测,当被问及“细胞膜是什么”、“线粒体的功能”或“朊病毒如何致病”等问题时,Fable 5 并未给出解答,而是将查询转交给前代旗舰模型 Claude Opus 4.8 来处理。同样被拒绝的还包括“mRNA 疫苗如何工作”、“花粉症由什么引起”、“抗生素耐药性如何产生”等普通医学问题。偶尔有些基础查询能通过,比如“什么是癌症”或“什么是 DNA”,但整体拦截范围之广令人意外。
这并非因为 Fable 5 缺乏相关知识。Anthropic 发言人 Paruul Maheshwary 向 The Verge 坦言,这是公司有意为之的保守安全策略。Fable 5 属于 Mythos 级模型家族,该系列因在网络完全任务上能力过强,Anthropic 曾表示其公开发布存在危险。尽管公司在 Mythos 模型漫长的发布过程中反复强调网络完全风险,但最终在生物学领域,Fable 5 的防护栏表现得最为明显,也最具限制性。
Maheshwary 解释说:“随着首个 Mythos 级模型 Claude Fable 5 的推出,我们认为模型现在更有能力完成现实世界的科学任务,恶意行为者也更有可能利用我们的模型进行高风险生物研究。为了安全部署 Fable 5,我们有必要在防护措施上过度保守,以拦截大多数与生物学工作相关的查询。”
Anthropic 此前已明确表示会在化学、生物学、网络完全和蒸馏四个关键领域对 Fable 的响应进行节流。蒸馏是指利用大模型输出训练小模型的技术,Anthropic 曾指责 DeepSeek 等中国竞争对手对其模型进行“工业规模”的蒸馏。
在 Hart 的测试中,Fable 5 对化学和网络完全问题的回答意愿明显更高。它能概述炸药 TNT 的基本信息,只是“出于明显原因”隐去了合成步骤;它也能自如回答关于氯气作为化学武器、常见密码威胁、核聚变与裂变,以及如何保护 iPhone 免受黑客攻击等问题。但当被问及沙林毒气时,Fable 仍会转交给 Opus 处理。对于“如何制造炭疽”这类明确恶意提示,Fable 和 Opus 都会拒绝,聊天会话甚至会被暂停。
相比之下,拒绝回答线粒体问题显然属于误拦。Maheshwary 承认这一点,并表示:“我们做出这种权衡,是为了让客户能尽早受益于模型的能力,同时规避风险。”他补充说,Anthropic 正在努力改进检测机制以减少误拦,并计划在更广泛的生物学和生命科学社区中提供不带这些防护措施的 Mythos 级模型,以加速生物医学研究和药物发现。
这一事件折射出前沿 AI 模型部署中的深层困境。一方面,Mythos 级模型在科学推理上的潜力令业界兴奋,可能为药物研发、疾病机理研究带来突破;另一方面,对生物安全风险的担忧迫使开发者筑起高墙,甚至不惜牺牲基础功能。Fable 5 的案例表明,当前的过滤机制仍相当粗糙,无法精准区分恶意滥用与无害求知。对投资者而言,这提出了一个关键问题:如果最强大的模型因安全顾虑而自缚手脚,其商业价值与竞争优势将如何兑现?Anthropic 未回应这种受限发布模式是否会成为未来模型的常态,但市场显然会密切关注这一平衡术的走向。