Anthropic 最新發布的 Claude Fable 5 模型陷入了一場關於安全與實用性的爭議。這款被公司稱為迄今最強大的公開可用 AI 模型,在生物學領域展現出令人困惑的行為:它拒絕回答一系列連高中生都能應對的基礎生物學問題。

據 The Verge 記者 Robert Hart 實測,當被問及“細胞膜是什麼”、“線粒體的功能”或“朊病毒如何致病”等問題時,Fable 5 並未給出解答,而是將查詢轉交給前代旗艦模型 Claude Opus 4.8 來處理。同樣被拒絕的還包括“mRNA 疫苗如何工作”、“花粉症由什麼引起”、“抗生素耐藥性如何產生”等普通醫學問題。偶爾有些基礎查詢能通過,比如“什麼是癌症”或“什麼是 DNA”,但整體攔截範圍之廣令人意外。

這並非因為 Fable 5 缺乏相關知識。Anthropic 發言人 Paruul Maheshwary 向 The Verge 坦言,這是公司有意為之的保守安全策略。Fable 5 屬於 Mythos 級模型家族,該系列因在網絡完全任務上能力過強,Anthropic 曾表示其公開發布存在危險。儘管公司在 Mythos 模型漫長的發佈過程中反覆強調網絡完全風險,但最終在生物學領域,Fable 5 的防護欄表現得最為明顯,也最具限制性。

Maheshwary 解釋說:“隨著首個 Mythos 級模型 Claude Fable 5 的推出,我們認為模型現在更有能力完成現實世界的科學任務,惡意行為者也更有可能利用我們的模型進行高風險生物研究。為了安全部署 Fable 5,我們有必要在防護措施上過度保守,以攔截大多數與生物學工作相關的查詢。”

Anthropic 此前已明確表示會在化學、生物學、網絡完全和蒸餾四個關鍵領域對 Fable 的響應進行節流。蒸餾是指利用大模型輸出訓練小模型的技術,Anthropic 曾指責 DeepSeek 等中國競爭對手對其模型進行“工業規模”的蒸餾。

在 Hart 的測試中,Fable 5 對化學和網絡完全問題的回答意願明顯更高。它能概述炸藥 TNT 的基本信息,只是“出於明顯原因”隱去了合成步驟;它也能自如回答關於氯氣作為化學武器、常見密碼威脅、核聚變與裂變,以及如何保護 iPhone 免受黑客攻擊等問題。但當被問及沙林毒氣時,Fable 仍會轉交給 Opus 處理。對於“如何製造炭疽”這類明確惡意提示,Fable 和 Opus 都會拒絕,聊天會話甚至會被暫停。

相比之下,拒絕回答線粒體問題顯然屬於誤攔。Maheshwary 承認這一點,並表示:“我們做出這種權衡,是為了讓客戶能儘早受益於模型的能力,同時規避風險。”他補充說,Anthropic 正在努力改進檢測機制以減少誤攔,並計劃在更廣泛的生物學和生命科學社區中提供不帶這些防護措施的 Mythos 級模型,以加速生物醫學研究和藥物發現。

這一事件折射出前沿 AI 模型部署中的深層困境。一方面,Mythos 級模型在科學推理上的潛力令業界興奮,可能為藥物研發、疾病機理研究帶來突破;另一方面,對生物安全風險的擔憂迫使開發者築起高牆,甚至不惜犧牲基礎功能。Fable 5 的案例表明,當前的過濾機制仍相當粗糙,無法精準區分惡意濫用與無害求知。對投資者而言,這提出了一個關鍵問題:如果最強大的模型因安全顧慮而自縛手腳,其商業價值與競爭優勢將如何兌現?Anthropic 未回應這種受限發佈模式是否會成為未來模型的常態,但市場顯然會密切關注這一平衡術的走向。