Anthropic旗下備受關注的AI模型Fable 5在恢復訪問後不到24小時,便陷入了用戶鋪天蓋地的吐槽之中。從跑分暴跌、任務被暗中降級,到安全機制過度攔截、內部推理時出現“私有語言”,一系列問題被開發者社區接連曝光,讓這次迴歸顯得頗為狼狽。

編程測評機構BridgeMind率先用其BridgeBench跑分體系對迴歸前後的兩個版本進行了對比測試。結果顯示,Fable 5的性能出現了顯著下滑。在12項debugging任務中,僅有3項在沒有觸發系統干預的情況下完整跑完,其餘9項均在執行過程中被安全系統判定為不安全,並自動轉交給了更早的模型Opus 4.8處理。BridgeMind直言:“這不是之前的那個Fable,Anthropic欠所有人一個解釋。”

這種“暗中降級”並非個例。BridgeMind分享的一張賬單截圖顯示,在一次總費用為321.53美元的編程session中,Fable 5模型僅消耗了78.38美元,而用戶並未主動選擇的Opus 4.8卻消耗了242.24美元,處理了約四分之三的工作量。儘管Opus 4.8單價更低,用戶並未因此多付錢,但正如BridgeMind所抱怨的,用戶支付的是Fable 5級別的期待,得到的卻是Opus 4.8的產出,這種貨不對板的體驗成為爭議焦點。

安全護欄的收緊還體現在對普通問題的攔截上。半導體分析師Dylan Patel提問“raspberry這個單詞裡有幾個字母r”,竟觸發了系統的“Chat paused”攔截卡片,提示稱安全機制會誤傷正常內容。生物醫藥工程師Derya Unutmaz讓模型“解釋人類”一詞,同樣被攔截並切換至Opus 4.8。他諷刺道,一家名字裡帶著“關乎人類”意味的公司,其模型卻連解釋“人類”都要繞道走。不過,也有用戶貼出截圖顯示,同樣關於raspberry的問題在自己這邊順利跑通,表明這套安全限制的判定標準可能連Anthropic自己也難以說清。

更令人意外的是,開發者Om Patel在讓Fable 5處理一道複雜的算法題時,從調用日誌中發現了模型內部推理時的“內心獨白”。這些文字並非流暢的句子,而是由“DATA DATA DATA. GO.”、“GRRR”、“GAAAH”、“PHEW”等大寫單詞和變量名碎片組成的“私有語言”。Patel解讀稱,這似乎是模型為了節省token而壓縮出的一套簡寫體系,反映出其在解決難題時“連滾帶爬”的真實狀態,與用戶最終看到的流暢答案形成鮮明對比。

此外,開發者dax在日誌中還發現了一個名為“TOO_DUMB_TO_NEED_FABLE”的內部標籤,意指某些請求太簡單,不值得動用Fable 5,系統便自動將其降級處理。這一發現進一步印證了用戶關於模型被暗中替換的猜測。

綜合來看,Fable 5迴歸首日暴露出的核心矛盾,並非模型本身能力的大幅倒退,而是Anthropic為其套上的安全護欄收得過緊,加之任務降級機制缺乏透明度,導致用戶體驗嚴重受損。對於開發者和企業用戶而言,他們真正在意的或許已不是模型強不強,而是自己選擇的模型,是否在老老實實地為自己幹活。