Fable 5迴歸首日遭用戶集體吐槽：跑分驟降、偷換模型、安全攔截過激

Anthropic旗下備受關注的AI模型Fable 5在恢復訪問後不到24小時，便陷入了用戶鋪天蓋地的吐槽之中。從跑分暴跌、任務被暗中降級，到安全機制過度攔截、內部推理時出現“私有語言”，一系列問題被開發者社區接連曝光，讓這次迴歸顯得頗為狼狽。

編程測評機構BridgeMind率先用其BridgeBench跑分體系對迴歸前後的兩個版本進行了對比測試。結果顯示，Fable 5的性能出現了顯著下滑。在12項debugging任務中，僅有3項在沒有觸發系統干預的情況下完整跑完，其餘9項均在執行過程中被安全系統判定為不安全，並自動轉交給了更早的模型Opus 4.8處理。BridgeMind直言：“這不是之前的那個Fable，Anthropic欠所有人一個解釋。”

這種“暗中降級”並非個例。BridgeMind分享的一張賬單截圖顯示，在一次總費用為321.53美元的編程session中，Fable 5模型僅消耗了78.38美元，而用戶並未主動選擇的Opus 4.8卻消耗了242.24美元，處理了約四分之三的工作量。儘管Opus 4.8單價更低，用戶並未因此多付錢，但正如BridgeMind所抱怨的，用戶支付的是Fable 5級別的期待，得到的卻是Opus 4.8的產出，這種貨不對板的體驗成為爭議焦點。

安全護欄的收緊還體現在對普通問題的攔截上。半導體分析師Dylan Patel提問“raspberry這個單詞裡有幾個字母r”，竟觸發了系統的“Chat paused”攔截卡片，提示稱安全機制會誤傷正常內容。生物醫藥工程師Derya Unutmaz讓模型“解釋人類”一詞，同樣被攔截並切換至Opus 4.8。他諷刺道，一家名字裡帶著“關乎人類”意味的公司，其模型卻連解釋“人類”都要繞道走。不過，也有用戶貼出截圖顯示，同樣關於raspberry的問題在自己這邊順利跑通，表明這套安全限制的判定標準可能連Anthropic自己也難以說清。

更令人意外的是，開發者Om Patel在讓Fable 5處理一道複雜的算法題時，從調用日誌中發現了模型內部推理時的“內心獨白”。這些文字並非流暢的句子，而是由“DATA DATA DATA. GO.”、“GRRR”、“GAAAH”、“PHEW”等大寫單詞和變量名碎片組成的“私有語言”。Patel解讀稱，這似乎是模型為了節省token而壓縮出的一套簡寫體系，反映出其在解決難題時“連滾帶爬”的真實狀態，與用戶最終看到的流暢答案形成鮮明對比。

此外，開發者dax在日誌中還發現了一個名為“TOO_DUMB_TO_NEED_FABLE”的內部標籤，意指某些請求太簡單，不值得動用Fable 5，系統便自動將其降級處理。這一發現進一步印證了用戶關於模型被暗中替換的猜測。

綜合來看，Fable 5迴歸首日暴露出的核心矛盾，並非模型本身能力的大幅倒退，而是Anthropic為其套上的安全護欄收得過緊，加之任務降級機制缺乏透明度，導致用戶體驗嚴重受損。對於開發者和企業用戶而言，他們真正在意的或許已不是模型強不強，而是自己選擇的模型，是否在老老實實地為自己幹活。

Fable 5迴歸首日遭用戶集體吐槽：跑分驟降、偷換模型、安全攔截過激

延伸閱讀

相關深度報道

相關每日新聞