Fable 5回归首日遭用户集体吐槽：跑分骤降、偷换模型、安全拦截过激

Anthropic旗下备受关注的AI模型Fable 5在恢复访问后不到24小时，便陷入了用户铺天盖地的吐槽之中。从跑分暴跌、任务被暗中降级，到安全机制过度拦截、内部推理时出现“私有语言”，一系列问题被开发者社区接连曝光，让这次回归显得颇为狼狈。

编程测评机构BridgeMind率先用其BridgeBench跑分体系对回归前后的两个版本进行了对比测试。结果显示，Fable 5的性能出现了显著下滑。在12项debugging任务中，仅有3项在没有触发系统干预的情况下完整跑完，其余9项均在执行过程中被安全系统判定为不安全，并自动转交给了更早的模型Opus 4.8处理。BridgeMind直言：“这不是之前的那个Fable，Anthropic欠所有人一个解释。”

这种“暗中降级”并非个例。BridgeMind分享的一张账单截图显示，在一次总费用为321.53美元的编程session中，Fable 5模型仅消耗了78.38美元，而用户并未主动选择的Opus 4.8却消耗了242.24美元，处理了约四分之三的工作量。尽管Opus 4.8单价更低，用户并未因此多付钱，但正如BridgeMind所抱怨的，用户支付的是Fable 5级别的期待，得到的却是Opus 4.8的产出，这种货不对板的体验成为争议焦点。

安全护栏的收紧还体现在对普通问题的拦截上。半导体分析师Dylan Patel提问“raspberry这个单词里有几个字母r”，竟触发了系统的“Chat paused”拦截卡片，提示称安全机制会误伤正常内容。生物医药工程师Derya Unutmaz让模型“解释人类”一词，同样被拦截并切换至Opus 4.8。他讽刺道，一家名字里带着“关乎人类”意味的公司，其模型却连解释“人类”都要绕道走。不过，也有用户贴出截图显示，同样关于raspberry的问题在自己这边顺利跑通，表明这套安全限制的判定标准可能连Anthropic自己也难以说清。

更令人意外的是，开发者Om Patel在让Fable 5处理一道复杂的算法题时，从调用日志中发现了模型内部推理时的“内心独白”。这些文字并非流畅的句子，而是由“DATA DATA DATA. GO.”、“GRRR”、“GAAAH”、“PHEW”等大写单词和变量名碎片组成的“私有语言”。Patel解读称，这似乎是模型为了节省token而压缩出的一套简写体系，反映出其在解决难题时“连滚带爬”的真实状态，与用户最终看到的流畅答案形成鲜明对比。

此外，开发者dax在日志中还发现了一个名为“TOO_DUMB_TO_NEED_FABLE”的内部标签，意指某些请求太简单，不值得动用Fable 5，系统便自动将其降级处理。这一发现进一步印证了用户关于模型被暗中替换的猜测。

综合来看，Fable 5回归首日暴露出的核心矛盾，并非模型本身能力的大幅倒退，而是Anthropic为其套上的安全护栏收得过紧，加之任务降级机制缺乏透明度，导致用户体验严重受损。对于开发者和企业用户而言，他们真正在意的或许已不是模型强不强，而是自己选择的模型，是否在老老实实地为自己干活。

Fable 5回归首日遭用户集体吐槽：跑分骤降、偷换模型、安全拦截过激

延伸阅读

相关深度报道

相关每日新闻