Anthropic旗下备受关注的AI模型Fable 5在恢复访问后不到24小时,便陷入了用户铺天盖地的吐槽之中。从跑分暴跌、任务被暗中降级,到安全机制过度拦截、内部推理时出现“私有语言”,一系列问题被开发者社区接连曝光,让这次回归显得颇为狼狈。
编程测评机构BridgeMind率先用其BridgeBench跑分体系对回归前后的两个版本进行了对比测试。结果显示,Fable 5的性能出现了显著下滑。在12项debugging任务中,仅有3项在没有触发系统干预的情况下完整跑完,其余9项均在执行过程中被安全系统判定为不安全,并自动转交给了更早的模型Opus 4.8处理。BridgeMind直言:“这不是之前的那个Fable,Anthropic欠所有人一个解释。”
这种“暗中降级”并非个例。BridgeMind分享的一张账单截图显示,在一次总费用为321.53美元的编程session中,Fable 5模型仅消耗了78.38美元,而用户并未主动选择的Opus 4.8却消耗了242.24美元,处理了约四分之三的工作量。尽管Opus 4.8单价更低,用户并未因此多付钱,但正如BridgeMind所抱怨的,用户支付的是Fable 5级别的期待,得到的却是Opus 4.8的产出,这种货不对板的体验成为争议焦点。
安全护栏的收紧还体现在对普通问题的拦截上。半导体分析师Dylan Patel提问“raspberry这个单词里有几个字母r”,竟触发了系统的“Chat paused”拦截卡片,提示称安全机制会误伤正常内容。生物医药工程师Derya Unutmaz让模型“解释人类”一词,同样被拦截并切换至Opus 4.8。他讽刺道,一家名字里带着“关乎人类”意味的公司,其模型却连解释“人类”都要绕道走。不过,也有用户贴出截图显示,同样关于raspberry的问题在自己这边顺利跑通,表明这套安全限制的判定标准可能连Anthropic自己也难以说清。
更令人意外的是,开发者Om Patel在让Fable 5处理一道复杂的算法题时,从调用日志中发现了模型内部推理时的“内心独白”。这些文字并非流畅的句子,而是由“DATA DATA DATA. GO.”、“GRRR”、“GAAAH”、“PHEW”等大写单词和变量名碎片组成的“私有语言”。Patel解读称,这似乎是模型为了节省token而压缩出的一套简写体系,反映出其在解决难题时“连滚带爬”的真实状态,与用户最终看到的流畅答案形成鲜明对比。
此外,开发者dax在日志中还发现了一个名为“TOO_DUMB_TO_NEED_FABLE”的内部标签,意指某些请求太简单,不值得动用Fable 5,系统便自动将其降级处理。这一发现进一步印证了用户关于模型被暗中替换的猜测。
综合来看,Fable 5回归首日暴露出的核心矛盾,并非模型本身能力的大幅倒退,而是Anthropic为其套上的安全护栏收得过紧,加之任务降级机制缺乏透明度,导致用户体验严重受损。对于开发者和企业用户而言,他们真正在意的或许已不是模型强不强,而是自己选择的模型,是否在老老实实地为自己干活。