日本东京的 AI 初创公司 Sakana AI 近日正式推出了一款名为 Fugu 的多模型调度系统。该系统并非一个全新的大语言模型,而是一个经过专门训练的“模型调度器”,能够根据用户请求,动态地从可替换的模型池中选取并协调多个大语言模型协同工作,最终通过一个兼容 OpenAI 格式的单一 API 对外提供服务。对用户而言,调用 Fugu 的体验就像在调用一个单一的模型。
Sakana AI 此次发布包含两个版本:面向日常任务、注重低延迟的 Fugu 基础版,以及专为复杂多步问题设计、追求极致答案质量的 Fugu Ultra。根据 Sakana AI 公布的基准测试结果,Fugu Ultra 在编程、推理、科学和智能体等一系列测试中,取得了与 Anthropic 旗下顶尖模型 Fable 5 和 Mythos Preview 相当的性能表现。值得注意的是,由于 Anthropic 的这两款模型并未公开可用,它们甚至不在 Fugu 的调度池中。Sakana AI 表示,如果将这些模型纳入池中,Fugu 的整体得分可能会更高。
Fugu 的核心技术建立在 Sakana AI 自身的研究之上,特别是其在 ICLR 2026 上发表的两篇论文《Trinity》和《Conductor》,专注于“学习型模型编排”。这一技术路径契合了 Sakana AI 更宏大的愿景,即将群体行为、进化和集体智能等自然原理应用于人工智能系统。此前,Sakana AI 在编程领域的编排器设置上已取得过显著成果,其 ALE-Agent 曾在一场编程竞赛中,从 1000 名人类专家里脱颖而出,获得第 21 名。
除了性能上的对标,Sakana AI 将 Fugu 定位为一种对抗供应商锁定的对冲工具。该公司在公告中直言,对于一个组织或国家而言,在关键基础设施、金融或治理领域依赖单一公司的 API 是一种“实质性的脆弱性”。近期针对 Anthropic 的 Fable 和 Mythos 模型实施的出口管制,就是一个现实的例证,表明获取顶尖 AI 系统的渠道可能因监管变化或外交政策决策而一夜之间消失。Fugu 完全可替换的模型池设计,意味着当某个供应商的服务中断时,系统可以自动将任务路由至其他可用模型,从而提升关键 AI 应用的韧性。
当然,这种韧性并非绝对。Fugu 的实际表现完全取决于其模型池中有哪些模型可用。如果多个顶级供应商同时限制访问,Fugu 的选择范围也会相应缩小。它更像是一种增强弹性的机制,而非实现真正技术主权的完整方案。
据 Sakana AI 透露,已有约 500 名测试用户在实际场景中体验了该系统。反馈显示,Fugu 在自动化数据研究、安全分析和代码审查等长链条、多步骤的工作流中优势最为明显。一位软件开发者表示,Fugu Ultra 在代码审查中发现的漏洞远超其他工具,当别的工具只标记出大约三个问题时,Fugu 能找出超过二十个。Sakana AI 的自测数据也声称,Fugu 在自动化研究、机械设计和金融预测等任务上击败了 Gemini 3.1 Pro、Opus 4.8 和 GPT 5.5。
目前,Fugu 的两个版本均已通过单一 API 上线,Sakana AI 提供了针对日常使用的订阅计划和面向更大工作负载的按量计费模式。Fugu 的出现,标志着 AI 产业在应用层正探索一条不同于单纯追求更大参数模型的路径——通过智能编排现有模型的能力,在特定任务上实现性能的跃升,并试图为下游用户提供一层抵御供应链不确定性的缓冲。