什么是Sakana Fugu？

Sakana Fugu是日本AI初创公司Sakana AI推出的多智能体编排系统。它不是传统的大模型，而是一个智能路由层，通过动态调用多个专业模型来完成任务，旨在避免对单一模型供应商的依赖，并在多个基准测试中达到顶尖性能。

Fugu与Anthropic Claude Fable 5有什么区别？

Claude Fable 5是Anthropic的单体大模型，训练参数巨大，能力集中在内部。Fugu是编排系统，本身不拥有全部能力，而是通过调配外部模型实现类似甚至更好的效果。Fugu的优势在于可替换代理池带来的抗风险能力，但路由过程不透明；Claude在一致性与可控性上更成熟。

Fugu对AI行业有哪些影响？

Fugu证明多模型编排可以替代单体前沿模型，降低AI投资中的供应商锁定风险。它可能催生一批专注于模型调度的AI独角兽，改变行业竞争格局。但也带来黑盒合规、定价透明度等新问题。对于企业，Fugu提供了灾备方案；对于国家，它助力技术主权建设。

Sakana推出Fugu系统：AI新闻深度解析多模型编排如何颠覆AI独角兽格局

在AI大模型军备竞赛愈演愈烈的当下，一家日本初创公司Sakana AI却另辟蹊径，用一套名为Fugu的多智能体编排系统，给行业带来了一股清流。本期的AI新闻将带你深入解读Fugu的技术细节、商业逻辑，以及它对当前AI独角兽生态和AI投资风向的潜在冲击。

Fugu初探：当“河豚”成为AI世界的总包工头

Fugu在日语中是“河豚”的意思，Sakana用这种外表圆润、内含剧毒的鱼类来命名其最新系统，暗合了其技术哲学：看似无害的统一接口背后，隐藏着复杂的智能协调机制。Fugu本质上并非一个传统的大模型，而是一个“多模型编排系统”——它以一个标准的、兼容OpenAI API的接口对外提供服务，内部却动态地将用户的查询路由到一群可交换的专业AI代理上。

这个理念的诞生背景非常现实。2025年6月，Anthropic因美国政府出口管制命令，突然撤回了其最强模型Claude Mythos 5和Claude Fable 5的公开访问权限，让众多依赖单一模型供应商的企业措手不及。Sakana的CEO兼联合创始人David Ha（前Google Brain成员）在X上写道：“依赖单一公司的模型来建设国家基础设施是巨大的风险。最近的出口管制表明，顶级模型的访问权限可能一夜之间消失。”Fugu正是为了对冲这种“权力集中”而设计的——它通过动态路由，随时可以替换掉池中的某个模型，避免了供应商锁定和地缘政治风险。

从AI投资的角度看，Fugu代表的是一种“去核心化”的思维。传统AI独角兽都在拼命训练更大的单体模型，而Sakana选择做那个“协调者”。它本身也是一个LLM，但训练目标不是回答所有问题，而是学会如何调用其他LLM来协作解决问题。这种做法让Fugu在基准测试中展现出与Claude Fable 5旗鼓相当甚至更优的性能，同时彻底改变了开发者部署AI基础设施的方式。

Sakana推出Fugu系统：AI新闻深度解析多模型编排如何颠覆AI独角兽格局配图 — 图片来源：AI生成

解码Fugu：任务分解、智能代理与黑盒路由

Fugu的工作原理可以形象地理解为一个“总包工头”。当收到一个复杂请求时，它不会尝试自己完成所有步骤，而是将问题拆解成若干子任务，然后从代理池中挑选合适的专家模型去执行，最后验证并合成最终结果。Sakana团队在技术文档中强调：“Fugu本身就是一个LLM，它被训练去调用代理池中的各种LLM，包括递归地调用自身实例。”

这一机制基于Sakana在2026年发布的两篇研究论文——TRINITY和Conductor。系统并非靠手工设计的工作流，而是通过学习到的协调策略，自主管理模型选择与验证的整个生命周期。对最终用户而言，这个多智能体集群完全隐藏在标准API端点后面：你发送一个请求，Fugu返回一个结果，中间发生了什么——具体调用了哪些模型、如何协作——都是专有的、不透明的。

这种黑盒设计既是Fugu的护城河，也带来了争议。商业上，Sakana明确表示，其核心知识产权在于这些“非显而易见的协作模式”，因此路由信息被刻意对用户隐藏。不过，为了满足企业数据合规需求，开发者可以手动将特定的模型或提供商排除出路由池，也可以选择不让自己的提示词用于未来的训练数据。目前，Fugu暂时不在欧盟和欧洲经济区提供服务，原因是其黑盒数据路由架构需要与GDPR法规进行对齐。

在实际应用中，Fugu提供了两种变体：标准版Fugu针对日常任务优化，追求高速低延迟，适合集成到聊天机器人和编码环境；旗舰版Fugu Ultra则面向高难度的AI研究、网络安全分析和多步骤专利调研等任务。据Sakana称，Fugu Ultra协调了更深的专家池，在严谨的科学和推理基准上可与行业领先的单体模型匹敌。这种分层设计让AI工具导航领域的开发者可以按需选择，同时也为企业提供了灵活的预算选项。

免费 AI艺术签名

8种书法字体签名 · 打开即用 · 无需注册

立即使用 →

性能硬刚：Fugu如何超越Claude Fable 5

抛开理论，数据才是硬通货。在Sakana公开的基准测试图表中，Fugu的性能表现相当亮眼。在LiveCodeBench（一个评估代码能力的开源基准，定期更新编程问题）上，Fugu Ultra得分93.2，标准Fugu得分92.9，而Anthropic的Claude Fable 5仅得89.8。在GPQA-D（Diamond）测试——一套包含198道研究生水平的生物学、物理和化学多选题——上，Fugu Ultra和标准Fugu均拿到95.5分，超越此前Claude Mythos Preview的94.6分。

这意味着在AI Agent相关任务（如代码生成、科学研究推理）上，一个精心编排的代理池完全可以与闭源的最强单体模型正面竞争。更重要的是，Fugu的架构天然具备冗余性——如果某个模型提供商出现故障或遭遇监管限制，Fugu可以自动绕行，保障服务连续性。这对于追求高可用性的关键业务场景来说，价值巨大。

不过也要看到，这些基准测试是由Sakana自己发布的，且具体测试集的选择和条件可能存在偏差。第三方独立验证仍待进行。另外，Fugu在通用知识问答、多模态理解等领域的表现如何，目前还没有公开数据。AI独角兽在营销时往往只展示最强的部分，投资者在评估时需保持理性。从AI投资的视角看，Fugu证明了一个方向：未来竞争力的关键可能不再是单一的参数规模，而是系统的智能调度能力。

打破垄断：Fugu如何化解AI供应链风险

Fugu的出现，恰逢全球AI行业对“单一模型依赖”的焦虑达到顶峰。Anthropic的模型撤回事件只是一个缩影——更早之前，OpenAI也曾因政策调整限制过某些地区的API访问。对于将大模型嵌入核心业务流程的企业来说，这种不确定性几乎是不可承受之重。

David Ha在宣布Fugu时直言：“我们证明了一个精心编排的可交换代理池，可以匹配Fable和Mythos这样的受限前沿模型。编排模型是下一个前沿，比更大模型更重要。”这句话直接点出了Fugu的战略价值：它不是要造出世界上最大的模型，而是要成为世界上最好的“模型路由器”。通过整合来自不同供应商的模型，Fugu在AI堆栈中内置了原生冗余。如果某个提供商因大模型训练成本过高而出局，或者因地缘政治被制裁，Fugu可以无缝切换到其他模型，保证业务不中断。

这种思路对于国家层面的AI基础设施意义尤其重大。许多国家担心过度依赖美国公司的模型，正在寻求技术主权。Fugu提供了一种“插件化”的中间层方案——你可以接入本国的模型，也可以接入开源模型，甚至可以通过AI Agent技术定制专属代理。这在一定程度上缓解了“卡脖子”的风险，也为各国发展自主AI生态提供了新的路径。

当然，Fugu本身也是一家商业公司，它的路由策略是封闭的，这又带来了新的依赖风险。只不过，这种风险从“依赖单一模型”变成了“依赖单一编排引擎”。如果Fugu将来被收购或改变商业模式，用户的处境可能同样尴尬。因此，从长远看，开放标准、可审计的多模型编排框架才是更健康的终极形态。目前，Sakana的闭源策略更多是商业上的先发优势保护。

定价争议：Fugu的商业化之路有多陡

性能虽好，价格也不菲。Sakana为Fugu设计了按量付费和订阅两种模式。按量付费中，标准Fugu基于实际激活的底层模型动态收费；Fugu Ultra则采用固定价格：每百万输入token 5美元，每百万输出token 30美元。订阅方面，提供20美元/月（标准）、100美元/月（Pro）、200美元/月（Max）三档，分别对应轻量、十倍标准和二十倍标准的使用量。

相比直接调用Claude或GPT-4的价格，Fugu的定价偏高。对于偶尔使用的开发者来说，这可能不算友好。但考虑到它集成了多个顶级模型并自动路由至最佳方案，对于追求性能与稳定性的企业用户而言，这笔钱也许花得值。然而，如果底层模型供应商统一涨价，Fugu的成本也会水涨船高，最终转嫁给用户。透明性不足是另一个隐患——你不知道每次请求到底调用了哪些模型，也不知道是否花了冤枉钱。

Sakana似乎也意识到了这个问题，正在通过企业数字化转型案例来吸引大型客户。对于需要处理敏感专利、进行高级网络安全分析的机构来说，Fugu Ultra的精度和冗余价值远远超过token成本。但中小型公司可能会望而却步，转向更便宜的开源方案或直接使用单一模型。Sakana未来的增长关键，在于能否将成本降到与单体模型接近的水平，同时维持性能优势。

未来展望：多模型编排会成为AI独角兽的新范式吗

Fugu的出现，让业界重新思考“模型即服务”的定义。当模型本身变得可替换、可编排，护城河就不再是参数数量或训练数据，而是编排算法的效率与稳定性。这或许会催生一批新的AI独角兽——它们不训练大模型，而是专注做“AI模型调度平台”。类似操作系统之于硬件，编排系统之于AI模型。

从AI新闻的视角看，这类公司面临的最大挑战是技术迭代速度。底层模型每几个月就更新一代，编排系统必须持续适配新模型的特性和接口。同时，开源社区也在快速跟进——已有项目尝试构建基于开源模型的多代理编排框架。如果开源方案在性能上追平Fugu，Sakana的闭源优势将受到冲击。

另外，监管问题不可忽视。黑盒路由机制让数据流向不透明，尤其在欧盟GDPR框架下，企业和监管机构可能无法接受。Sakana目前选择暂时退出欧盟市场，但长期来看，它必须找到既保护知识产权又满足合规的折中方案。

对于普通人来说，Fugu可能只是又一个AI新闻里的新名词。但它的核心理念——用集体智能对抗单点故障——正在深刻影响AI行业的底层逻辑。未来，我们用的可能不再是某一家公司的模型，而是一个会自己“点兵点将”的智能管家。就像现在的互联网依赖于无数路由器的协作，未来的AI世界或许也依赖无数模型的智能路由。而Sakana Fugu，正是这场变革的先行者。

如果你对AI工具的多样性和实际应用感兴趣，不妨试试AI工具箱中的各种生产力插件，或者用AI画图工具生成一张Fugu概念图来辅助理解。当然，别忘了关注即将出现的更多多模型编排产品，它们可能比今天的Fugu更轻量、更开放。

Sakana推出Fugu系统：AI新闻深度解析多模型编排如何颠覆AI独角兽格局

Fugu初探：当“河豚”成为AI世界的总包工头

解码Fugu：任务分解、智能代理与黑盒路由

免费 AI艺术签名

📖 推荐阅读

性能硬刚：Fugu如何超越Claude Fable 5

打破垄断：Fugu如何化解AI供应链风险

定价争议：Fugu的商业化之路有多陡

未来展望：多模型编排会成为AI独角兽的新范式吗

常见问题

提效录 · 免费AI工具

Fugu初探：当“河豚”成为AI世界的总包工头

解码Fugu：任务分解、智能代理与黑盒路由

免费 AI艺术签名

📖 推荐阅读

性能硬刚：Fugu如何超越Claude Fable 5

打破垄断：Fugu如何化解AI供应链风险

定价争议：Fugu的商业化之路有多陡

未来展望：多模型编排会成为AI独角兽的新范式吗

常见问题

提效录 · 免费AI工具

相关阅读