
在AI大模型军备竞赛愈演愈烈的当下,一家日本初创公司Sakana AI却另辟蹊径,用一套名为Fugu的多智能体编排系统,给行业带来了一股清流。本期的AI新闻将带你深入解读Fugu的技术细节、商业逻辑,以及它对当前AI独角兽生态和AI投资风向的潜在冲击。
Fugu初探:当“河豚”成为AI世界的总包工头
Fugu在日语中是“河豚”的意思,Sakana用这种外表圆润、内含剧毒的鱼类来命名其最新系统,暗合了其技术哲学:看似无害的统一接口背后,隐藏着复杂的智能协调机制。Fugu本质上并非一个传统的大模型,而是一个“多模型编排系统”——它以一个标准的、兼容OpenAI API的接口对外提供服务,内部却动态地将用户的查询路由到一群可交换的专业AI代理上。
这个理念的诞生背景非常现实。2025年6月,Anthropic因美国政府出口管制命令,突然撤回了其最强模型Claude Mythos 5和Claude Fable 5的公开访问权限,让众多依赖单一模型供应商的企业措手不及。Sakana的CEO兼联合创始人David Ha(前Google Brain成员)在X上写道:“依赖单一公司的模型来建设国家基础设施是巨大的风险。最近的出口管制表明,顶级模型的访问权限可能一夜之间消失。”Fugu正是为了对冲这种“权力集中”而设计的——它通过动态路由,随时可以替换掉池中的某个模型,避免了供应商锁定和地缘政治风险。
从AI投资的角度看,Fugu代表的是一种“去核心化”的思维。传统AI独角兽都在拼命训练更大的单体模型,而Sakana选择做那个“协调者”。它本身也是一个LLM,但训练目标不是回答所有问题,而是学会如何调用其他LLM来协作解决问题。这种做法让Fugu在基准测试中展现出与Claude Fable 5旗鼓相当甚至更优的性能,同时彻底改变了开发者部署AI基础设施的方式。

解码Fugu:任务分解、智能代理与黑盒路由
Fugu的工作原理可以形象地理解为一个“总包工头”。当收到一个复杂请求时,它不会尝试自己完成所有步骤,而是将问题拆解成若干子任务,然后从代理池中挑选合适的专家模型去执行,最后验证并合成最终结果。Sakana团队在技术文档中强调:“Fugu本身就是一个LLM,它被训练去调用代理池中的各种LLM,包括递归地调用自身实例。”
这一机制基于Sakana在2026年发布的两篇研究论文——TRINITY和Conductor。系统并非靠手工设计的工作流,而是通过学习到的协调策略,自主管理模型选择与验证的整个生命周期。对最终用户而言,这个多智能体集群完全隐藏在标准API端点后面:你发送一个请求,Fugu返回一个结果,中间发生了什么——具体调用了哪些模型、如何协作——都是专有的、不透明的。
这种黑盒设计既是Fugu的护城河,也带来了争议。商业上,Sakana明确表示,其核心知识产权在于这些“非显而易见的协作模式”,因此路由信息被刻意对用户隐藏。不过,为了满足企业数据合规需求,开发者可以手动将特定的模型或提供商排除出路由池,也可以选择不让自己的提示词用于未来的训练数据。目前,Fugu暂时不在欧盟和欧洲经济区提供服务,原因是其黑盒数据路由架构需要与GDPR法规进行对齐。
在实际应用中,Fugu提供了两种变体:标准版Fugu针对日常任务优化,追求高速低延迟,适合集成到聊天机器人和编码环境;旗舰版Fugu Ultra则面向高难度的AI研究、网络安全分析和多步骤专利调研等任务。据Sakana称,Fugu Ultra协调了更深的专家池,在严谨的科学和推理基准上可与行业领先的单体模型匹敌。这种分层设计让AI工具导航领域的开发者可以按需选择,同时也为企业提供了灵活的预算选项。
性能硬刚:Fugu如何超越Claude Fable 5
抛开理论,数据才是硬通货。在Sakana公开的基准测试图表中,Fugu的性能表现相当亮眼。在LiveCodeBench(一个评估代码能力的开源基准,定期更新编程问题)上,Fugu Ultra得分93.2,标准Fugu得分92.9,而Anthropic的Claude Fable 5仅得89.8。在GPQA-D(Diamond)测试——一套包含198道研究生水平的生物学、物理和化学多选题——上,Fugu Ultra和标准Fugu均拿到95.5分,超越此前Claude Mythos Preview的94.6分。
这意味着在AI Agent相关任务(如代码生成、科学研究推理)上,一个精心编排的代理池完全可以与闭源的最强单体模型正面竞争。更重要的是,Fugu的架构天然具备冗余性——如果某个模型提供商出现故障或遭遇监管限制,Fugu可以自动绕行,保障服务连续性。这对于追求高可用性的关键业务场景来说,价值巨大。
不过也要看到,这些基准测试是由Sakana自己发布的,且具体测试集的选择和条件可能存在偏差。第三方独立验证仍待进行。另外,Fugu在通用知识问答、多模态理解等领域的表现如何,目前还没有公开数据。AI独角兽在营销时往往只展示最强的部分,投资者在评估时需保持理性。从AI投资的视角看,Fugu证明了一个方向:未来竞争力的关键可能不再是单一的参数规模,而是系统的智能调度能力。
打破垄断:Fugu如何化解AI供应链风险
Fugu的出现,恰逢全球AI行业对“单一模型依赖”的焦虑达到顶峰。Anthropic的模型撤回事件只是一个缩影——更早之前,OpenAI也曾因政策调整限制过某些地区的API访问。对于将大模型嵌入核心业务流程的企业来说,这种不确定性几乎是不可承受之重。
David Ha在宣布Fugu时直言:“我们证明了一个精心编排的可交换代理池,可以匹配Fable和Mythos这样的受限前沿模型。编排模型是下一个前沿,比更大模型更重要。”这句话直接点出了Fugu的战略价值:它不是要造出世界上最大的模型,而是要成为世界上最好的“模型路由器”。通过整合来自不同供应商的模型,Fugu在AI堆栈中内置了原生冗余。如果某个提供商因大模型训练成本过高而出局,或者因地缘政治被制裁,Fugu可以无缝切换到其他模型,保证业务不中断。
这种思路对于国家层面的AI基础设施意义尤其重大。许多国家担心过度依赖美国公司的模型,正在寻求技术主权。Fugu提供了一种“插件化”的中间层方案——你可以接入本国的模型,也可以接入开源模型,甚至可以通过AI Agent技术定制专属代理。这在一定程度上缓解了“卡脖子”的风险,也为各国发展自主AI生态提供了新的路径。
当然,Fugu本身也是一家商业公司,它的路由策略是封闭的,这又带来了新的依赖风险。只不过,这种风险从“依赖单一模型”变成了“依赖单一编排引擎”。如果Fugu将来被收购或改变商业模式,用户的处境可能同样尴尬。因此,从长远看,开放标准、可审计的多模型编排框架才是更健康的终极形态。目前,Sakana的闭源策略更多是商业上的先发优势保护。
定价争议:Fugu的商业化之路有多陡
性能虽好,价格也不菲。Sakana为Fugu设计了按量付费和订阅两种模式。按量付费中,标准Fugu基于实际激活的底层模型动态收费;Fugu Ultra则采用固定价格:每百万输入token 5美元,每百万输出token 30美元。订阅方面,提供20美元/月(标准)、100美元/月(Pro)、200美元/月(Max)三档,分别对应轻量、十倍标准和二十倍标准的使用量。
相比直接调用Claude或GPT-4的价格,Fugu的定价偏高。对于偶尔使用的开发者来说,这可能不算友好。但考虑到它集成了多个顶级模型并自动路由至最佳方案,对于追求性能与稳定性的企业用户而言,这笔钱也许花得值。然而,如果底层模型供应商统一涨价,Fugu的成本也会水涨船高,最终转嫁给用户。透明性不足是另一个隐患——你不知道每次请求到底调用了哪些模型,也不知道是否花了冤枉钱。
Sakana似乎也意识到了这个问题,正在通过企业数字化转型案例来吸引大型客户。对于需要处理敏感专利、进行高级网络安全分析的机构来说,Fugu Ultra的精度和冗余价值远远超过token成本。但中小型公司可能会望而却步,转向更便宜的开源方案或直接使用单一模型。Sakana未来的增长关键,在于能否将成本降到与单体模型接近的水平,同时维持性能优势。
未来展望:多模型编排会成为AI独角兽的新范式吗
Fugu的出现,让业界重新思考“模型即服务”的定义。当模型本身变得可替换、可编排,护城河就不再是参数数量或训练数据,而是编排算法的效率与稳定性。这或许会催生一批新的AI独角兽——它们不训练大模型,而是专注做“AI模型调度平台”。类似操作系统之于硬件,编排系统之于AI模型。
从AI新闻的视角看,这类公司面临的最大挑战是技术迭代速度。底层模型每几个月就更新一代,编排系统必须持续适配新模型的特性和接口。同时,开源社区也在快速跟进——已有项目尝试构建基于开源模型的多代理编排框架。如果开源方案在性能上追平Fugu,Sakana的闭源优势将受到冲击。
另外,监管问题不可忽视。黑盒路由机制让数据流向不透明,尤其在欧盟GDPR框架下,企业和监管机构可能无法接受。Sakana目前选择暂时退出欧盟市场,但长期来看,它必须找到既保护知识产权又满足合规的折中方案。
对于普通人来说,Fugu可能只是又一个AI新闻里的新名词。但它的核心理念——用集体智能对抗单点故障——正在深刻影响AI行业的底层逻辑。未来,我们用的可能不再是某一家公司的模型,而是一个会自己“点兵点将”的智能管家。就像现在的互联网依赖于无数路由器的协作,未来的AI世界或许也依赖无数模型的智能路由。而Sakana Fugu,正是这场变革的先行者。
如果你对AI工具的多样性和实际应用感兴趣,不妨试试AI工具箱中的各种生产力插件,或者用AI画图工具生成一张Fugu概念图来辅助理解。当然,别忘了关注即将出现的更多多模型编排产品,它们可能比今天的Fugu更轻量、更开放。