
过去两年,大模型领域的竞赛几乎是以月为单位刷新纪录。当公众还在讨论ChatGPT的对话能力时,中国科技巨头字节跳动悄然在人工智能底层基建上布下重棋。2026年火山引擎Force大会上,一组数据令人瞩目:豆包大模型日均tokens调用量达到180万亿,较发布时增长超1500倍,过去一年翻了十倍以上。这不仅是数字的跃升,更折射出人工智能产业从“秀肌肉”到“拼落地”的深刻转向。
在消费级应用尚未实现规模化盈利的当下,字节跳动CEO梁汝波明确将年度关键词定为“勇攀高峰”,核心策略聚焦提升大模型能力,并把火山引擎PaaS业务提升为公司基础业务。与此同时,视频生成模型Seedance的20亿美元年化收入,昭示着科技产品正以服务企业的姿态找到商业闭环。这场围绕大模型的战役,正在从流量争夺转向价值创造。
豆包大模型的爆发式增长:日均180万亿tokens意味着什么?
tokens调用量是衡量大模型活跃度的黄金指标。180万亿这个数字,相当于每个中国成年人每天通过豆包生成超过一万字的文本内容。如果把这些tokens打印成A4纸,可以铺满整个北京市中心的天安门广场数百次。而更关键的是它的增速:从发布时的百万级到如今的180万亿,增长曲线近乎垂直。
这背后是字节跳动在AI技术基础设施上的持续投入。火山引擎提供的算力平台、推理优化以及模型压缩技术,使得豆包能够以更低成本承载海量用户请求。值得注意的是,豆包并非单一的聊天机器人,它嵌入到抖音、今日头条、飞书等数十个产品中,覆盖内容创作、智能客服、辅助写作等场景。这种“嵌入式AI”策略,与许多企业单枪匹马做独立App截然不同。
然而,高调用量背后也有隐忧。据推算,豆包每天的算力成本高达数千万元,而其应用本身的日收入不足百万元(主要来自电商佣金)。这意味着当前阶段,大模型仍然是一个“烧钱换用户”的生意。字节跳动显然意识到了这一点,在持续优化大模型训练效率的同时,开始调整资源分配方向。

字节跳动战略转向:从大众产品到企业服务的“勇攀高峰”
两个月前,字节高层到访Anthropic的行程被媒体广泛关注。随后内部AI资源开始重新分配:重心从豆包这类面向C端的大众产品,转向服务企业的产品。这种转变并非一时兴起,而是对商业本质的冷静判断。
梁汝波在大会上强调,“火山引擎PaaS业务已转为公司基础业务,对MaaS(模型即服务)业务投入长期坚定”。这句话释放了明确信号:字节跳动不再满足于用AI给自家App锦上添花,而是要做企业级AI基础设施的供应商。截至上年度,累计Topview消耗超1万亿的成员已达200多家,企业客户对AI算力和模型的渴望是真实且持续的。
这种转向与企业数字化转型的大趋势不谋而合。当制造业、金融业、医疗行业开始用AI重塑业务流程时,他们需要的不是某个聊天机器人,而是可定制、可私有化部署、与业务系统深度集成的大模型能力。火山引擎正好扮演了“管道”角色——它把豆包的能力封装成API,让企业客户自行调用,甚至允许客户在自己的数据上微调模型。这种做法比卖软件或卖算力更持久,也更接近AI Agent技术的商业愿景。
Seedance:视频生成模型的商业奇迹与企业级破局
如果说豆包是字节跳动的AI“流量入口”,那么Seedance就是它通向商业变现的“现金牛”。消息显示,Seedance目前的年化收入(ARR)已达20亿美元(约135.74亿元人民币),单月收入超过10亿元——这个数字几乎可以抵消豆包每天数千万元的算力成本。更关键的是,Seedance绝大多数收入来自企业客户。
Seedance的核心能力是视频生成,尤其是其即将发布的3D白膜预演功能,让用户可以在生成最终视频之前,先看到类似于3D建模的“线框预览”,方便进行镜头、构图和动作的迭代。这种技术率先在业内提供,为广告创意、影视制作、游戏开发等行业提供了极大的效率提升。以往一个30秒的广告片可能需要几周时间制作,现在借助AI可以在几分钟内生成多个版本。
企业与创作者可以用Seedance快速生成产品演示视频、营销素材甚至短剧。这也催生了一个全新的科技产品生态:当视频生成变得像打字一样简单,内容生产的门槛被急剧拉低。有意思的是,Seedance的成功也反过来推动了豆包的发展——企业客户在使用Seedance时,往往需要搭配豆包进行脚本撰写、分镜策划,形成“文本+视频”的完整工作流。如果你对这种创意工具感兴趣,不妨试试文生图来快速生成视觉灵感,或者用AI图片生成为视频设计封面图。
算力成本与盈利平衡:大模型商业化的终极考验
尽管豆包调用量惊人,Seedance收入亮眼,但整个大模型行业仍未摆脱“高投入、低回报”的困境。按照公开API价格和毛利率推算,豆包每天消耗的算力成本高达数千万元,而其C端应用日收入不足百万元。即便加上Seedance的10亿元月收入,字节跳动AI板块的整体盈利压力依然巨大。
问题的核心在于:人工智能的边际成本远高于传统软件。每一次tokens调用都需要消耗GPU算力和电力,用户越多、调用量越大,成本线性增长甚至指数级增长。而收费模式却难以同步提升——C端用户对订阅制敏感,企业客户又倾向于按量付费并希望折扣。这导致很多大模型公司陷入“越卖越亏”的怪圈。
字节跳动的解决方案是“错位竞争”:用C端豆包培养用户习惯、积累数据、优化模型;用B端Seedance和火山引擎赚取利润。同时,通过AI工具导航集合各类生产力工具,引导用户从免费体验转向付费使用。这种“C端引流+B端变现”的模式,正在成为行业主流。但能否最终实现盈亏平衡,取决于三个变量:算力成本下降速度、企业客户付费意愿的持续增强、以及模型能力的差异化带来的定价权。
勇攀高峰:大模型能力提升的下一程
梁汝波将2026年关键词定为“勇攀高峰”,核心是聚焦提升大模型能力。这句话看似寻常,实则暗含两层意思:一是字节决心在基础模型研发上继续加码,不因短期财务压力而放缓;二是强调“聚焦”——砍掉那些与核心能力无关的创新尝试,把资源集中在模型层。
大模型的竞争早已不是参数规模的比拼,而是训练效率、推理速度、多模态理解、指令遵循能力的综合角力。字节跳动在视频生成(Seedance)、实时交互(豆包语音)、代码生成(豆包编程助手)等多个方向上同步推进,对算力、人才、数据的消耗堪比“军备竞赛”。但好消息是,随着AI Agent技术的成熟,大模型开始具备工具调用、任务规划、自主决策的能力,这为企业级应用打开了想象空间。例如,用AI自动生成预检分析报告、智能调度物流路线、或者实时生成直播脚本。
可以预见,未来一年,大模型领域的赢家将不再是那些拥有最大参数量的公司,而是那些最懂行业痛点、最能把人工智能转化为生产力的公司。字节跳动的“勇攀高峰”,不仅是技术层面的攀登,更是商业模式的攀岩。
FAQ
什么是豆包大模型?
豆包大模型是字节跳动基于Transformer架构研发的通用人工智能大模型,支持文本生成、代码编写、逻辑推理、多模态理解等多种能力。它通过火山引擎对外提供API服务,日均tokens调用量达180万亿,广泛应用于内容创作、智能客服、辅助办公等场景。
豆包大模型与Seedance在商业模式上有何区别?
豆包主要面向C端消费者,嵌入抖音、飞书等产品中,以免费或低价模式获取用户,收入主要来自电商佣金,目前未实现盈利。Seedance则专注企业级视频生成服务,提供3D白膜预演等专业功能,年化收入达20亿美元,绝大多数收入来自企业客户,已成为字节AI板块的盈利主力。
人工智能如何改变企业视频生成?
传统视频制作依赖专业团队、昂贵设备和漫长周期。基于AI技术的视频生成模型,如Seedance,可以让企业通过文本描述或参考素材,在几分钟内自动生成适配多个版本的视频内容。3D白膜预演功能还允许用户在最终渲染前调整构图和动作,极大降低创意验证成本。这种能力正在重塑广告、电商、影视等行业的科技产品开发流程。