
过去几年,AI创业几乎等同于“在云端训练大模型”“生成文字、图片、视频”,投资人和创业者围着参数规模、算力堆叠打转。但在刚刚闭幕的MWC26上海上,智元联合创始人、总裁兼首席技术官彭志辉抛出了一个截然不同的判断:AI创业的下一个黄金十年,不在数字世界的“魔改”里,而在物理世界的“搬砖”中。当资本开始对炫技式的Demo感到厌倦、对真实场景的商业化落地变得苛刻,AI行业的底层逻辑正在被彻底重构——从“回答一个问题”变成“完成一件实事”。
从数字世界到物理世界:AI创业的主战场正在转移
过去五年,AI创业的主流叙事集中在数字世界:聊天机器人、代码助手、文生图工具、视频生成平台……这些产品本质上都是在处理符号、文字和像素,边界清晰、任务单一。彭志辉在演讲中指出,虽然这类应用消耗了大量Token,但它们的调用量存在明确的上限——一个用户一天不会问1000次问题,一家公司不会无限制生成几百小时的视频。
真正的机会藏在数字世界之外的物理空间里。当机器人开始像人一样感知环境、拆解任务、规划动作、根据执行结果修正行为时,任务空间瞬间从一维的文字交互扩展到多维的“数字+物理”双重维度。这意味着Token的消耗量将呈指数级上升,而消耗Token最多、最稳定的用户恰恰是那些在工厂、仓库、家庭里持续运行的物理实体——具身机器人。
这一判断与《麻省理工科技评论》近期提出的“物理AI”概念不谋而合。实际上,2024年以来,全球AI创业的融资重心已经从纯软件赛道向硬件+模型融合的具身智能方向倾斜。彭志辉强调:“每一次推理、决策、内容生成,本质都是Token流动。Token正在成为AI时代的通用货币。”而具身智能体是唯一能够7×24小时不间断生产Token的“矿机”。
对于AI创业者而言,这意味着必须重新思考产品形态:你的AI能否走出屏幕,在现实世界里“动手”?如果不能,那么在下一波浪潮中,你很可能被那些敢于将AI Agent技术部署到工厂流水线、快递分拣中心和家庭服务场景的团队所取代。

Token即货币:具身智能体如何引爆万亿级新市场?
彭志辉在演讲中分享了一个振聋发聩的观点:“未来Token最大消耗群体就是物理世界的具身机器人。”这句话背后是一个正在加速形成的商业飞轮:机器人既是从云端拉取Token的执行终端,又是通过传感器源源不断回传物理世界数据的流量入口,同时它本身就替代了人类劳动力。三重身份叠加,让具身智能体成为大模型对接物理世界的核心端口。
不妨算一笔账:一台人形机器人如果每天工作16小时,每秒处理10次感知-决策-执行循环,每次循环消耗100个Token,那么一台机器人一天消耗的Token量就超过500万。而一家中型制造企业若部署1000台这样的机器人,日消耗Token量将突破50亿。相比之下,目前最热门的AI画图工具,单个用户平均每天生成图片消耗的Token大约在1万到3万之间。具身智能对Token的吞噬能力,是数字世界应用的数千倍。
这正是AI创业中“平台+应用”模式的终极形态。谁控制了物理世界的Token供应链,谁就掌握了下一代基础设施。英伟达早已嗅到这一趋势,其CEO黄仁勋多次强调GPU算力的新增长曲线不在数据中心,而在现实物理场景。特斯拉计划2025年底实现数千台人形机器人量产;就连以往以“炫技”闻名的波士顿动力,也全面转向商业落地价值挖掘。
数字世界的AI技术(如大语言模型、文生视频)仍然有用,但它们正在变成“原材料”,真正值钱的是将这些“原材料”注入物理世界执行流程的工程能力。对于AI创业者来说,与其在大模型训练的军备竞赛中烧钱,不如思考如何用AI工具导航找到合适的算法与硬件组合,快速在垂直场景跑通商业闭环。
资本不再为Demo买单,真实场景成为AI创业的生死线
彭志辉在演讲中直言不讳:“资本不再只为Demo买单了,行业必须在真实场景里落地商业价值。”这句话戳破了AI行业过去几年的泡沫——大量初创公司靠一段精心剪辑的机器人后空翻视频拿到融资,但产品从未进入过任何一家工厂的实际产线。投资人开始要求看到ROI:你的机器人在产线上每小时能替多少人力成本?故障率有多高?维护成本如何?
这种转变是理性的回归。从AI创业的历史看,2018年前后的语音助手热潮、2021年左右的自动驾驶Demo狂欢,都曾经历过类似的泡沫破裂期。彼时资本追逐“未来感”,但缺乏可量化商业指标的项目最终多数折戟。如今,具身智能赛道正在重蹈覆辙但更早地被“敲醒”——彭志辉用智元内部的“XYZ三条曲线”清晰地划分了产业发展周期,为创业者和投资人提供了判断标尺。
X曲线(开发尝鲜期)是目前行业主流阶段:机器人以跳舞、情绪互动等表演场景为主,验证底层运动技术可行性。这条曲线的商业价值天花板极低,仅适合做技术验证和品牌曝光。Y曲线(部署成长期)是行业即将进入的阶段:机器人具备像人一样的完整交互和作业能力,大规模落地真实场景,形成数据飞轮。Z曲线(部署普及期)预计5年左右到来,届时海量场景数据积累完成量变到质变,具身智能迎来自己的“GPT时刻”。
彭志辉强调,智元已经将资源全面转向Y曲线。这意味着AI创业者必须迅速放弃“秀肌肉”思维,转而深耕工业制造、仓储物流、家庭服务等真实场景。比如在电子产品组装线上,机器人需要识别上百种不同形状的零部件、完成毫米级的精密装配——这远比在实验室里跳过一支舞难得多,但只有啃下这些硬骨头,才能赢得资本的长期信任。
智元的三条曲线:从开发尝鲜到部署普及的演进路径
“XYZ三条曲线”是理解这一波AI创业节奏的关键框架。X曲线对应的是“能做”的验证阶段,Y曲线对应“能挣钱”的落地阶段,Z曲线对应“能超越人”的规模化阶段。目前绝大多数具身智能公司仍停留在X曲线,但彭志辉已经明确表示:“智元内部的研发资源和商业化投入,已经全部向Y曲线倾斜。”
Y曲线的核心特征是什么?第一,机器人不再做单向表演输出,而是实现完整的“感知-决策-执行-反馈”闭环。第二,部署在真实场景(如仓库、工厂、零售店)中,每天产生可量化的效率提升。第三,通过持续运行积累物理世界数据,形成“数据飞轮效应”——数据越多,模型越准;模型越准,机器人越可靠;越可靠,客户越愿意部署更多机器人,从而产生更多数据。
这背后的底层支撑是企业数字化转型的需求爆发。过去几年,企业上云、数字化管理已经普及,但物理世界的操作仍然依赖大量人工。具身智能的出现,让数字化转型第一次有机会覆盖“手”和“脚”。例如,一家电商仓库如果引入拣选机器人,不仅能节省30%的人工成本,还能将订单处理速度提升50%以上。这种切实的经济价值,正是资本愿意在Y曲线阶段下重注的原因。
沿着这条路径,当Z曲线到来时,具身智能将产生“超越人的价值创造”——机器人不仅替代体力劳动,还能通过海量数据的学习,发现人类从未注意到的工艺优化点。彭志辉预测这一阶段大约需要5年,而AI创业者的窗口期就在这5年之内。要想站上Z曲线的浪尖,现在就必须在Y曲线中积累场景数据、打磨工程可靠性。
跨界融合:移动网络与具身智能的协同进化
彭志辉的演讲还有一个很容易被忽略的洞察:具身智能的发展和移动通信行业高度相关。他提出,过去移动网络连接人、手机、各类终端;未来网络的核心连接对象会变成自主智能体。这些智能体需要在物理世界完成感知、决策、执行、反馈的完整闭环,并且长期在线运行。
这对通信网络提出了全新的要求。当前的5G网络主要优化的是“人看视频”“人刷直播”这类大带宽、低时延应用,但机器人集群的通信模式完全不同:不仅需要毫秒级的控制信令时延,还需要大规模的边缘计算节点来承载本地化的推理任务。如果每个机器人每次抓取动作都要回传云端,时延和带宽都不允许。因此,AI技术与5G/6G网络的融合,将成为下一轮基础设施投资的重点。
对于AI创业者而言,这是一个巨大的跨界机会。一方面,普通创业者不需要自己造芯片或做基站,但可以围绕“机器人+边缘云”的架构,提供中间件、调度平台、运维工具。另一方面,抠图、文生图等纯数字工具虽然仍有一席之地,但它们的最佳场景是在物理世界的前端——比如机器人通过摄像头识别待加工物料时,先进行背景去除处理,然后再进行定位抓取。这种“数字工具物理化”的思路,恰恰是AI创业降本增效的好方法。
彭志辉特别强调,行业正在集体转向具身智能赛道,这不是智元一家的判断。特斯拉、英伟达、波士顿动力等巨头的动作已经给出了明确的信号。伴随网络基础设施的升级,未来5年人形机器人的出货量可能从现在的几千台增长到百万台级别,届时移动网络的流量格局也将被彻底改写。
未来展望:当机器人成为最大Token消耗群体,AI创业何去何从?
假设彭志辉的预测成真——5年内具身智能迎来“GPT时刻”,届时物理世界机器人每天消耗的Token总量超过数字世界所有应用的总和。这意味着什么?意味着整个AI产业链的价值分配将发生根本性位移。
上游的算力提供商将迎来第二增长曲线。数据显示,目前数据中心约70%的算力用于训练,30%用于推理。但在具身智能时代,推理算力将占据绝对主导,且对实时性、低功耗的要求远高于训练场景。中游的模型厂商同样面临转型:单纯的大语言模型不够用了,需要多模态感知模型、交互决策模型、运动控制模型三者深度融合。下游的应用层则从“APP商店”变成“机器人市场”,每个行业、每种工况都可能需要一个定制化的机器人服务方案。
对于AI创业者,最务实的选择或许是找到一个具体场景,死磕“可靠性”和“成本”。比如做{AI图片生成}的公司,可以尝试将其技术用于建筑工地自动监控——实时生成对比分析图,标注安全隐患;做签名设计的团队,可以考虑开发机器人手写签名适配工业流程的模块。工具型AI和物理世界的结合点远比想象的多。
当然,挑战同样严峻。物理世界的不确定性是最大的敌人:环境光线变化、物体摆放偏移、突发状况……这些都是数字世界里不存在的难题。彭志辉坦言,智元在Y曲线阶段的一个核心任务就是提升机器人的鲁棒性,使其在99%的现场工况下都能正常工作。这需要大量的工程实验和现场数据积累,不是单纯靠算法优化就能解决的。
回顾整个演讲,彭志辉传递的核心信息可以用一句话总结:AI创业的黄金时代才刚刚开始,但前提是,你必须走出“屏幕”,走进真实世界的每一次抓取、每一次行走、每一次螺丝拧紧。那些愿意在这个时代做“苦活”“累活”的创业者,将在5年后收割最大的果实。