
在2026年的创投圈,具身智能成为最吸金的热点之一,但泡沫质疑也随之而来。作为新一代AI工具的典型代表,机器人何时能从实验室走进真实场景?在36氪WAVES2026大会上,一场汇聚了三位创业者与三位投资人的圆桌对话,揭开了AI工具在商业化道路上的真实图景。从深朴智能的酒店场景到乐享科技的家庭信息化,从擎天租的租赁平台到BV百度风投的持续加仓——每一种选择都在回答同一个问题:当所有人都看到泡沫,机器人该从哪里切入才能活下来、赚到钱?
泡沫之下的真实温度:融资烧钱与产业落地的巨大鸿沟
具身智能领域在过去两年经历了前所未有的资本狂欢。以它石智航为例,天使轮融资高达2.42亿美元;初创公司估值飙升,有的甚至尚未出货就被追捧为独角兽。然而,高盛对9家供应链企业的调研显示,没有一家敢说自己接到了大单。这种“融资热、出货冷”的撕裂,让不少投资机构公开承认估值存在泡沫。
但BV百度风投执行董事崔轲迪却给出了截然不同的判断:“这个行业现在不是钱太多,而是钱还不够多。”在他看来,如果将具身智能放到整个AI产业中比较,头部公司的融资规模和估值与数字AI领域的大模型公司相比仍有巨大差距。具身智能面对的是物理世界的人工智能,难度和复杂度远高于数字AI,未来还需要更多资金、人才、场景和基础设施的长期投入。
这种视角转换揭示了泡沫争论背后的本质:短期供需错配与长期价值判断的矛盾。由天宇(凯联资本)指出,当前能赚钱的只是短期供需错配的环节——例如机器人租赁(一天租几千块钱堪比劳斯莱斯)、数据采集的人力外包、甚至投机炒股。这些“快钱”并不能反映产业的真实成熟度,反而可能掩盖技术本身尚未突破的瓶颈。
值得注意的是,AI融资热潮并非均匀分布。崔轲迪透露,他从2022年底就开始关注物理AI方向,当时“具身智能”一词尚未流行。如今百度的投资逻辑是“持续投资新公司 + 对已投公司加仓”。这种早期入场的非共识眼光,与后来追高的共识投资形成了鲜明对比。产业真正的机会,或许就在这些被泡沫舆论掩盖的角落里。

三位创业者的差异化路径:从家庭、酒店到租赁平台
圆桌中,三位创业者分别代表了三种截然不同的商业化路径,恰好折射出AI工具落地的多元可能。
深朴智能创始人李晓飞走的是“从类家庭到家庭”的渐进路线。他类比2017-2018年的自动驾驶——特斯拉先锁定高速领航,再逐步扩展到城区。深朴智能选择切入结构化场景(如酒店的商业服务),先实现洗手间清理、衣物送洗、自助洗衣、前台迎宾等POC功能,再逐步向家庭渗透。这种路径依赖的是“1+2+N”架构:一套具身大模型底座、两条真实数据管路、N个逐步检索的场景。
乐享科技联席CTO李元庆则坚持“把家庭当工厂”的理念。他认为家庭场景的智能化需要三个前提:信息化(通过摄像头让机器人知道房间布局、家具位置)、自动化(基于规则的低成本规控)+ 模型化(基于感知和推理的AI能力)。他的公司从小型家用机器人起步,先通过宠物属性、极客市场的情绪价值让机器人走进家庭,再逐步叠加功能。这种“先上车再升级”的思路,契合了当前AI工具在C端普及的现实——用户愿意为陪伴和新鲜感买单,但尚不愿意为真正的家务劳动支付高价。
擎天租CEO李一言则走出了第三条路——不造机器人,而是出租它们。他的公司估值已超70亿,平台可调度机器人超4000台,且正从文旅、商演等展示型场景转向工业制造、园区仓储等产业一线。李一言是坚定的乐观主义者,他相信机器人终将像打滴滴一样随叫随到。租赁模式的优势在于:无需用户承担高昂的购买成本,降低了AI工具的使用门槛,同时通过规模化调度产生网络效应。这实际上是一种“基础设施先行”的策略。
投资人视角:三套下注逻辑,谁更接近真实?
三位投资人的背景各异,代表了财务、产业、特种垂类三种完全不同的下注逻辑。
BV百度风投的崔轲迪代表着“技术信仰派”。他看重的是智能化能力向物理世界渗透的趋势,无论是自动驾驶、机器人还是消费电子,本质都是智能系统在不同形态下的呈现。他认同具身智能仍处早期,需要长期资本投入,因此不仅不撤离,反而持续加仓。AI Agent技术的快速发展让他坚信,物理世界的通用人工智能终将到来。
凯联资本的由天宇则更关注短期的商业验证。他观察到当前赚钱的真实场景是“供需错配”——例如地方代理租赁机器人(一天数千元)、数据采集外包(人力密集)、甚至炒股。这暗示着产业尚未形成稳定的盈利模式,创业者需要找到真正的“刚需”而非资本市场的故事。AI创业公司如果只依赖融资而无法创造现金流,将面临巨大风险。
云时资本的王子璇看到了“看不见的角落”——船坞、海洋底下、郊区的重工厂房。在这些人类不愿意或不能到达的地方,具身智能已经或即将赚到钱。她强调“为客户的经济账考虑”的公司,反而可能成为第一批真正盈利的企业。这种视角提醒我们:AI工具的价值不在于技术有多炫酷,而在于能否在特定场景中产生可量化的经济效益。AI融资应该流向那些能解决真实痛点的公司。
家用机器人的“不可能三角”:低成本、高能力、绝对安全如何兼得?
业内公认,家用机器人面临一个“不可能三角”:要足够便宜(下探到万元内)、能真正干活(不只是陪伴)、绝对安全(不伤人)。三个条件同时满足,几乎是天方夜谭。
目前消费级人形机器人已能降到万元以下,但功能严重受限——它们更适合做“电子宠物”而非“家务帮手”。一旦要求机器人处理擦桌子、洗碗、整理房间等实际任务,传感器、执行器、AI算法的成本会急剧攀升。李元庆的解决方案是用“分层架构”来应对:底层用基于规则的自动化(如扫地机器人的导航),上层用轻量级的模型集成(API调用)+ 低成本感知(如摄像头)。他相信,不一定需要顶级算力,关键在于软件架构的巧妙设计。
李晓飞则从场景选择入手:暂时不直接进家,而是先在酒店、康养机构等结构化环境中打磨能力。这些场景有固定的布局、可控的风险、明确的任务,能够渐进式地积累数据和技能。AI图片生成技术的进步,让机器人的视觉识别能力大幅提升,但距离理解家庭的非结构化、高动态环境仍有距离。他预测,这一过程可能需要5到10年,类似于自动驾驶的渐进发展。
值得注意的是,两位创业者都强调“数据”的重要性。大模型训练需要海量高质量数据,而家庭场景的数据采集难度极高。乐享科技通过极客用户参与产品设计和测试来获取早期数据,深朴智能则通过与酒店合作进行POC来积累真实操作数据。这种“数据飞轮”效应,可能是打破三角的钥匙。
租赁模式:比售卖更快推开真实场景?
擎天租的发展轨迹让行业看到了另一种可能:不卖机器人,只出租。2026年,这家公司估值已超70亿,可调动机器人超4000台,并且明确将重心从文旅、商演等展示型场景推向工业制造、园区仓储等产业一线。这一模式背后是对产业终局的深刻判断。
李一言坚信:“机器人进入家庭就像滴滴和外卖一样,未来用户打开手机点一下,机器人就从仓库出发,干完活再自行返回。”如果这个预判成立,那么租赁平台就是连接供需的基础设施。当前阶段,租赁能解决两个核心矛盾:一是降低用户试错成本(不用一次性购买昂贵的机器人),二是提高机器人利用率(一台机器可以轮流服务多个场景)。租赁的ROI模型比购买更具说服力,尤其对于中小企业。
但租赁模式也有挑战。崔轲迪指出,机器人的技术迭代极快,出租方可能面临设备贬值风险;同时,不同场景对机器人能力的要求差异巨大,平台化的调度和运维需要复杂的软件系统。不过,AI工具导航类平台的发展经验表明,聚合资源、降低使用门槛往往能催生新的商业物种。事实上,由天宇观察到,当前利润最好的机器人租赁业务是“地方代理”——有人买5-10台设备,一天租几千块钱,就像租劳斯莱斯加长版一样。这种供需错配带来的短期套利,恰恰说明市场对机器人服务有真实需求,只是供给形式还太初级。
从长远看,租赁与售卖可能并存。就像人们既买私家车也用网约车一样,高频使用的场景更可能倾向于租赁(或订阅制),低频但刚需的场景可能倾向于购买。企业数字化转型加速了这种混合模式的形成。
未来展望:具身智能何时真正走进千家万户?
圆桌最后,所有人回到了最核心的问题:时间线。李晓飞倾向于5-10年,与自动驾驶的发展节奏类似;李元庆认为极客市场的先行将加速家庭渗透,但真正通用仍需要10年以上;李一言则表现出更强的乐观,他相信10-20年内人机共生的时代一定会到来。
投资人的态度更为分化。崔轲迪坚持“不是钱太多,而是钱太少”,暗示需要持续投入10年以上;由天宇则认为未来3-5年会出现真正的商业化爆点,但爆点可能不是家庭,而是工厂、物流等B端场景;王子璇的“看不见角落”理论则指向特种领域——深海、高危环境等——这些场景的商业化可能比家用更早实现。
从技术层面看,具身智能面临的瓶颈仍然严峻:VLA(视觉-语言-动作)模型的数据获取、运动控制的鲁棒性、硬件成本的下降曲线……但没有一个瓶颈是绝对无法突破的。文生图、抠图等AI工具的成功历程证明,当技术成本降低到某个阈值,应用就会爆发。机器人行业正在寻找这个阈值。
或许,具身智能走进真实场景的时间点,并不取决于某一个技术突破,而是取决于“AI工具”能否像智能手机一样,成为一个承载无数应用的操作平台。当机器人能够像App一样通过OTA更新获得新技能,当租赁网络覆盖像充电桩一样普及,当用户不再关心“机器人能做什么”而是“我想让机器人做什么”——那个时刻,泡沫的争论将自然消失,只剩下真实的浪潮。