2026年6月最后一周,科技创投圈接连抛出几颗重磅炸弹。一边是DeepSeek高调宣布“所有部门规模扩大至少一倍”,另一边是智元机器人旗下的灵巧手公司临界点仅用5个月就冲到10亿美元估值。与此同时,苹果罕见抱怨AI数据中心扩张导致内存“从未见过如此大幅上涨”。在这些看似分散的消息背后,一条清晰的主线正在浮现:AI从文本生成向多模态、具身化加速演进,而AI绘画作为多模态最直观的落地形式,正成为检验大模型能力和商业化效率的试金石。

大模型军备竞赛:DeepSeek扩招背后的算力与人才之争

6月25日,DeepSeek一口气放出多个岗位招聘信息,明确表示要将所有部门的规模扩大至少一倍。这家以高效训练著称的AI创业公司,此前凭借开源模型和极低成本在全球开发者社区积累了极高声誉,如今突然提速扩招,透露出两个关键信号。

第一,大模型的竞争已经从“做出来”进入“做得更好、用得更广”的阶段。过去一年,各家大模型训练的重点转向多模态能力,尤其是图像、视频的理解与生成。DeepSeek的扩招很可能是在为下一代多模态大模型储备算力和人才,其中AI绘画相关的图像生成模块将是核心发力点之一。

第二,资金与资源的集聚正在加速。几乎同一时间,无界动力宣布完成超2亿美元天使轮融资,其定位是通用具身智能机器人,核心同样是多模态感知与决策。这些AI创业公司的融资节奏表明,资本正在向能够打通语言、视觉、行动三大模态的团队集中。DeepSeek的扩招,本质上是对“智算密度”的投资——谁拥有更多顶尖研究员和更高效的训练集群,谁就能在多模态赛道上占据先机。

值得注意的还有苹果的表态。苹果公司罕见地公开表示,AI数据中心的快速扩张导致内存需求激增,“从未见过某个零部件价格如此大幅快速上涨”。这从侧面印证了全球大模型军备竞赛对硬件供应链造成的冲击。对于正在冲刺多模态的科技公司来说,不仅要抢人才,还要抢HBM、抢先进封装产能。

AI绘画引爆多模态竞速:DeepSeek扩招、智元灵巧手估值破10亿,科技公司全面押注配图
图片来源:AI生成

具身智能新贵:智元灵巧手估值10亿美元的启示

智元机器人旗下的灵巧手公司临界点,独立发展仅5个月便完成近10亿融资、跻身独角兽行列。这个速度在硬科技领域堪称奇迹。包括百度、蓝驰创投、高瓴创投在内的头部资本密集入局,反映出业界对具身智能“最后一厘米”交互能力的极度渴求。

灵巧手本质上是AI从虚拟世界走向物理世界的关键接口。大模型擅长理解和生成文字与图像,但要完成抓取、操作、装配等物理动作,必须依赖高精度、高自由度的末端执行器。临界点能够在如此短时间内实现四轮融资,说明其技术路径获得了市场认可——将大模型的语义理解能力与精细运动控制算法融合。

这一趋势与当下的数字化转型浪潮紧密相关。制造业、物流业、医疗手术等领域对柔性自动化方案的需求爆发,而传统工业机器人难以适应非结构化环境。具备多模态感知(视觉+触觉)的灵巧手,结合云端大模型的推理能力,有望大幅降低部署成本。据统计,2025年中国具身智能市场规模已达约9150亿元,2026年预计突破万亿。临界点只是这条万亿赛道上的一个缩影。

对于普通用户而言,具身智能可能还比较遥远,但与之共享底层技术的AI绘画工具已经触手可及。例如,用AI画图生成产品设计草图,再用灵巧手进行原型测试,这一闭环正在成为工业设计领域的新范式。

供应链暗流:AI扩张如何重塑芯片与内存格局

苹果的抱怨揭开了AI热潮下硬件供应链的深层矛盾。内存价格“前所未有的大幅快速上涨”,本质上是算力需求从训练侧向推理侧迁移的结果。随着DeepSeek、智元、无界动力等公司纷纷扩大部署,推理侧的HBM、GDDR7甚至DDR5都面临供需失衡。

另一个值得关注的是国产替代的加速。商络电子在互动平台透露,部分AI服务器电源客户已涉及液冷技术,公司与客户合作研发液冷项目,供应元器件并提供配套技术方案。这意味着国内电子元器件供应商正在切入AI数据中心的增量市场。从上游的内存颗粒到中游的散热模组,再到下游的系统集成,整条供应链都在为多模态AI的规模爆发做准备。

对于科技公司来说,硬件成本上涨既是挑战也是洗牌机会。拥有自研芯片能力的大厂(如苹果、华为、英伟达)可以通过架构优化降低对紧缺元器件的依赖,而中小型AI创业公司则需要借助AI工具导航来寻找性价比更高的算力方案。例如,通过云端API调用文生图服务,可以避免自建GPU集群的高额资本支出。

场景落地加速:从短剧到自动驾驶的AI渗透

4K花园旗下AI工具“蝶变3.0”将于7月公测,这是一个典型的垂直场景应用。该工具专门用于提升AI短剧的画质,配合“AI短剧超高清专项扶持计划”,标志着AI生成内容(AIGC)在影视领域的商业化进入快车道。而小鹏汽车则宣布第二代VLA模型即将出海,计划在2027年于海外提供VLM(视觉语言模型)体验,这意味着AI的理解能力正从静态图像延伸到实时驾驶环境。

这些案例的共同点是:它们都依赖多模态大模型在特定场景中的微调与部署。AI绘画是其中的基础能力之一——无论是短剧的帧画质提升,还是自动驾驶的语义分割,都需要强大的图像生成与理解模型作为底层支撑。4K花园的“蝶变”工具本质上就是对现有AI图片生成能力的一次垂直优化。

与此同时,同仁堂医养在香港上市筹资不超过6.716亿港元,虽然本身是传统行业,但其招股书中提到将利用AI进行远程诊疗和健康管理,这又为多模态AI打开了医疗场景的大门。可以预见,未来12个月会有更多类似“蝶变”的垂类工具涌现,覆盖教育、设计、电商、法律等领域。

万亿赛道成型:具身智能产业链的闭环与机遇

正在举行的链博会上,具身智能上下游企业完整展现了从核心零部件(伺服电机、灵巧手、传感器)到整机系统(人形机器人、四足机器人)再到场景应用(仓储、巡检、养老)的闭环。央视数据显示,2025年中国具身智能市场规模约9150亿元,2026年预计达10904亿元,相关企业数量已突破万家。

这个万亿市场并非空中楼阁。它的底层基础正是多模态大模型——包括语言、图像、视频、3D点云、触觉等多种模态的融合理解与生成能力。智元灵巧手之所以被资本追捧,是因为它解决了“理解”之后“执行”的问题;DeepSeek之所以扩招,是因为它需要在“理解”层面做得更深。而AI绘画作为图像模态的核心能力,已经成为整个闭环不可或缺的一环:机器人的场景感知依赖于视觉大模型,人机交互的反馈依赖于图像生成。

对于创业者来说,机会不仅在于底层模型,更在于中间层和工具层。比如抠图背景去除这类基础功能已经被整合进很多AI平台,但针对特定行业(如珠宝摄影、电商主图)的精细化工具仍有很大空白。AI工具箱里收集的数百种工具,正是这种碎片化需求的体现。此外,艺术签名签名设计等轻量级应用也证明了AI在创意领域的潜力。

结语:多模态狂潮下的冷静思考

从DeepSeek的“全员扩招”到临界点的“5个月独角兽”,从苹果的内存吐槽到4K花园的短剧画质工具,2026年的夏天注定是多模态AI加速落地的关键节点。AI绘画作为这一轮浪潮中最先被大众感知的能力,正在经历从“玩具”到“工具”的蜕变。对于科技公司而言,争夺的不仅是算力和人才,更是场景的深度适配能力。而对于AI创业公司来说,在巨头的缝隙中找到垂直痛点,用多模态技术解决实际问题,才是通往下一个独角兽的捷径。