
当马斯克的Neuralink用1024通道的脑机系统在瘫痪患者身上实现意念控制鼠标时,另一条更激进的路径正在中国悄然铺开——直接对视觉皮层进行像素级写入,让盲人“看”到图像,并让大脑中的抽象语义与AI模型直连。这不是科幻片里的桥段,而是一群北大、上科大科学家正在推进的真实项目。芯生视界,这家刚完成近亿元种子轮融资的侵入式脑机接口公司,正试图把一种全新的AI工具嵌入人脑,重新定义人与机器的对话方式。
人机融合的终极赌注:科学家团队为何此时入局?
芯生视界的创始团队堪称“全明星阵容”:创始人王茜来自北京大学心理与认知科学学院、IDG麦戈文脑科学研究所;联合创始人李远宁来自上海科技大学,是卡耐基梅隆大学人工智能和神经科学博士,曾在加州大学旧金山分校Edward Chang实验室从事博士后研究多年;联合创始人还包括北京大学具身智能、脑机芯片和类脑芯片方向的专家。这样一支由多位国家“脑计划”脑机接口方向“青年首席”组成的队伍,选择在2024年下场创业,其核心判断只有一个:技术与市场窗口同时打开。
从技术角度看,过去十年间,神经编解码算法、高通量芯片和AI大模型的突破,让原本遥不可及的“人脑-机器直连”变得可能。AI Agent技术的进化更是放大了这一想象空间——如果AI可以自主理解并执行任务,那么直接在脑机层面实现语义级的交互,将彻底颠覆键盘、语音等传统交互方式。从市场角度看,国内已经出现估值百亿的脑机接口公司,但大多聚焦于运动功能重建(如控制机械臂、轮椅),而芯生视界选择的视觉和语言重建赛道,尚处于“无人区”。
李远宁在接受采访时坦言:“运动控制需要记录的维度较低,比如手臂运动只需要不到十个自由度的神经信号。但真正的视觉重塑和自然语义解码,每个环节对应的都是上千或上万维度的信息并发。”这意味着大模型训练和神经编码算法需要同时处理极高维度的非线性关系,而这正是他们团队积累最深的领域。
值得注意的是,这轮近亿元种子轮的领投方是经纬创投,跟投方包括星连资本、燕缘创投、水木创投,既有头部VC,也有北大、清华系的机构。这种“科学家+顶级基金”的组合,在当前[[AI融资]]趋紧的大环境下显得格外耀眼。多位投资人表示,他们押注的不仅是技术本身,更是“人机融合”这个十年一遇的范式革命。

“神经显卡”:高通量脑机芯片的破局逻辑
柔性电极是当前多数侵入式脑机接口公司的核心切入点,但芯生视界认为,真正决定脑机交互上限和信息通量的,是电极之下的芯片和神经编解码算法。他们为此提出了一个极具比喻性的概念——“神经显卡”。
“就像AI的爆发离不开强大的显卡,脑机接口也需要一种能够支撑大脑极端高带宽数据流双向闭环的硬件基座。”李远宁解释道。芯生视界的方案是开发自研的脑机芯片,目标是实现万通道、一体式植入。目前,他们是国内为数不多流片出28nm级脑机芯片的团队,现有的芯片支持256通道,今年计划推出更高通量、支持双向交互的版本。
为什么一定要高通量?一个简单的对比就能说明问题:马斯克的Neuralink早期植入了1024通道,但实际发挥作用的只有几百通道——因为运动控制对通量要求很低,几个自由度的信号就能控制鼠标。但视觉重建完全不同。“你想在盲人的脑海里像素级写入一张清晰的图像,或者直接解码‘脑海中飘过的一个复杂抽象想法’,每一个环节对应的都是上千或者上万维度的信息并发。”李远宁说。
然而,做脑机芯片是“带着镣铐跳舞”。芯片需要植入大脑,因此必须尺寸小、功耗低,同时满足高通量实时并发和双向交互。这导致芯片研发极其烧钱,一次流片成本可能高达成百上千万元。目前整个脑机接口赛道获得的[[AI融资]]规模还远不及芯片、具身智能等领域,这使得芯生视界不得不将有限的资源集中到最关键的技术突破上。企业数字化转型中常见的大规模芯片量产经验,在这个领域几乎不适用,因为市场需求尚未形成规模效应。
视觉重建:从光感到像素级画面的技术鸿沟
为什么先做视觉重建?答案很简单:临床需求巨大且无替代方案。中国最常见的三种残障类型是肢体、视力和听力残疾,其中肢体残疾有义肢方案,听力障碍有人工耳蜗,但针对全盲患者,植入式脑机接口几乎是唯一的复明手段。
芯生视界的王茜团队早在2020年就发表了“人类视皮层电刺激诱发彩色视觉幻觉的映射机制”,在临床病人身上完成了视皮层单神经元记录。通过电刺激不同位置的初级视觉皮层,可以让患者感知到视野中不同区域出现色觉和光感——比如左上方有红色,右下方有蓝色。这相当于在“盲人的黑屏”上点亮了像素点。但距离真正“看到”清晰的画面,还有两道巨大的技术鸿沟。
第一道是动态视觉中大脑环境的补全机制。人类眼球只有很小一片区域具备高分辨率(中央凹),大脑依赖高频扫视和内部的世界模型来“脑补”出完整场景。初级视觉皮层并不是简单的像素网格,它存在大量的横向抑制和跨脑区反馈连接——点亮一个电极可能会抑制周围的神经元。如果将一万个电极当成一万个独立像素去同时激发,结果只会得到一片模糊。文生图领域的扩散模型在处理图像生成时同样面临类似的“一致性”挑战,只不过大脑的并行计算机制比任何AI模型都要复杂。
第二道是利用神经可塑性进行“人机共同进化”。当经过算法编码的电信号输入盲人大脑时,对大脑而言这是一种完全陌生的“语言”。患者不是一接上设备就能立刻“看懂”世界,而是需要经历一个类似强化学习的主动适应过程。这就像刚戴上助听器的聋人需要重新学习聆听,但视觉重建的适应周期可能更长。不过,芯生视界团队在国际神经编码比赛Algonauts中,2021年和2023年两度获得全球冠军,证明了他们在复杂场景视觉编码算法上的领先地位。2025年该比赛的冠军是Meta AI,说明顶尖科技公司也开始盯上这个领域。
语言解码:高维语义空间的直连革命
如果说视觉重建解决的是“输入”问题,那么语言解码解决的就是“输出”问题。目前所有的侵入式语言脑机接口工作,本质上还是在解码构音器官的精细运动——比如口、唇、舌、咽的肌肉信号,然后合成语音。这相当于把“说话”这个动作拆解成十几个自由度的运动控制。但李远宁认为,这远远不够。
“语言本身是受制于人类运动器官物理约束的一种低带宽的有损压缩。”他说。人类的语速大约在每分钟150-200个单词,大脑中的想法却在以极高的速度流动。芯生视界的终极目标是打破这种束缚,直接从大脑的高维语义空间解码抽象想法,实现“思想直出”。这意味着未来的人机交互可能不再需要经过语言和文字中转,人脑可以与AI模型直接对接。{{LINK:AI图片生成}也可以看作一种从文本到视觉的高维映射,而脑机接口则是从神经信号到语义的高维映射。
为了实现这一目标,团队需要大量颅内多模态数据。芯生视界已经积累了百余例患者的视觉皮层电刺激数据库,以及国内最早的侵入式汉语脑机接口研究成果。汉语作为一种带有声调的语言,其神经编码机制与英语差异显著,这使得他们在本土化数据上拥有独特优势。李远宁承认,语言解码的难度甚至超过视觉重建,因为“抽象想法”的神经表征更加分散和不稳定,但这恰恰是下一代人机交互的核心问题。
融资风向:AI浪潮下的科技公司新战场
芯生视界的种子轮融资是近期[[AI融资]]领域的一个标志性事件。一方面,它证明了投资人愿意为前沿科学团队和硬核技术买单,即便产品商业化路线图还很遥远。另一方面,它也反映出[[科技公司]]正在加速布局脑机接口赛道。
从全球来看,Neuralink已经完成了首例人体植入,估值超过50亿美元;国内也有多家脑机接口公司估值突破百亿。但芯生视界选择了一个差异化的定位:不做运动功能重建,而是做视觉、语言和具身融合。他们认为运动功能重建积累的数据飞轮很难迁移到认知功能上,因为运动控制的维度较低,而视觉和语言涉及极高维度的非线性编码。这种差异化策略,使得他们在赛道中拥有更清晰的壁垒——至少短期内不会与巨头正面竞争。
值得注意的是,投资方阵营中出现了“北大系”和“清华系”的机构同时注资,这在创投圈并不常见。两位顶校系资本的同台,从侧面反映了他们对这项技术的战略期待。{{LINK:AI工具导航}可以帮助创业者发现这类前沿赛道中的工具和资源,但脑机接口这类“原子级别”的技术,显然比任何软件工具都更依赖科研积累。
未来图景:AI工具如何重塑人机交互边界
如果芯生视界的技术路线能够走通,那么未来的人机交互将发生根本性改变。目前我们依赖键盘、触摸屏、语音甚至脑电波帽等“外设”来与计算机交流,而侵入式脑机接口一旦成熟,将实现“意念直连”。届时,AI将不再是屏幕里的应用,而是大脑中的“共生体”。
“未来,思想的交互也许不再需要被降维成显性的语言或动作。人脑或能与AI实现语义级的直连。”李远宁说。这种“碳硅融合”的模式,可能成为人机交互的终局。当然,这需要解决一系列问题:长期植入的生物相容性、信息安全性、伦理问题、以及如何让大众接受“大脑里装芯片”这件事。
从更务实的角度看,短期内视觉重建和语言解码的落地将首先造福失明、失语患者。这本身就是一个巨大的医疗市场。而随着算法的迭代和芯片成本下降,{{LINK:抠图}、{{LINK:艺术签名}等日常AI工具或许在十年后看起来就像“石器时代”的玩具——因为真正的AI工具将直接从神经信号中提取用户的意图,生成定制化的内容。
芯生视界的种子轮只是起点。在脑机接口这条漫长的赛道上,技术突破、融资节奏、临床审批、量产能力,每一项都是生死考验。但有一点已经明确:当北大科学家亲自下场创业,当一线基金用近亿元真金白银投票,人机融合的未来,正在从科幻变成可触摸的现实。