当具身智能(Embodied AI)逐渐成为全球人工智能竞争的新焦点,一个新的问题开始浮出水面:机器人未来依靠什么数据成长?
互联网时代,大语言模型依赖海量文本数据完成能力跃迁;而进入 Physical AI 时代,机器人真正需要的是人与真实世界交互过程中产生的数据。但相比已经相对成熟的视频、动作捕捉和遥操作数据,人类操作过程中蕴含的神经意图、发力过程、微控制等信息,依然是整个行业最缺失的一块拼图。
近日,雪梦未来(SnowOrigin)宣布获得龚虹嘉、陆奇以及海外机构投资。这支来自北京大学的创业团队没有选择去研发机器人本体,而是将目光放在了更底层的数据入口——利用非侵入式神经接口采集人类操作数据,希望成为 Physical AI 时代的人类操控数据基础设施。
陆奇长期关注 AI 基础设施、世界模型以及下一代智能系统的发展方向;龚虹嘉则持续布局具有底层技术壁垒的新一代硬科技企业。从两位投资人的投资逻辑来看,他们关注的通常不是单一产品,而是未来产业链中的关键基础设施。
目前,具身智能行业普遍采用第一视角视频、动作捕捉、遥操作等方式采集训练数据,这些方案能够记录机器人完成了什么动作,却难以回答另一个更重要的问题——人为什么这样操作,以及操作过程中是如何不断调整动作的。
这部分隐藏在人类神经信号中的信息,才是未来机器人真正需要学习的数据。因此,公司选择从 sEMG(表面肌电)运动神经信号切入,希望构建区别于传统视觉数据的新一代具身数据采集体系。
这种定位,也意味着它更像一家数据基础设施公司,而不是一家单纯的硬件企业。
创始人秦旭毕业于北京大学计算机学院计算机应用技术专业,来自高文院士、黄铁军院长领衔的北京大学编解码国家工程实验室团队,长期从事神经接口相关技术研发。
联合创始人王智林毕业于北京航空航天大学软件开发环境国家重点实验室,长期从事人工智能、计算机视觉方向研究,在国际顶级 AI 学术会议发表多篇论文,其中单篇论文引用超过2400次。
这样的团队构成,也反映出公司的技术路线并非单纯依赖硬件,而是融合了神经科学、信号处理、计算机视觉以及人工智能等多个方向。
对于需要长期积累算法、硬件和数据能力的神经接口赛道而言,这种交叉背景具有一定优势。
产品层面,目前雪梦未来已经推出神经腕带、全景头环等可穿戴设备,并持续研发新一代数据采集终端,希望以更加轻量化、低成本的方式完成大规模数据采集。
与目前大量依赖实验室环境的动作捕捉设备、动捕手套、遥操作系统相比,可穿戴神经接口最大的优势在于,它几乎不会影响用户正常生活。
佩戴设备之后,用户可以在真实生活场景中完成工作、学习、运动甚至日常操作,而系统则能够持续记录整个操作过程。
相比只能记录人体姿态变化的视频或动作捕捉系统,这套方案不仅能够采集手部运动轨迹,还能够同步获得发力信息、肌肉活动以及微控制过程,从而形成更加完整的人类操控数据。
借助这种方式,将真实世界的人类交互过程持续沉淀为可训练的数据资产,为机器人训练提供新的数据来源。
如果说神经腕带负责采集数据,那么真正决定数据价值的,则是背后的 AI 解码能力。
雪梦未来自主研发了 NMH(Neural Math Hybrid)AI 解码模型,可以对 sEMG 神经信号进行实时解析,将肌肉活动进一步还原为姿态、动作意图、发力趋势、微控制以及环境上下文等结构化信息。
换句话说,它并不是简单地读取肌电信号,而是在尝试把原本复杂、噪声较大的神经信号翻译成 AI 可以直接理解的数据。
这也是团队希望解决的核心问题——让机器人不仅知道手动了,更能够理解为什么这样动用了多大力过程中如何调整。
对于未来世界模型以及具身智能而言,这部分数据的价值,很可能远高于单纯的视频数据。
实际上,真正困难的部分并不在于能不能采到信号,而在于能否持续、稳定、准确地采集高质量神经数据。
根据团队介绍,目前国内不少肌电手环仍采用8通道设计,采样率约200~250Hz,信噪比二十多 dB。而雪梦未来已经实现更多通道、更高采样率,信噪比达到43 dB以上,同时还需要兼顾小型化、低功耗以及可穿戴体验。
例如,不同人的皮肤阻抗、肌肉结构差异较大,运动过程中还会产生接触噪声、运动噪声以及信号传输噪声,因此不仅需要硬件设计,还需要大量人体实验和算法训练不断优化。
团队表示,他们已经进行了大量定制设计和人体实验迭代,逐步形成了硬件、算法以及模型协同优化能力。
第一条路径,是做人机交互入口。公司希望利用神经腕带,为 AI 眼镜、机器人等智能终端提供更加自然的人机交互方式。目前,已有多家头部 AI 眼镜企业表达了合作意向,希望利用神经信号实现更加自然的控制体验。
第二条路径,则是更长期的发展方向——建设 Physical AI 的人类具身数据基础设施。团队认为,未来机器人真正稀缺的资源并不是算力,而是高质量的人类操控数据。通过持续采集人与真实世界交互过程中产生的神经信号、多模态感知以及环境信息,可以形成面向机器人训练、世界模型训练的数据资产。
如果这一模式能够实现规模化,其商业价值或许将不仅体现在硬件销售,而更可能体现在长期的数据服务能力上。
过去几年,具身智能行业的竞争主要集中在机器人本体,包括机械结构、控制算法以及运动能力。
但随着越来越多企业进入这一赛道,一个新的瓶颈开始出现——高质量训练数据不足。
目前主流的数据来源仍然是视频、动作捕捉和遥操作,这些方式能够帮助机器人学习动作轨迹,却很难完整反映人类操作背后的神经意图和控制过程。因此,越来越多企业开始探索新的数据采集范式,例如第一视角采集、触觉传感器、肌电信号、脑机接口等,希望获取更加接近人类真实控制机制的数据。
根据公开消息,雪梦未来选择的 sEMG 神经信号路线,正是这一趋势下的新尝试。它并不直接参与机器人本体竞争,而是试图成为机器人训练数据链条中的上游基础设施。从产业发展的角度看,这种布局更接近于卖铲子而不是淘金,如果未来 Physical AI 对高质量操控数据的需求持续增长,其价值也有望随着整个产业的发展不断放大。
互联网时代,谁掌握数据,谁就掌握模型;而在 Physical AI 时代,高质量的人类操控数据同样可能成为决定机器人能力上限的关键资源。
雪梦未来此次获得陆奇、龚虹嘉等投资,资本看中的或许并不仅仅是一款神经腕带,而是一个更长远的判断:未来机器人学习世界,不仅需要看见人的动作,更需要理解人的意图。
如果说视频告诉 AI 的是发生了什么,那么神经信号试图回答的,则是为什么会这样发生。而这,或许正是下一代具身智能数据基础设施最值得关注的方向。返回搜狐,查看更多