对话Noitom Robotics CEO戴若犁:没有人比我更适合解决机器人的数据问题 | GAIR 2025

周六的诺亦腾机器人(Noitom Robotics)公司楼下,阳光洒在地上,我们见到了戴若犁博士——这位诺亦腾的联合创始人,现在的身份还多了一个:诺亦腾机器人公司的创始人/CEO,身上既有技术的敏锐,又有创业者的果敢。

回忆十多年前诺亦腾创立的缘起,戴若犁依旧能脱口而出 iPhone 首个陀螺仪芯片的产品代号——L3G4200D。

正是这颗小小的芯片,让他嗅到了机会,成立了诺亦腾。

从影视特效,到VR交互,到数字化医疗,诺亦腾的足迹遍布多个赛道。而当属于机器人的浪潮翻滚之时,他又敏锐地洞察到了机器人数据。

“2024 年全年,机器人为诺亦腾带来的营收涨了 5 倍,25 年又涨了,最终两年涨了 40 倍。作为一个企业管理者,肯定不能忽略啊!”戴若犁笑道。

于是,就在今年年初他毅然决定将机器人业务拆分出来,做一个机器人数据公司。谈及这份选择,他语气笃定,“我就是最适合做机器人数据公司的人,诺亦腾机器人(Noitom Robotics)也是行业里面唯一清楚数据这个业务该怎么做的公司!”

值得关注的是,戴若犁博士莅临 2025 年 GAIR 全球人工智能与机器人大会的数据专场,带来了《用动作捕捉技术构建具身智能数据工厂》的主题分享。

GAIR 大会聚焦人工智能的核心技术、前沿趋势与产业落地,长期吸引来自全球的技术领袖和科研人士。本届大会将于 2025 年 12 月 12-13 日在深圳·博林天瑞喜来登酒店举行,与产业界和学术界的嘉宾共同研讨人工智能的下一步发展。

以下是 AI 科技评论与戴若犁的对话,AI 科技评论对其进行了不改原意的编辑:

01Noitom Robotics 是家机器人的数据公司

AI科技评论:机器人公司拆分出来的契机是什么?

戴若犁:机器人公司是在非常好的市场机会下催生的,诺亦腾 14 年就开始卖产品,已经卖了十来年了。在这十几年里,其实客户里面一直都有机器人的应用,一些老牌的机器人企业,以及 Stanford、UC berkeley、Tokyo Robotics 这些跟机器人相关的科研机构。

但是机器人用户在诺亦腾的整体营收里的占比一直都是个位数,低于 5%。我作为企业管理者甚至在报表上都看不到有一个分类叫做机器人,只有一个分类叫做泛科研,里面有一部分是跟机器人相关的,比如科研占到百分之十几,里头有 3% 是跟机器人相关的,所以我根本就关注不到这个大方向。

但在 2023 年的下半年大概九、十月份,发生了一个巨大的变化,当时美国有两家耳熟能详的做机器人的企业跟我的美国同事提了一个采购需求,那个采购需求大概是百套动作捕捉设备。

这个需求在我们看来完全是疯狂的、impossible 的,我认为是一个骗局,可能想要骗底价,因为大订单肯定会给个三折,最后可能买个三五套就算了。

从23年的奇怪询价函开始, 24 年全年机器人在整体营收里面的订单总金额涨了 5、6 倍; 25 年比 24 年又涨了大概 6 倍或者 7 倍,两年最终涨了接近 40 倍,这种情况对于企业管理者来说肯定不能忽略了。

所以 24 年年初我就觉得事情不对,需求涨的太猛了,就去看他们到底拿设备在干啥?发现是在采数据。以前动捕的数据是以秒计的,电影行业的动捕每秒是大几千块钱、几万块钱的。

机器人行业要的数据单位是小时,或者是万条、百万条数据,或者是 10 小时,百小时。而且今年特别卷,今年下半年因为有几个几十万小时的工作突然出来了很好的结果,所以现在跟我们聊数据的需求都是按 10 万小时记的,甚至还有人来聊几十万小时、百万小时的一些可能性。

所以机器人行业跟以前的需求数量不一样,以前也就几千条、每条十几秒的数据的需求,现在动不动就是千万条。我发现这个事情发生了本质的变化,需求的天花板被捅破了。商业模式也有很多有意思的创新点可以做,不光是卖硬件和卖服务,还可以做自有数据集。所以在今年年初,我把机器人公司从诺亦腾里面拆出来,做了一个新公司。

AI科技评论:诺亦腾机器人(Noitom Robotics)公司的融资情况?

戴若犁:已经完成了两轮累积数亿元的融资,一些新的信息即将公布。有可能就是下周公布吧,雷峰网(公众号:雷峰网)帮我发一下?

AI科技评论:诺亦腾机器人(Noitom Robotics)公司是 to B 赛道的?

戴若犁:是的,这是一个非常典型的 to B 业务。

首先我要讲清楚一点,也是借雷峰网的平台跟大家说清楚:诺亦腾机器人(Noitom Robotics)不是一家机器人数采设备公司,也不是一家数采项目服务公司,诺亦腾机器人是一家机器人的数据公司,交易的界面是数据本身,我们也会卖设备,也会做服务,但是卖设备跟做服务就为了四个字——交个朋友。

对我们来说,卖设备跟做服务就是为了服务将来的数据客户,我们也不指着卖设备跟做服务去赚钱。我们希望最终能够为我们的服务对象,比如互联网大厂、机器人企业、具身智能的模型公司等长期的数据业务伙伴,给他们提供的服务是数据本身。理想情况下你别跟我买设备,我来投 Capex、投前置的固定资产,我直接给你数据就好。

我们希望在运营层面重一点,在交割交付的界面轻一点。一个以数据本身作为交割和交付的界面,对我们来说是更加好的一个商业模式,也减少了卖一大堆设备需要给客户做上门的技术支持。希望所有繁琐的需要拉扯的东西都能够发生在我们自己的体内,而不是发生在客户之间的交割界面上。

AI科技评论:有做得特别好的大型数据公司吗?

戴若犁:美国就有最大的三家,Scale AI、Mercor 和 Surge AI。Surge AI 的 Infra 和工具链做得特别好,Mercor 原本是做 AI 的人力招聘,所以它在数据服务里的专长是用 AI 去筛选人,面试人,选择最正确的人,把这人卷的非常好,管理的非常好。Scale AI 的 Benchmark 和数据的利用比如 AI 标注等工作做得非常的好,模型能力也不错。

这三家各有各的专长,都是十亿到数十亿美金收入,都非常厉害,只是没有浮出水面,因为是作为一个低调的 to B 的闷声赚钱的数据公司,其实行内都知道他们。

而国内做的最好的数据公司不一定是上市公司海天瑞声。各个大厂都有自己的数据服务公司,业务量非常的大。还有曼孚也做的蛮好的。

数据本质上是一个 to B 的业务,特别是大模型跟自动驾驶,由于甲方拥有数据的来源,生数据(raw data)获取的能力上甲方比乙方更擅长,甲方有大量的车队可以把数据给开回来。那么数据公司在那边就变成了类似于一个人力外包的 BPO 服务,相对苦一点。

在美国可以众包到全球,它的劳动力价差大一些,如果比较讲究工具链的 AI 能力、labor 的筛选能力,就能够把毛利做得高一点。可能在国内服务,劳动力价差就没有了,外包成本置换的毛利空间就会稍微小一点,会做的比较辛苦一点。所以做出海的生意都做的不错,做本地的 BPO 服务的生意都做的比较苦一点。

所以为什么之前在你印象当中会觉得没有什么数据公司做的好?一方面肯定是人家闷声发大财,低调,但更本质的是因为传统的数据公司服务的是大模型和自动驾驶,甲方获取数据能力相对比较强一点,给到的活儿变成了招人和点鼠标,溢价不会特别高,但是机器人行业不一样,甲方没数据,所以有一些新的机会。

AI科技评论:那你们会对标这些公司吗?

戴若犁:其实并没有直接对标,业务逻辑和商业模式不太一样了,机器人对于数据的需求这件事情 23 年年底才出现, 24 年萌芽,到了 25 年才微微的上了一点体量,明年可能是一个非常大的发展期,所以没有任何企业是可以对标的。

从生意模式和能力储备上面来讲,刚才说的美国那三家可以做一些参考,但是他们也仅仅是在这个工作的后端。我们得先把数据获取过来,之后再跟这三家公司学学强在哪里。这件事情还是得要新拓展,因为甲方没数据。

AI科技评论:和其他的一些机器人数据公司相比,你们的优势是什么呢?

戴若犁:首先我没有看到什么值得我目前特别关注的机器人数据公司,我现在能够看到的一些卖机器人数据采集设备和做一些机器人数据采集项目的公司,第一,规模都很小,第二,他们暂时还没有积累出来值得敬畏的工程量,可能就是在这样的行业里面做了一些还不错的一些项目而已。我至少在商业实践的前端没有看到值得我们现在特别关注的挑战,所以我也没有办法比较。

核心的点还是要成为一个机器人的数据公司,绝不只是能够做一些动捕的设备或者能承接一些跟机器人数据相关的项目,就可以认为自己是一个机器人数据行业里面有竞争力的公司了。其实中间差着好多好多,因为这件事情的复杂度很高,不管各个模态的数据如何,又要保真,又要低成本,又要成体量高效的能够获取回来,而且还要有能力让数据能够跨本体,本质上是跨客户,如果采的一批数据只能服务一个客户,那就是个项目公司。

所以我们跟其他在机器人数据行业里面做一些设备和做一些项目的公司比起来,第一,我们有真正的产品交付的能力,我在做诺亦腾的时候,惯性动捕设备在全球就能做到 70% 的市场份额,第二名到最后一名加一块没有我们一半多。我们做过几千万、千人这个级别的大项目,所以这方面的经验和实际的产品交付的经验、复杂工作的交付能力是绝大部分其他人不具备的。

然后还有一个特别大的优势是:诺亦腾机器人(Noitom Robotics)是这个行业里面唯一清楚机器人数据这个业务该怎么做的公司。这个行业太大了,所以它值得谋定而后动,值得想清楚该怎么运作和塑造商业模式。怎么去补短板和加长板很重要,比做事情还重要,这也是为什么我们把这个公司分拆出来做,也是为什么有这么多特别好的投资人愿意帮助,愿意给我们多一点的钱去做这个事情的原因。

AI科技评论:所以在您创立的时候,基本上就想好了这个公司未来的规划?您觉得能做到第一位吗?

戴若犁:完全已经考虑好了,独立融资就是希望把这件事情做到更好。对于做到第一位这件事情我还是很有信心的,联合创始人们的能力都非常强,比如首席科学家之前是腾讯具身模型的一号位;CFO 做过美股的上市退市,做过港股的上市,做过A股的上市,做过很大的公司的战投负责人;硬件工程的一号位,原来在字节新石实验室做硬件的大leader。这些伙伴们有能力、有信心。很多人的薪酬都是除以 3 后才到诺亦腾机器人(Noitom Robotics)这边来的,所以肯定不是图一个小的事情。

AI科技评论:目标是做到上市吗?

戴若犁:资本市场只是一个把事情做大的手段,不是一个目标。所以上市不是目标,是手段,本质上是多一种更加自由和方便的募资的手段。

我们希望能做具身智能机器人这个行业里最大的数据提供商,希望是单一最大的数据提供商,这个才是我们的目标,而且做大也不是目标,能够给行业解决问题才是目标。

我觉得这行业里头没有人比我更适合解决这个问题,我不认为有任何人在这方面的能力积累、见识比我强。包括美国大家觉得很厉害的企业,他们对机器人行业的理解或者对本体、合成仿真平台的理解肯定是比我深,话语权也强。但是在数据、数据的利用链路和数据获取的途径,这个子赛道上面他们都得过来听我讲应该怎么做这个事情。

02数据工厂只是一块拼图

AI科技评论:诺亦腾机器人(Noitom Robotics)主要是通过数据工厂采集数据吗?

戴若犁:数据不光是从工厂来,数据的来源其实有很多种。比如机器人的遥操作数据,这个数据的生产发生在甲方机器人厂商那边很合适,也还有更大体量的其他类型数据值得以工厂形态或者其他形态去生产。

我们除了工厂形态还有其他形态的数据生产模式,会用各种各样的方式方法去获取适合这个行业的数据,工厂只是其中一种方式。

AI科技评论:采集数据的操作思路是什么?

戴若犁:这一次具身智能跟机器人的发展,底层假设是仿生学的胜利。不管是模型还是本体的形态,现在叫人形机器人或者类人机器人,多模态模型是极度的模仿人的大脑的决策和执行的全链路。无论是模型还是本体结构,本质上是非常仿人仿生的,URDF 的层面都是一个仿生学,所以反过来对于数据的需求其实也是仿生的。

在思考对数据的需求该怎么提的时候,最不应该的是做市场调研,看客户需要什么就给他什么,因为现在技术还没有收敛,所有的客户也在探索途中都是半懂不懂的状态,所有人都在试错,意见也都不统一。当没有收敛的时候去做调研,会发现大家是既要又要,或者客户之间的交集小到只能给 A 做个项目,再给 B 做个项目,他们俩之间的需求是完全没有交集的,这是极有可能发生的一件事情,所以这显然不行。

所以思考应该获取什么样的数据?或者应该积累什么样的数据?到底什么样的数据、模态、体量、维度、精度、特性是必须的?我们的思路还是仿生,从人的角度去思考。比如把咖啡拿起来打量一下喝一口这个全过程,其实用到了很多模态,这些信息都是我作为一个人形的本体在完成这个全过程所需要的输入 input。

假如一个本体的大脑暂时还不具备执行这个任务的能力的话,那至少要从仿生的角度去思考,确保所我需要数据的模态、精度、量程、范围、帧率——这些是仿生的角度去思考的——能满足人类本身执行输入信息的底线需求,至少保住了这个「底线」,就保住了未来换个本体这件事情是高概率能够完成的。所以在做数采技术路径选择的时候,其实思路就是仿生。

AI科技评论:你们主要售卖的数据是真机数据?

戴若犁:不是真机数据,是真实数据。真机和真实数据是有本质区别的。真机数据指的是用遥操作或 real world 的 RL 方式在机器人身上采的数据,真机数据是非常优质的数据,一定是有很强的价值的。

我在 GAIR 大会上就会讲,真机数据对于每一款机器人都是不可或缺的,因为只有真机数据当中才有跟机器人相关的真机特性。它的传感特性、构型特性、制动特性、驱动特性,包括生产制造当中的各种各样的波动,这些信息都是通过其他数据得不到的,真机数据就有这些信息,所以真机数据是不可或缺的。

但是真机数据有一个特别大的问题,就是它不能跨本体。你在宇树 G1 上面采的数据,别说到小鹏的机器人上,到宇树自家 H1 上面都用不了。因为它的传感器、驱动器、身材比例和构型不一样。有这么大的 gap,那么数据迁移到另外一个本体上面,VLA model 的训练收益是显著低的,所以真机数据不行,但真实数据肯定要的,我们选择采集的数据就是从人身上采。

AI科技评论:采集数据主要是用动作捕捉设备吗?

戴若犁:动作捕捉只是其中的一个模态,只有人的动作姿态数据是跟动作捕捉设备相关的,还有视觉、力触觉、听觉那些模态。所以动作捕捉的技术和设备只完成了数据采集其中的单一模态,只是比较重要的一个组成部分而已。

原来我做的动作捕捉设备是给其他行业做的,比如影视行业和 VR 交互行业,不是给机器人行业做的。而机器人行业比原来的行业大很多,用其他行业做出来的设备将就测一测、量一量,肯定是有问题的。

为了机器人行业,我们是值得从头储备一系列的设备和技能的,而且设备只是把数据获取回来,数据该怎么利用?该怎么训练?该怎么后处理?该怎么进行模态/维度的增广和补全?这都是大量的工作要做的。

所以我一上来就说诺亦腾机器人(Noitom Robotics)不是一家设备公司,也不是一家动捕公司,只是我这个个体先天带有一些动捕的技能储备。全行业都认为搞定动捕就搞定了数据采集这件事情完全是错的,搞定动捕没有搞定数据采集,搞定动捕只是搞定了数据采集里头一个单一模态采集的基础门槛,而且搞定得还不彻底。

要把机器人的数据这件事情给做好,这绝不是一个动捕公司就能够做的事情,一个动捕设备公司可以做机器人数据公司里 30 个供应商其中的一个,所以诺亦腾(Noitom)可以是诺亦腾机器人(Noitom Robotics) 30 个供应商中的一个供应商。

AI科技评论:能透露你们已经给哪些机器人公司提供数据了吗?

戴若犁:如果要说数量的话,六、七十个肯定有了,美国十几个,中国四、五十个。全是头部公司,基本上你听过的相对头部的公司多多少少都跟我们发生过交易,不管是买硬件设备,还是采买我们的服务,还是数据的交易,还是聊 2026 年的数据的合作,都非常非常多,但这个确实是商业机密。

我们会帮助他们去做:数采设备提供、系统集成、遥操作的链路的打通调优、URDF 的映射、 Retargeting Mapping、模仿学习训练数据的支持、中小体量数据集的授权,甚至于大体量的数据集的定制化,这方面的服务我们在我个人认知范围内是全球做的最多的。

AI科技评论:其中有没有什么项目是你觉得印象最深刻的?

戴若犁:每一个对于我们来说都很重要,我们是个 to b 服务商,最重要的一件事情就是要嘴严,或者说不能嘚瑟,这是我的原则。

在所有的合作里面,我们都是配角,这个事情一定要想清楚,它很重要。一定要认清楚自己的边界,我们赚这个钱,别人信任我们,我不应该把这件事情拿出来嘚瑟。我能说的就是非常多杰出的、头部的工作,那种在圈子里刷屏争论猜测的好几个大工作,我们在里面都贡献了一点微小的力量。

AI科技评论:今年世界模型很火,你们会关注这个点吗?

戴若犁:我们对数据进行预标注、维度增广处理、模态的补全处理都是要用到世界模型的。其实我们公司内部的机器人模型团队和多模态模型团队是可以和我们绝大部分的甲方的模型团队比肩的,就像 Scale AI 的模型团队本质上是不比 Anthropic OpenAI 差的,只是规模体量没那么大,因为你需要跟你的甲方核心团队平等对话,要帮助他们解决懒得解决甚至解决不了的问题。

所以我们虽然不需要那么大规模的机器人 VLA 的模型团队、强化学习模型团队、世界模型团队,也不那么烧卡,但是我们单点的这个人的能力需要特别的强。

AI科技评论:那您觉得世界模型生成的数据会是解决机器人数据问题的一个路径吗?

戴若犁:它会是真实数据的一个很好的补充。如果说机器人向物理世界或者人的真实行为能够学习的信息分两类的话,一类叫做规则(rules),另一类叫做先验知识(prio)。模型(不管是世界模型还是物理引擎)能够合成和仿真的更多的是规则,而人类的宝贵的大量的复杂的,难以描述的,难以枚举的先验知识是很难直接合成,很难无中生有的:你能够枚举规则,但你不能枚举全量人类先验。

从最底层的第一性来说,世界模型、合成仿真环境以及其产出的生成视频与合成数据,跟真实的物理世界获取的 real data 的最合理关系其实是增广(Augmentation),或者补全(Completion),也可以是修正(Amendments and imprint)。比如基于蕴含大量人类先验的一个真实数据集,比如 1000 万小时规模的,再由合成仿真环境或者世界模型去进行进一步的增广,把它泛化到 10 亿小时,把它再乘以 100 这样的关系。而不是期待搭一个全知全能的,能够生成所有数据的世界模型,创造一个能解决具身智能所有数据问题的世界模型的命题难度,比机器人命题难度还要高,所以你为了去解决一个命题 A,而去解决一个更难的命题 B 吗? 如果全世界的 target 是世界模型,其实对我业务也挺好,我的数据会卖给世界模型,卖给命题 B。

所以对于真实数据的需求,有可能世界模型是比具身智能还大的买家,因为这是两个分离但又极度相关的命题,他们都需要有空间、精度意义且来自真实世界的数据去进行训练。上个月美国合作方的同事还去见了李飞飞教授跟 World Labs 组做了交流,我理解到,像DeepMind、通义千问多模态这样的组其实对于这种有空间精度意义的数据有很强的需求。

你无法通过看视频推断出物理的原则,人类研究物理其实要做很多实验和测量的。就算是视觉这样的单一模态,Stereo video (双目视觉信息)有空间精度, Mono video (单目视觉信息)没有空间精度。世界模型是需要多模态,需要 Stereo 的信息才能够真正走到足够好的高度。

AI科技评论:那你们会使用 UMI 吗?

戴若犁:会使用 UMI, UMI 是非常好的数据采集的方式方法。UMI somehow 是可以跨本体的,所以我很喜欢 UMI 的数据。

Universal Manipulation Interface(UMI)source: https://umi-gripper.github.io/

但 UMI 也有一个很大的问题,就是丢失了全身大量的有价值的信息,且在夹爪这个层面有本体绑定性,迁移到其他本体也有大 gap。所以 UMI 在短期之内去验证一些能力和验证 scaling law 是有极高的极好的价值的,又便宜又好又能 deploy,简直是各种好,很诱人。但是长期来讲,有太多的损失了,这些损失导致 UMI 的数据短期内可以闭环一些任务,有生意做,但是长期来讲不足以巨大的投入去积累。所以我们放在 UMI 上很少,但会本着“帮客户老爷解决点问题开心就好”的态度做点项目。

本质上我是要权衡这个对我来说是不是一个长期的业务,是不是一个天花板高的业务?如果单个体量特别的丰厚,利润特别丰厚,我是可以做的。这类的数据有一丢丢积累的必要,它也能部分的跨本体,但是长期来讲它是稍微差的,它就是 Sergey Levine 说的那种“勺叉”( Sporks of AGI:Why the Real Thing is better than the Next Best Thing),他也是将军赶路不该追的那只有点肥的“野兔”。

AI科技评论:可以提前透露一些您在GAIR大会上要演讲的精彩内容吗?

戴若犁:我在GAIR大会上会提一个概念,叫做具身智能数据的金字塔,这个金字塔分四层,这四层里面会涵盖遥操作数据(Tele-op data)、多样化人本数据(Human-centric data)、互联网数据以及合成仿真数据(Synthetic data)。

我还会去跟大家讲一讲我们怎么看具身智能的数据的利用(data deploy),到底应该怎么解决跨本体问题(cross-embodiment issue)?是可以有一个全知全能或者单一的数据集,还是需要分层解决,还是需要通过不同的企业之间的分工和合作,在不同的场景、不同的工作模式下面去解决?我们有一个比较深刻的认知,这个认知会持续迭代,我在大会上面跟大家分享一下迭代到这个月,这周,演讲那天的结果。

还会跟大家稍微介绍一下我们服务的这些很杰出的伙伴,他们最近的一些成果我们有参与,会有一些好玩的东西给大家在视频上面看一看,我相信大家会觉得很有趣,并且会有一些大家能够带走的认知和想法。

上一篇:“2025年度手机业十大杰出总裁”出炉 realme CEO 李炳忠榜上有名
下一篇:群核科技,摸着李飞飞过河
免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。