活动

对话宇树科技王兴兴:被 AI 重塑的机器人创业 | 初心年会系列分享 03

2024.03.25

宇树科技成立于 2016 年,是业内领先的高性能足式机器人研发公司。2023 年 8 月,以机器狗产品出货量闻名的宇树正式发布首款通用人形机器人 H1,标志其产品线向人形机器人领域拓展。2024 年 2 月,宇树宣布完成近 10 亿元 B2 轮融资

近日,英伟达发布的人形机器人通用基础模型又掀起一波对 AI 机器人的关注热潮。而在 3 月 7 日的「Begin Again ·从心出发,让创新发生」初心资本 2024 投资人会议中,初心资本合伙人许旸洋与被投企业宇树科技 CEO 王兴兴,围绕宇树的创业初心、人形机器人进展、AI 时代下的业务创新方向等话题展开对谈。以下是对谈实录

7.11 1.webp

许旸洋:首先请兴兴先简单介绍宇树科技最初创业的初心、对科技的信仰,以及目前的行业成绩跟地位。

王兴兴:我是宇树科技创始人,从 2016 年成立到现在,我们公司做机器人已经有 7 年的时间。舞台上的这款机器狗是我们去年发布的 Go 2 最新型号,目前应该是宇树最小尺寸的机器人产品,我们还有更大的一些行业级产品。

我本人从小比较喜欢科技,机器人对我而言其实算是一个职业,并不是说我只喜欢机器人。我其实小时候对生物、化学、物理都挺感兴趣。2010 年我也对 AI 和神经网络比较喜欢,当时其实是 AI 和神经网络的一个低谷期吧。因为大家知道,最近一轮 AI 大概是 2012 年的时候重新复苏的,也算是真正的 AI 的诞生,距今也就 10 年多一点的时间。

四足机器人是我在 2013-2016 年读书期间做的一款 Xdog 产品,这款产品开创了低成本、高性能四足机器人的先河。为什么这么说?因为 2013 年以前,这种机器人比较贵、重而且难用。但是 2013 年我想到了一个技术方案,最后花了大约两年时间做出来了,研发投入大概也只有一两万块钱。2015 年,我参加了一个上海的比赛拿了二等奖,凭借硕士期间的这款机器人赚了几万块钱,这笔钱后来也成为了公司的启动资金。

宇树科技 2016 年成立以后陆续发布了好几款产品,目前在全球的四足机器人领域里我们是出货量最多的,2023 年的产量占到全球的 60%以上,客户包括国内外大公司、科研机构、个人玩家、行业应用等。

2023 年年初,我们立项开始做人形机器人。我个人在 2010 年读大一的时候做过人形机器人,当时的结论是这东西没用,人类目前的技术水平驾驭不了这么复杂的机器人。所以宇树科技早期成立的时候,很多投资人说”你做不做人形机器人?”我说我坚决反对做人形机器人。

但是为什么后面改变主意呢?原因也比较简单:第一,在四足机器人上,我们早些年也不用 AI,但是有很多客户在用机器狗做一些运动 AI 的开发,类似于对人的小脑进行开发。在开发的过程中,四足机器人 AI 技术进展非常迅速。目前我们机器狗上大部分的运动是 AI 驱动的,传统算法越来越少。到了去年下半年,我们全是 AI 驱动的产品。

所以现在我们去做人形机器人,因为 AI 的发展速度是远超预期的。原本像人形机器人这么复杂的设备,传统算法没办法驾驭,但是 AI 可以很好地驾驭。再加上 2022 年底以来, OpenAI 、ChatGPT发展速度超过我的预期,这种机会难得。

许旸洋:这是一段非常有故事性的创业经历。初心在最早结识兴兴的时候,他刚刚硕士毕业,在硕士论文的时候做出了第一款产品,那个时候我们就被他的产品所打动。后来也发现宇树的产品走进了国内外越来越多的科研大学的实验室。

兴兴也提到,宇树的业务和产品形态从一家比较垂直的四足机器人,逐渐成为目前以“四足+人形”双轮驱动的形态。大家也非常关心人形机器人的进展,想请兴兴分享一下,宇树作为全球四足机器人出货量最大的公司,去年只花了半年的时间就做出了人形机器人的 demo,在很短的时间里就成为人形领域非常有竞争性的一家公司。那么宇树有哪些先发优势?有哪些积累?又有哪些是做四足跟做人形完全不一样的东西?

王兴兴:宇树做人形有一年多时间,我当下最大的感受是,现在我们做到的程度远超我一年前设想的节奏。目前我们的硬件还在预期里,但是软件远超预期。去年 9 月份我们把人形机器人的运动 AI 调通,到了前段时间的最新一代,已经实现了全球目前最快的速度水平,包括可以跳舞等等,这都是纯 AI 驱动的。目前 是远超我自己的过去的预知,虽然我已经在这个行业很多年、大概知道行业的方向,但最终AI 在机器人的落地的效果超过我的预知。

过去一年宇树在人形机器人这块已经做得挺不错了。硬件方面,去年上半年,我们本来比国内很多厂家做人形机器人要晚一点,但去年年中发布,到下半年我们已经小批量生产,并且陆续开始发货。到了现在,我们反而比国内大部分厂家跑得还更前面。而且我们去年投入的人力相对比较少,因为去年大部分人投入到新的四足机器人上去了。所以现在的感悟是,真的是看到了一点机器人大模型大爆发的感觉

这里可能要澄清一下,很多人觉得把大语言模型改一下就能给机器人用,这是一个不正确的观点。因为我们自己也使用、调研过一些开源大模型,也玩过一些大模型的底层编程,最大的结论就是大语言模型根本不是给机器人用的。目前像谷歌、OpenAI 为什么投了人形机器人,最大的点在于大家希望把大模型底层的 AI 技术改一个给机器人使用的模型出来,这也是目前全球很多公司正在做的一件事情。

所以我认为真正给机器人用的大模型诞生是一个很好的临界点,会出现阶梯式的进展。很多情况下,搭一个机器人模型或搭一个语言模型,一开始人形机器人的效果可能乱七八糟。随着不断调整,调到某个点,性能突然非常好,这当中的经验性非常明显。我们去年 9 月份第一次开始开发人形机器人运动 AI 的时候,时间比较赶,我们三个同事一起在开发, 一开始做出来的机器人乱七八糟,东倒西歪,什么都干不了。根本不要说站了,躺都躺不好。突然有天晚上,同事把电脑开在那里训练,第二天回来发现性能非常好。所以 AI 会带来很多惊喜。

目前现在大语言模型本身的复杂度并不是很高,但是如果配合足够的数据和算力,最终的效果确实非常惊人。这是非常激动人心的一件事。结合目前 AI 机器人的进展,我甚至预计,在明年年底之前,全球范围内很可能有团队或公司把机器人的通用大模型做出来了。类似于 ChatGPT 出来的时候,突然间就爆掉了,我们也可以真正部署各种行业的机器人,无论是人形还是自动驾驶,都可以直接去用,会突破临界点。

7.11 2.webp

许旸洋: 兴兴曾经多次分享和强调过自己有非常不错的机械方面的一些天赋,包括从小可能自己动手绕一些电机,包括做宇树的时候自己对机械关注的非常多。兴兴也分享过,机械对于机器人公司的重要性被大大低估了。基于目前 AI 的变化,兴兴在这个观点上有什么新的考虑和观点的变化?

王兴兴:其实现在限制机器人包括新能源车量产的,还是工程或者机械上的问题会多一点。软件方面的问题相对还好缓解,大不了 OTA 升级,有很多退路。但机械上,但凡有一个零部件有质量问题,就会限制整个机器人的效果。

我本人从几岁就开始画画、动手制作,玩的东西比较多。我反而觉得如果我爸妈早点给我买电脑,可能我的编程水平还可以高一个水平。从小玩的感觉和学了几年的感觉非常不一样。而且我一直有个观点,要学一个东西,就要充分暴露在它面前。我有一个感觉,AI 编程和幼儿园里搭积木没有差别。幼儿园搭积木是看到一个东西照样模照样去搭,不知道原理,往上搭就行。随着玩得越来越多,比如力学原理等等都可以补上去,会形成很直观的感觉。

机械也一样。整个机械行业总体待遇薪资偏低。为什么偏低?最大的原因是抄起来太容易了。但如果要做一些新产品,这个因素就非常重要。因为新的硬件产品或机械产品设计结构中,可能一个小小的细节就直接把整个产品 game over 了。前段时间有些新能源汽车的底盘被扒出来,一个小细节被吐槽得非常严重,导致了轮轴断掉之类的严重故障。导致这个问题的很可能只有一两个小问题,可能是某个结构件的小薄弱,或者是一颗螺丝不够长,或者是螺丝没拧紧。所以一个小问题就限制了整个产品的性能,而且出现严重故障。

过去几年薪资待遇低导致很多聪明人都离开这个行业,而且积累也比较简单。很多人觉得按标准做个 demo 非常容易的,甚至大一的学生也能够完成,但是要满足力学原理、减重、符合量产标准,而且尽可能降低量产成本,生产、制造和维护都要很容易,这些各方面的因素加在一起,难度要求非常高。

说实话,我目前认识的所有人里面,真正机械能力好的、水平比较高的人少得可怜。举个例子,如果要招一个机械水平高的人,可以用这样的标准来衡量:给他一辆车或者结构或者一个需求,他不需要理论分析,看一眼就应该知道哪个地方薄弱,哪一个地方加强。而不是先随便画画再扔给仿真软件,仿真软件算好后再去优化,这是完全不够的。

许旸洋:最近兴兴也在感慨,AI 驱动的落地场景可能是机器人最好的场景,包括机器人进化的速度快得离谱,包括自己也开始学习,大量时间花在 AI 上,与 AI 方面的人交流。进入到了这个状态之后有哪些新的体会?

王兴兴:我最大的感受还是要保持足够的学习。现在有时候在公司内部交流的时候,我发现现在这波 AI 对年轻人非常好的。简单说就是 5 年以前的东西都不用学,只要学最近 5 年的东西就够用了,所以对每个人都很公平。

另外一点是,过去几年虽然我工作做了一些成绩,但是对于我个人来说,犯了最大的一个错误是中间部分稍微有点自满,没有保持足够的学习。其实要保持每天、每月、每年的足够学习,只要保持进步,就不会跟时代脱节。如果自认为自身的 AI 技术、机械技术或者产品制造能力很强,后续就不完善了的话,很容易被世界淘汰。因为世界上聪明人太多了,可能你觉得自己比较聪明,但实际上比你聪明的大有人在。但实际上唯一能继续保持领先的办法,只有学习。保持每天学习,每天进步,即使比你聪明的人也赶不上你。AI 方面,我自己不参与公司的具体项目的 AI 开发,但我自己玩编程玩得挺多的,我平均可能每天会看点论文或者敲几行代码。

许旸洋:为什么人形机器人一经推出就得到了广泛关注?大规模的行业落地需要多久?如果时间拉得足够长,人形机器人能做什么?能在哪些环节发挥重要的作用?充分发挥你的想象力,你觉得未来可能是什么样的?

王兴兴:最近这段时间有点活在梦里的感觉。因为整个世界的进步,包括公司内部,包括整个社会变化实在太快,每天都有很多惊喜、亮点。

像大语言模型出来后真正的对普通老百姓没有太多帮助,帮你写文章、查资料没什么问题,但真正去干活或者真正解决一些逻辑严密的事情,还做不到。但如果强 AI 能力与机器人绑定诞生,比如真的可以洗衣做饭、工厂生产,甚至造楼房,那对真正的生产力的提升非常大。我现在也会建议很多人,我们要足够相信 AI,并且要去想象未来 5- 10 年真正的通用 AI,像 ChatGPT 这样强的给机器人的 AI 诞生以后,我们当下每个人应该提前做什么?

尤其非常重要的资产配置的部分,全球变化非常明显,很可能现在大部分资产都会贬值,只会保留部分核心资产。有个很有趣的事情,过去几年每年开年会,我都给同事分享一下未来的股票走势。过去几年我看好英伟达,今年刚刚结束的年会上我也说,英伟达应该会更好。没过几天又果然涨了很大一波。AI 真正大规模诞生后,算力是最核心诉求,所以只要未来几年 AI 持续突破,英伟达会继续涨。

但另外一点,目前算力完全不够。去年我提出一个概念,叫跨尺度智能。大家现在想象的机器人和人差不多一样大,但实际上只要通用 AI和通用机器人诞生,可以做到更小,比如像细胞那么大。而且机器人可以自己生产机器人,自己可以产生一个社会群体,可以把小到像细胞、大到像一座山的机器人全都重新做一遍。到了这个时候,整个社会变化非常大,整个生产制造、社会结构、算力需求是远超英伟达等公司目前的算力制造能力。

所以目前能做的事情非常多,比如芯片公司。但思路和中国上一轮投的芯片不太一样,上一轮投的芯片都太传统了,投传统最好的情况是抢占一部分存量市场,很可能还抢不过来。关注未来的更长远的市场是更好的。比如早些年如果投芯片,都投一些算力芯片,而且去兼容 AI 模型,我估计现在市值估值已经非常离谱。

前段时间还想到的一点是,在算力芯片领域,像 ARM 这样的架构授权公司还没有诞生。芯片领域现在能做的事情很多,比如 AI 芯片的授权架构给别人,让别人生产芯片,并且维护一个比较好的 AI 社区,支持各种模型训练,大家可以很便捷地使用,就可以建立起像现在的 ARM 芯片一样的生态链。

想通这个逻辑后,我就理解了,孙正义前段时间他说要重新做一个芯片公司,我觉得他是想把 ARM 的逻辑重新在 AI 上复制一遍。你现在做一个小的一个 AI 芯片,想跑出来是很难的,但如果学 ARM 的架构,还是有很有机会的一件事情。这也是为什么现在国家比较重视,如果机器人 AI 突破使用的临界点后,爆发增量非常大。

许旸洋:如何看待中国产业链和美国产业链在机器人领域的竞争和合作?

王兴兴:美国现在一直在搞语言模型或者各种 AI,但是它从来都没有放弃过用 AI 去提升机器人能力,包括谷歌十几年一直在做用 AI 来提升机器人能力价值的事情。但是中国很多公司是在大语言模型效果很好的基础上做大语言模型,对目前还没有证明过的东西,大家其实很多也不太敢投入。

许旸洋:回到创业这件事情本身,分享一下整个创业过程当中对你影响比较大的人或者事?最近几年你自己最大的成长是什么?有哪些事情或者观点一直没有变?

王兴兴:我经历过的事情大部分都给忘了,无论是好的坏的,主要想当下或者未来的趋势。因为我认为,一定要布局未来,要看到未来 2 年、 3 年甚至 5 年到 10 年,提前布局,肯定能赢。包括四足机器人,2015 年我参加比赛的时候就说,这种小的、电驱动的机器人肯定是未来的方向,后来基本上也证明了这一点。

过去最大的感受还有一点是保持足够的学习,保持足够的谦卑。每天学习能收获的东西很多,只要提前学了很多东西,可以比别人看到更早,预测未来半年或者一年的大体方向也相对比较容易。只是现在可能没有学到最新的技术或最新的方向,导致不好预估未来的发展方向。举个例子,如果对芯片感兴趣,可以去学一下 AI 底层的架构方向,就会知道 GPU 芯片应该怎么造,甚至不用去学芯片应该怎么设计,只要学 AI 本身底层是怎么工作的,就可以专门设计针对 AI 的一些芯片。

还有一点就是我非常关注敏锐度。无论是看技术也好,看市场也好,或者可以看人,你必须在有限的信息情况下快速地发现最关键的点,并且把握住关键点的走向,就可以把很多事情做好。无论是看现在 AI 的发展趋势,或者看一个人,通过交谈或者过往情况能看出他的性格或做事方式,可以节省很多时间,包括做市场化。

许旸洋:刚才兴兴提的几个关键词,敏锐、求真,包括学习、精进也是初心的价值观,很高兴看到我们年轻一代的创业者仍然秉持着这样的心态与创业的精神。也非常开心能够在今天和兴兴对话,期待之后人形机器人在 AI 领域能够更多落地生根,给人类的科技树点亮更多的新的灯塔。

解局时代企业的真问题 | 初心年会系列分享 02

做陪伴创业者
最早的投资机构

初心是积极布局新兴业态的早期股权投资基金,专注于企业级软件、科技创新等领域的投资。我们致力于捕捉因科技赋能而改变行业格局和通过软件帮助企业降本增效、优化运营的优秀企业,进行投资布局。欢迎留下你的联系方式,与我们取得联系。