特斯拉擎天柱新学 18 件家务活,看视频就会了

2025-05-21ASPCMS社区 - fjmyhfvclm

还记得前几天翩翩起舞,火遍全网的特斯拉机器人 Optimus (擎天柱)吗?

今天,它又有了新技能——一下子学会了至少 18 件家务活。马斯克把这 1 分钟的视频发到了 X 上,网友直呼 Amazing。Optimus 官方号也很有趣,这段视频配上文案「我可没有天天都在跳舞」。

并且更强的是,Optimus 学会这些动作没花太大力气,仅仅用了一个神经网络,加上人类操作的视频就会了。在人类的自然语言指令之下,它就能完成已经学会的各项任务。

视频里,特斯拉 Optimus 主要做了这 9 件事。

️倒垃圾

这其实分为好几个步骤,先是捡起地上的垃圾袋,接着打开垃圾桶,然后将垃圾袋扔进垃圾桶,最后关上垃圾桶的盖子。

官方在视频上做了 1.5 倍速播放,因此 Optimus 执行动作的速度还是比较快的。但从细节上可以看到,Optimus 的动作是非常流畅的,比如右手提起垃圾袋的同时,左手已经抬起准备打开垃圾桶的盖子,左右手动作之间的衔接非常流畅,和人的行为基本相同。

️用刷子和簸箕清理桌面

第二个典型家务活是清理桌面,Optimus 右手拿着一把小刷子,左手拿着桌面用的小簸箕,两个工具配合,就能将桌面上的小纸团清理干净。

在这个场景之下,考验的是 Optimus 如何将小刷子和小簸箕这两个工具更好地配合使用。比如簸箕要压在桌面上,刷子要和簸箕对齐。

只不过,原视频的这个场景是用 2 倍速播放的。并且,桌面上只有 3 个小纸团,Optimus 竟然扫了 7 次才全部清理干净,这工作效率稍微低了一些。

️从卷纸上撕下一张

接下来这个场景同样考验左右两只手的配合,Optimus 右手抓住一桶卷纸,左手顺势撕下一张放在桌面上。这个动作相对前两个场景似乎要简单不少。

️拿起勺子搅拌锅

之后,Optimus 可以走进厨房了,右手拿起桌上的勺子,搅拌锅内的「食物」,防止糊锅。搅拌完成后,再将勺子放回原位。

这回因为没有左手的参与,Optimus 在搅动的时候锅具也跟着在灶台上移动,差点掉到地上。不过在片尾的人类视频中,Optimus 的学习对象也没用左手扶着锅,看来是「老师」没教好。

️使用吸尘器清理地面

这是一个典型家务场景,Optimus 可以拿起放在地面上的吸尘器,并开始吸尘操作,整个动作也跟人类非常接近。不过在这个场景之中,Optimus 似乎没有自己按下开机按钮,在吸尘的过程中,也没走两步,甚至没有扭扭腰。如果单看这几秒钟的视频,Optimus 目前能做的或许只是单点脏污的清理,而不能打扫你全家的地板。

️拿起 Model X 的前悬架摆臂,放进搬运车的右侧轨道

这个场景下,Optimus 虽然没在干家务,但是将悬架摆臂换成任何一个家里的物品,其实也能转化为家务能力。视频中,特斯拉 Optimus 拿起右侧桌子上的一根悬架摆臂,准确送入了搬运车的轨道中。

️打开柜门

打开柜门这个动作对于人来说非常简单,对于 Optimus 来说可能不是。视频中柜子的门把手相对较小,需要 Optimus 的灵巧手恰好拉住把手才能打开。

Optimus 主要用食指和中指拉门,但这回开门只有中指恰好勾住了门把手,成功开启。

️按下微波炉按钮开门

开启微波炉门的动作相对简单很多,只需要 Optimus 的食指对准微波炉上巨大的开门按钮,门自动弹开,似乎在 9 大场景之中,这个最简单。

️关闭窗帘

最后一个场景是关闭窗帘,这同样是个典型家务场景,用过电动窗帘的朋友肯定知道它能给生活增加太多幸福感,尤其是冬天不想出被窝的时候。视频中,Optimus 伸出右手,从左向右拉窗帘,最终将窗帘完全关闭。

除此之外,特斯拉 Optimus 还会给花浇水、将水池里的盘子拿出归位、用熨斗熨烫衣服、开抽屉、擦桌子、擦黑板、开启窗帘、把锅放到炉灶上。整体算下来,Optimus 在短短 1 分 06 秒的视频里,做了至少 18 件家务活。

️不就是学会了十几件家务活吗,这意味着什么?实际上,这就是全球机器人厂商做梦都想实现的机器人泛化能力。

一旦面对新环境、新任务,机器人能利用已有的知识和经验进行适应和学习,它就有机会能像人类一样做多种复杂的工作。更重要的是,可以减少大量的重复开发,用 AI 能力让机器人率先落地实现商业化。换句话说,机器人的泛化能力,是一家机器人厂商的核心。

特斯拉的开发人员提供给 Optimus 的学习视频,其实和人眼的视角基本相同,摄像头无论拍下人的哪种手部动作,Optimus 用一个神经网络就能学会。

从结果上看,特斯拉 Optimus 干家务的效率还有很大提升的空间,但动作的拟人度已经非常高了。

北京时间今天凌晨,美国媒体 CNBC 采访特斯拉 CEO 马斯克时,他就提前透露了 Optimus 的这项能力。

马斯克说:「我认为我们可以实现突破,比如 Optimus 可以观看视频,比如 YouTube 的或者其他教程,根据这些视频,它就能像人类一样学习如何做这件事。那么它就能拥有惊人的可扩展性,因为它可以非常快速地学习任何东西,我认为我们明年就能实现这个目标。」

特斯拉 Optimus 工程主管 Milan Kovac 在 X 上说,最近特斯拉取得了重大突破,利用人类操作的第一人称视角的视频,大部分学习成果能够直接迁移到机器人身上。对比遥控操作机器人获取的数据,机器人能够更快地启动新的任务。

接下来,特斯拉 Optimus 的学习能力还能提升,即便是第三人称视角的操作视频,也能学会。这样一来,Optimus 可以利用互联网上海量的视频,学习人类各种操作。并且,通过真实以及仿真场景,特斯拉还会提升机器人的可靠性。

那么,特斯拉 Optimus 能做到,其他机器人制造商也能做到吗?

这其实非常难。前不久,英伟达 AI 总监 Jim Fan 在一场演讲中谈到了用仿真场景快速训练机器人。

不过难点在于,即便是到了 Sim 2.0,机器人智商能够以指数级增长,依然需要高精度的数据采集,由于大多数公司缺乏这样的数据,导致机器人开发成本依然很高。

而特斯拉用较低精度的第一人称视频(未来可用第三人称视频),就能让机器人学会并完成高精度的动作,这会大大降低机器人泛化的时间成本。或许,Optimus 就将成为率先落地的机器人产品。

目前,特斯拉正在弗里蒙特工厂建造 Optimus 试点生产线,预计今年晚些时候生产线将完工。按照马斯克的目标,到今年年底,特斯拉工厂内将有数千台 Optimus 投入使用,到 2030 年,每年将生产百万台机器人。

今天特斯拉放出的 Optimus 视频里也能看到,机器人有朝一日真的能进入家庭帮你做家务,而这一天已经越来越近了。

全部评论