Nature封面揭秘:索尼机器人乒乓球赛场击败人类职业选手
2026-05-04 23:12:28未知 作者:徽声在线
撰稿人:科技前沿观察者
徽声在线 | 科技探索频道
当索尼的机器人再次进入公众视野,这次竟是以乒乓球赛场为舞台,上演了一场人机对决的精彩大戏。
在精心搭建的乒乓球台上,一场别开生面的较量悄然拉开序幕。
一台配备8自由度的机械臂,与日本顶尖的elite级选手展开了五场三胜制的对决,最终以3胜2负的成绩收官。
随后的半年里,这台机械臂更是势如破竹,连续击败了多位日本职业选手,其中包括2019年美国公开赛女单亚军平真由香(据GPT分析,其实力可媲美国内省队主力),以及WTT世界排名第25位的木原美悠。
那么,这台机械臂在赛场上的表现究竟如何呢?
其背后的研究成果更是获得了国际顶级期刊《Nature》的青睐,荣登封面故事。
回顾过去,伯克利大学曾让宇树G1机器人与人类连续对打106板,香港大学的Smash项目也让G1在室外挥拍击球。
然而,HITTER和SMASH在处理球的旋转方面尚显不足,它们主要依赖陪练打出的平球进行训练,难以应对职业选手的旋转球。而此次索尼的Ace机械臂,则真正实现了对旋转球的精准应对,展现了其实打实的硬实力。
(完整幕后比赛视频可参考:点击观看)
这场人机对决究竟是如何进行的?
比赛规则完全遵循国际乒联(ITTF)的标准,先到11分者胜,比赛场地也是正规的比赛场地。
对手则分为两档:
第一档是elite级选手,他们至少拥有10年的训练经历,每周训练时间超过20小时,共有5位(3女2男)参与对决。
第二档是职业选手,包括日本T联赛现役的两位选手Minami Ando和曾根翔。
值得注意的是,这些球员在赛前均未见过Ace机械臂,也没有进行过针对性的录像训练或定制策略,完全是即兴上阵。
在2025年4月的东京对决中,Ace对elite级选手取得了3胜2负的成绩,在13局中赢得了7局。
而对职业选手则稍显逊色,以0胜2负告终,但在7局中也抢下了1局。
这样的成绩已经相当不错。
论文提交后,索尼并未止步。
在2025年12月的又一轮对决中,Ace成功击败了平真由香。而在2026年3月的对决中,Ace更是连克包括木原美悠在内的三位职业选手。
据SonyAI DirectorPeter Dürr介绍,此次Ace的出球速度更快、落点更贴近球台边缘、回合节奏也更加紧凑。
从Ace看到球到挥出拍,整个过程仅需20.2毫秒。而顶级人类球员则需要230毫秒,相差十倍之多。
这一惊人差距是如何实现的呢?
Ace的整套系统由看、想、做三部分组成。
在“看”这一部分,球台四周布置了9台APS相机,每台相机都配备了一块FPGA芯片。相机先在本地进行二维小球检测,只将压缩后的结果传送到中央服务器进行三维定位。
整个过程仅需10.2毫秒,空间误差控制在3毫米以内。
然而,仅仅知道球的位置还远远不够,还需要了解球的旋转情况。旋转决定了球落台后的反弹方式,也决定了球员的挥拍策略。
索尼采用了自家的事件相机(event-based vision sensor)来捕捉球的旋转。与传统相机像连拍一样工作不同,事件相机只在画面有变化的像素上报数据,因此具有天然的低延迟特性。
同时,索尼还配备了一套名为gaze control system的装置,通过三块可转镜片追着球走,一颗可电控变焦的长焦镜头让球始终保持清晰。三套装置从不同角度盯着球上的logo如何翻转,从而计算出球的角速度。
该系统的刷新率在400到700Hz之间,平均误差仅为24.8弧度/秒。
在“想”这一部分,Ace采用了一个深度强化学习策略。该策略每32毫秒(31.25Hz)读取一次球和机械臂的状态,并输出相应的动作。
训练算法采用了SAC(Soft Actor-Critic),这是一种相对古典的算法。
但索尼对其进行了关键设计,引入了privileged critic机制。在训练时,给critic(评判者)喂仿真里的真值,而给policy(决策者)只喂带噪声的传感器历史数据。
这种设计让评判者能够看到参考答案,而决策者则只能通过模糊照片来解题。这样,决策者被迫学会自己做传感器融合和轨迹预测,无需人工教导就能自行摸索出解决方案。
整套策略完全在仿真环境中训练,没有接触过一个真实的球。然而,当部署到真实机器上时,它却能够直接使用,无需任何调整。
作者Peter Dürr自己承认,他一开始并不相信这种路径能够成功,但最终的结果却让他大跌眼镜。
在“做”这一部分,机械臂是定制的,拥有8个自由度(2个直线关节负责沿球台前后左右平移,6个旋转关节负责球拍姿态和速度)。机械臂采用Scalmalloy合金3D打印制成,并进行了拓扑优化,既轻便又稳定。
机械臂的末端是一片蝴蝶D05胶皮配VICTAS ZX-GEAR OUT底板,与日本职业选手使用的套胶级别相同。球拍旁边还挂了一个小杯子,用于单臂发球时托球。
所有电机每1毫秒同步一次,位置跟踪延迟不到5毫秒,最大挥拍速度对标职业选手正手强攻时的20米/秒。
看、想、做三部分加起来,整个过程仅需20.2毫秒。
One more thing
说实话,当看到这篇发表在《Nature》上的论文时,我的第一反应并不是“好厉害”,而是“索尼竟然还在做机器人”。
二十年前,日本无疑是机器人的第一梯队。
1999年,索尼推出了AIBO机器狗,售价高达3000美元一只,却在20分钟内被抢购一空,总共卖出了15万只。
2003年,索尼又推出了QRIO机器人,这是全球第一款能够双足奔跑的人形机器人。与此同时,本田的ASIMO机器人与各国政要握手敲钟,丰田的机器人则会吹小号。
那时候,美国人想要看机器人表演,还得飞往东京。
然而,好景不长。
那时的机器人虽然能够表演各种精彩节目,但却无法胜任实际工作。表演无法支撑起高昂的研发成本,机器人逐渐沦为了科技花瓶。长此以往,销量自然下滑,项目也被迫砍掉。
2006年1月26日,索尼一天之内砍掉了AIBO和QRIO两个项目。
2018年,ASIMO也宣布停产。在日本千叶县的光福寺,每年都会为报废的AIBO机器人举办超度法事,一次就有800只之多。
时光荏苒,到了2025年,全球人形机器人的出货量已经达到了1.3万台,其中中国占据了90%以上的市场份额。前六名全是中国公司,日本没有一家上榜。
在机器人领域,如今已经是中美两国的游戏了。
值得一提的是,Ace的共同作者中有一位名叫Hiroaki Kitano(北野宏明)的科学家,他是索尼计算机科学实验室的CEO。
他正是当年AIBO项目的发起人,被誉为AIBO之父。QRIO机器人也是他带出来的项目之一,RoboCup机器人足球赛也是他发起的。
尽管AIBO和QRIO两个项目在2006年被砍掉,但他并没有离开索尼。他熬过了近二十年的艰难时光,终于等来了这篇发表在《Nature》上的论文。
虽然Ace在形态上仍然是一台不会动的机械臂,虽然窗外的中国人形机器人已经在春晚上扎堆表演武术。
但对于索尼来说,能够重新回到机器人领域的牌桌上,可能已经是一件非常不容易的事情了吧?
[1]https://www.nature.com/articles/s41586-026-10338-5#MOESM1
[2]https://scholar.google.com/citations?user=027fc-oAAAAJ&hl=ja