对谈加速进化程昊:从踢好一场球出发,目标是具身智能的“安卓”
2026-06-17 02:18:12未知 作者:徽声在线
在具身智能的浪潮中,一家不追逐短期风口的机器人公司如何稳健穿越周期?
文丨徽声在线记者 薛良
当2026年世界杯的号角吹响,6月6日,中国外交部发言人毛宁在X平台分享了一段机器人踢足球的精彩视频,并配文“中国机器人战队已整装待发”。
这段视频中的主角,正是加速进化推出的新一代人形机器人T2。尽管加速进化公司成立时间不长,但在机器人足球这一领域,其CEO程昊自2006年踏入清华大学自动化系大门起,便已深耕细作长达20年。
在与程昊的深入对话中,他反复强调的并非大模型的宏大愿景,而是加速进化所坚持的分层落地、数据先行的战略路径。程昊认为,具身智能的发展应先让机器人在实际场景中奔跑起来,通过商业化真实场景的沉淀,形成数据飞轮效应。他并不认同激进押注的做法,反而指出双足人形机器人在工厂中的规模化落地尚存挑战,硬件毛利将持续走低,算法难以构成真正的竞争壁垒。同时,他认为具身大模型的成熟落地仍需五至十年时间,与其等待空中楼阁,不如先聚焦于操作系统与场景的落地。
这家公司显得尤为沉稳,不急于拥抱宏大叙事,甚至不太迎合资本的风潮。在具身行业普遍被融资、估值和概念所裹挟的背景下,程昊表示,融资是双向选择,他宁愿节奏比行业慢半拍,也不愿编故事、偏离长期战略。他更看重的是商业模式是否成立、产品是否真正落地、组织是否踏实笃定。
今年5月,加速进化成功完成了近10亿元的A轮系列融资,其中最新一轮由北京高精尖产业基金、京国盛基金与华控基金联合领投。在加速进化的股东名单中,还包括深创投、北京市人工智能产业投资基金、北京机器人产业发展投资基金、源码资本、英诺基金、彼岸时代和IDG等知名机构。
从清华自动化系起步,到二十年后打造一个现金流健康的公司,程昊的目标是交出千台真机,瞄准教育场景,试图打开一个新的百亿美元级市场。他希望通过实际行动证明,慢即是快,与其冲刺一时规模,不如做一家十年后依然屹立不倒的公司。
这也是程昊从移动互联网周期中汲取的宝贵启示——先找到商业模式,再谈改变世界。
机器人足球:二十年磨一剑,验证最小闭环
徽声在线:20年前,您是如何开始机器人足球的研究的?
程昊:我从小就梦想着能制造出机器人,高中时得知自动化系与机器人研究紧密相关,便毫不犹豫地选择了清华自动化系。当时,清华只有两个实验室在研究双足机器人,大二时精仪的实验室关闭了,整个清华就只剩下我们一个实验室在坚持。
机器人足球,用现在的话来说,是唯一一个可以真正落地的具身Agent。它需要运动能力(跑跳踢球)、实时决策(何时射门)、多机协作(5v5团队),规则明确、输赢清晰。篮球依赖手部操作,20年前到现在技术都难以实现,但足球和走路都用脚,相对简化了复杂问题。
徽声在线:新品T2与世界杯同步到来,它的踢球技术是否更上一层楼?
程昊:T2是我们针对高动态、高爆发、复杂需求的科研等场景推出的旗舰机型,从自由度、单臂负载、算力到二次开发能力都达到了新的高度。
外交部发言人毛宁前两天在X上分享的T2踢球视频,展示了它自主踢球的球速可以与世界一流的金靴运动员相媲美。这是我们筹备世界杯内容的一部分,期间我们会用T2和K1进行一系列点球挑战和互动活动。
徽声在线:创业后依然参加足球赛事,您的感受有何变化?
程昊:2024年参赛时,我有些失落。近十年来,大家似乎没有取得本质性的进步。当年有支德国队凭借开源算法碾压全场,但大家学了十年,水平依然如故。特别是当年使用的舵机,算法运行效果不佳,能力有限,产品化空间小,就像造汽车不能使用三蹦子发动机一样。何况舵机还非常昂贵。
但到了2025年,我们的K1和T1在赛场上几乎碾压所有对手。我们换用了准直驱关节,采用了最前沿的算法,使得机器人走路更稳、不怕撞、射门精准,最大比分达到了20:0。T2的能力将更上一层楼,它定位在旗舰水平,算力拉满,价格区间也能覆盖更广泛的用户。
身高不到1米的K1能大力抽射,球撞球网后墙壁发出“咚”的一声。线下活动不得不限制参与人群年龄,以防有人被球撞伤。这款机器人售价仅为3.99万元,拥有22个自由度,入门版算力达到48 TOPS,在京东平台即可购买。
徽声在线:踢赢足球赛后,下一步的目标是什么?
程昊:我们的终极目标是踢赢人类。具体来说,是2050年踢赢人类,中期目标则是2030年踢赢U9青训队。
徽声在线:但足球赛既非商业化赛事,也非生产力场景,您不觉得有些荒诞吗?
程昊:20年来,人形机器人在各种场景中尝试,但只有踢足球这一场景存活了下来,其他如跳舞、射箭比赛等都已消失。当人形机器人把足球踢好、踢赢人类的那一刻,它就具备了落地能力。足球涉及运动、感知、决策全流程,如果直接与人类对抗,还涉及人机对抗的安全算法优化,这些都可以在足球场上闭环实现。这是验证最前沿算法的最小可执行产品(MVP),非常本质。
就像字节跳动,先做内涵段子、再今日头条、最后抖音,本质做的是内容生产-分发-消费,算法同一套,载体不同。最垂直简单的载体也能把算法跑完美。
徽声在线:足球是具身智能的MVP吗?
程昊:对。如果在家庭场景试验,不仅成本高昂,而且存在安全隐患,没有家庭敢于直接使用。但不验证就拿不到真实场景数据迭代算法,这事就锁死了。就像自动驾驶,如果全世界都不允许上路怎么办?所以要先让车跑起来,数据自然就来,推动具身飞轮转动。
另外,足球具有观赏性,对中学生以下的效果很好。前阵在五棵松举办的活动,机器人已经可以通过端到端神经网络直接射门,点球一般小学生守不住,力道强还会找角度。今年年中,机器人将能够跑起来、带球传球,观赏性将进一步提升。
徽声在线:除了足球,还有其他场景能实现这种技术验证闭环吗?
程昊:我目前还没有想到其他场景。
分层落地:为何现在该做操作系统,而非赌端到端
徽声在线:二十年过去,具身智能现在与从前有何本质不同?
程昊:大逻辑框架相似,但每个模块的算法都在不断升级。比如决策层,现在逻辑是用大模型生成。
徽声在线:这似乎还是分层逻辑,与许多公司主张的端到端模型不同。
程昊:终局是端到端解决所有问题,但现在还非常遥远。就连大模型介入决策层也存在诸多问题,比如足球场景对快速响应要求高,目前还用不了大模型,决策树+强化学习更快。如果不是高速响应任务,比如导览,大模型决策可以落地,但这仍是感知→决策→执行的过程,并非端到端解决一切。
徽声在线:所以加速进化现阶段没有在做具身大模型?
程昊:我们不押注“空中楼阁”的端到端大模型,但我们在做分层模型落地,同时用落地场景采集数据——这是特斯拉路线。
具身大模型距离落地还非常非常遥远。首先,范式是什么还不知道,从VLA到世界模型还在争论;其次,训练所需的数据都没有。即便把多模态数据词元化,需要多大算力?语言模型的算力需求你已经看到了,更何况现在还根本没有这些数据,具身模型到底需要什么样的数据也不清楚。
条条大路通罗马,但我们还处于没有鞋的阶段。
徽声在线:数据和算法,哪个更重要?
程昊:人活下来,吃饭重要还是喝水重要?都重要,但现在都不知道怎么做。
徽声在线:但很多人都在谈论数据应用,比如真机数据、遥控操作、仿真数据。
程昊:遥操数据做出来的demo拧瓶盖像穿针引线,这是慢思考训练快思考,不合理。真机数据、仿真数据也有类似问题,能拿出demo,某些情况效果不错,但都是过渡方案。
就像AI视觉领域,OpenCV能识别物体你觉得厉害,但多模态大模型才是终极方案,中间迭代了将近20年。做公司不能等20年,一两年也不能等。所以我们一直在做机器人足球赛这样的落地,像是在泥里爬,大模型是天上飞的,要先爬出来才能往上飞。
徽声在线:多久才能往上飞?
程昊:从现在算,最快五年,大概率十年。
徽声在线:其他走具身大模型路线的公司,也需要十年落地吗?
程昊:反过来想,如果现在没有公司往前推,时间可能更长。就像OpenAI做大模型,最初不考虑落地,融很多钱笃定沿transformer往下走,从1.0到2.0、3.0,最后才涌现好结果。
徽声在线:谁做这样的事比较靠谱?
程昊:大厂吧,需要千亿人民币投入。OpenAI虽不是大厂,但和微软绑定,具备大厂的人才密度和资金,就很笃定敢赌。具身大模型现在就应该做,但不是加速进化做。
徽声在线:那加速进化做的是什么?
程昊:我们做的是和具身大模型相辅相成的一条路。具身大模型需要数据、需要基于本体的验证、需要落地,而加速进化就在开发机器人本体、操作系统与工具。
我们像苹果或微软,做本体、做端侧系统和工具,大模型像互联网或云。未来具身行业这两类公司都需要,但初创公司说两个都做且都做好,不现实。
OS时代:构建Agent生态与数据飞轮
徽声在线:开发具身操作系统的前提是什么?
程昊:软件工程师先用一年时间开发踢足球,成为机器人Agent开发者。踢足球本身就是个Agent,工程师开发过程就会理解机器人需要什么样的系统工程建设。这个世界上懂机器人的不太懂软件工程,懂软件工程的完全不懂具身智能,但踢了一年足球后,我们出现了一批两方面都懂的工程师。
徽声在线:操作系统具体做什么?
程昊:类比Windows和计算机。通用的事——开发工具、环境配置——操作系统都集成了,GUI本质是降低开发者门槛。过去具身开发要名校硕士,用我们的工具,会Python的高中生就能上手。
最终会发展出具身Agent生态。不是现在熟悉的大模型Agent,是具身Agent,大家把不同算法能力组合起来接入操作系统,解决真正问题。谁能构建Agent生态,谁就是最大赢家。
徽声在线:你们马上要推出一款叫Booster Studio的开发工具,听起来像是为开发者准备的“武器库”。
程昊:是的,这应该是全球第一款专为具身开发而生的工具软件。它内置了完整的仿真环境,从仿真到真机一键部署。
徽声在线:这让我想到你们之前说的“最小闭环”。
程昊:对,我们马上会举办一场全球3v3机器人足球仿真赛。开发者可以在Booster Studio里训练自己的AI Agent,提交到云端自动对战、自动判分。优胜者的策略可以直接部署到真机K1或T2上。这正好把我们20年来在真实足球场上验证的闭环,开放给全世界的开发者——不需要拥有硬件,也能体验“从代码到进球”的全过程。
徽声在线:可以理解为加速进化要做机器人的安卓系统?
程昊:对,把应用和硬件解耦。我们的操作系统可以适配各种芯片、机型、品牌,上层开发者只专注开发Agent,既能跑在宇树机器人上,也能跑在加速进化机器人上。
徽声在线:这样硬件会变得很难卖?
程昊:具身走入本体时代尾声,硬件技术已收敛,会越来越标准化,毛利变得很低。买联想和惠普笔记本有多大差别?其实没有。
徽声在线:操作系统似乎是大厂才能做的东西?
程昊:苹果和微软是因为先成功才做操作系统,还是因为做了操作系统才成功?其实是后者。操作系统带来的生态是非常强的壁垒。
徽声在线:加速进化凭什么做好操作系统?
程昊:我们是最擅长做这件事的团队。从成立第一天,团队就分两拨人:做自动化、本体的同学,和来自互联网的开发工程师,近一半是完全软件背景。
全球范围内,加速进化是最重视软件工程的机器人公司。一说具身智能大家都想到硬件、算法,但没意识到,在真正实现具身大模型之前,漫长的OS时代需要做非常复杂的软件工程,是dirty work,代码量极大,但能构建真正壁垒。历史上没有任何公司能靠算法构建壁垒,大模型又一次证明了这一点。
徽声在线:软件工程壁垒会不会因AI变低?
程昊:你不觉得这更有利于我们这样的创业公司成长为巨头吗?(笑)在大厂一个项目300人,现在可能三十人就能做到。
徽声在线:互联网背景工程师不懂具身智能,怎么当架构师?
程昊:先让他们去踢足球。这个世界上两方面都懂的人极少,但踢了一年足球后,我们培养出了一批。
教育市场:百亿美元级的“Apple II时刻”
徽声在线:你们的产品看起来蛮to C的,小机器人在京东就能买到。
程昊:我们方向之一就是先做小,更快落地形成商业化。现在出货量最大的还是小人形机器人,小人形领域机器人的出货量我们是第一,今年会有更多同行来做。
徽声在线:谁在买这些小机器人?
程昊:我们有两款产品:T1一米二高,围绕科研需求,做运控、导航、多机决策研究;K1个头更小,适用教育教学场景,价格更便宜,定义叫具身开发入门级平台。
教育是非常大的市场。80年代美国、90年代中国大量建设计算机机房,为普及计算机发挥重要作用,打造了中国工程师红利。早年苹果实际上大量机器卖给学校。
具身智能会经历这个阶段,机器人本体+操作系统+开发工具,能复刻当年Apple 2或DOS电脑的商业化。很多学生想学机器人但买不起,靠学校建机房。加速进化非常适合这个场景:软件上操作系统已降低开发者门槛,硬件上小尺寸机器人不笨重、很安全。
科研或足球赛事总盘子小,但机房这种教育领域是百亿美元级别市场。
徽声在线:在中国落地,涉及复杂关系处理?
程昊:我们第一台机器人卖的是海外客户。2025年加速进化40%营收来自海外,今年前两个月升至60%。
这是真正实打实的商业模式,相比之下大家热衷的翻跟头没有商业模式。
徽声在线:机器人进工厂呢?
程昊:商业模式要跑通,机器人一定要比人便宜,但现在做不到。工厂里简单的事机械臂就能做,复杂到机械臂干不了的事,机器人同样做不到,或贵很多。比如汽车组装,机器人搞不定柔性线材,最后还得靠人,算下来不如直接雇人。机器人落地工厂这种商业模式,我现在看不到任何机会。
徽声在线:家庭场景呢?
程昊:做了这么多年,看了这么多年,不乐观。家庭场景太复杂,日常路线上有玩具或椅子怎么绕开?叠衣服的床贴着墙怎么拿?放柜子里怎么开门?这些复杂状况会大大降低成功率。反倒是双足机器人不稳定容易摔倒这种问题,今年就会被很好解决。
徽声在线:运控能力和宇树相比如何?
程昊:其实差不多。算法无法构建壁垒,宇树真正的壁垒是高爆发关节,硬件积累很深厚。
徽声在线:卖了1000台,硬件供应链有什么经验?
程昊:一开始用第三方零件而非自研,随着量起来逐渐转向自研。在中国供应链不难,除了招对人,还有就是控量——产能一周一台时,对外就卖一台。有客户要100台,我都直接说不行。
因为我们的量产是逐渐爬坡的,从一周只能产一台,提升到一周能产3台,再到一周能产10台,再到一周能产比如50台,这是一步步爬坡上去的,而不是一下子就说要一周量产100台、一周量产1000台。
我们的商业策略也是同步推进的。前期可能就卖一台,到现在能卖五台,这正好是生产和商业化同步、交替逐步提升的过程。这样做的好处是,早期阶段可以用相对低的成本、招少量的人员,先把一周一台的产能做稳定。
终局愿景:OS时代的数据资产,换未来大模型的后发先至
徽声在线:如果大厂现在做具身操作系统乃至大模型,怎么应对?
程昊:大厂很难现在下决心做具身模型,因为看不到明确实现思路,负责的人可能面临未来几年绩效都很差,没人愿意做。即使做,也是把模型成熟时间从15年缩短到12年。
大厂要做成,必须得1号位亲自做,但现在还没有1号位愿意亲自下场盯具身大模型,因为技术路线没收敛,我们叫TPMF(technology product market fit)。
徽声在线:但一旦有了,对你们是颠覆。
程昊:没错。移动互联网时代软件被打压,Windows原来卖很贵,现在免费了,但微软靠之前积累的资本和人才,在云时代和大模型时代又追了上来。
徽声在线:一场又一场不同维度的战役。
程昊:本体时代我们已在为OS时代做准备,OS时代当然要为具身大模型时代做准备。这是有弯道超车可能性的,字节2023年才开始做大模型,但豆包现在非常成功。
徽声在线:前提是先成为字节。
程昊:没错。我经常跟投资人讲,什么时候我们有非常稳定的几十亿收入、几亿利润,一定会养非常大的团队去做具身模型。还是那句话,算法没有壁垒,可以后发先至。
在漫长的OS时代,我们通过操作系统与开发工具,可以获得最多的数据,也就是有机会训出最好的模型。我们不做空中的大模型,但我们在泥里爬,爬出来,再往上飞。
徽声在线:移动互联网周期给现在具身智能周期最大的启示是什么?
程昊:先找到商业模式,再去谈如何改变世界。
商业选择:比起估值,更想做一家十年后依然存在的公司
徽声在线:感觉你在商业化这块表述得都比较保守。
程昊:对,我觉得找投资本身是一个双向选择的过程。投资人就跟相亲一样,你不用刻意去说服对方、让对方喜欢你。我的想法是应该多快速沟通,找到那个真正看对眼的。找投资也是一样,核心还是非常笃定地把我们的逻辑讲清楚,然后尽快找到认可这套逻辑的投资人。
不过我们的商业化增长势头很迅猛,今年一季度累计出货同比增长500%,一个季度的量就顶得上2025年前8个月。1到2月新签的订单同比涨了800%。
我们已经具备了扎实的商业化自我造血能力,走到哪儿能卖到哪儿。不管是CES展会,还是亦庄马拉松,我们带去的机器人,现场就被抢空了,这就是最直接的证明,我们是真能卖货、真能造血,完全不用靠编故事、炒概念来吸引投资。
徽声在线:不着急吗?现在眼看这个市场环境,大家都有点疯狂。
程昊:心里可能会着急,但我们还是会很笃定地用逻辑把道理讲明白。第二点,其实我们融资进度也还可以,基本每年都能完成三四轮,只是整体上我们不会那么激进,不会去讲大故事、快速拉投资人进场,签下风险很高的投后条款,再把估值迅速做上去。
我们整体节奏,比行业估值提升的速度大概晚半年,这其实没有任何影响。但我们肯定不希望为了迎合投资人的喜好去编故事、做投资人喜欢的事,那样对公司的战略发展方向,影响会非常非常大。
徽声在线:怎么看待2026年市场竞争的激烈程度?
程昊:我一直是这个观点:只要你的产品和商业模式没问题,就不可能拿不到投资。这个市场最终还是会用脚投票,投给能实现商业化成功的企业。
徽声在线:但你得熬到那个时候才行。
程昊:对,但核心在于,我们的商业模式本身是成立的,整体出货量也在几倍、几十倍地持续增长。这不是单纯的熬。比如你现在估值快速拉高,很快上市了,但如果没有好的商业模式支撑,早晚还是会跌下来,到时候整个团队就会面临巨大变动。
说实话大家到时候就不盯业务、天天盯盘了,整个心态都会受到很大影响。我们的逻辑是:如果这个方向坚持十年能做成一家像微软那样的公司,又何必非要在这两年就冲到某个级别?我觉得这不是最本质的东西。
徽声在线:大家普遍有一种焦虑,就是拿不到钱可能就会死掉,或者后续资金不会再那么好拿了。
程昊:钱好不好拿,确实有客观规律在,但一家公司会不会死掉,关键看你有没有产品、产品有没有成熟的商业模式。
徽声在线:投资人提问里,你们最难回答的问题是什么?
程昊:目前还没遇到过。
徽声在线:招人难吗?
程昊:会比较难。不过另一方面,人才供给本身是存在的,只是很多候选人会在意公司估值够不够高这类问题。其实这反而是好事,以我的经验来看,这类人招进来,很可能会对组织造成伤害——他们往往天天关注这些表面东西,或者在意公司宣传声势,不看本质、不关心自己手头的事情能不能做好。很多方向更容易赚快钱,也更容易做表面化的销售、分析类工作,但我们这个领域,还是需要非常踏实、认准方向、能笃定一点点积累的人。
所以我们之前从来不在PR上花钱,因为觉得没意义。直到今年春节,行业竞争环境恶化。但我觉得这反而是好事,相当于倒逼我们。
(让我们)把一些能力补齐、做健全。核心是我觉得现在光靠产品技术是不够的,因为还没法形成消费级To C的机会。这时候砸出去的钱,最后只能落在品牌上,而品牌后续又接不住,大众又很健忘,这些信息其实没什么价值。还是要更务实一点,把资金投入到研发上,投入到商业模式的打造上。
题图来源:加速进化
