中经记者 曲忠芳 北京报道
通过自然语言发出的语音指令,宇树科技G1机器人展示了格斗组合拳,银河通用机器人Galbot在零售场景中抓取不同商品,天工机器人则完成水果摆盘的任务……这是在2025年北京智源大会上展示的一些真实场景。
在过去的一年里,具身智能领域迎来爆发式增长,成为AI与机器人技术融合的核心赛道。《中国经营报》记者从智源大会了解到,今年首次将具身智能活动部分升级为全天的分论坛,并加入人形机器人的主题。来自产学研各个领域的代表就具身智能的发展现状及未来趋势进行了热烈讨论。
正面回应“秀肌肉”之嫌
今年以来,从春晚跳舞到马拉松比赛、格斗比赛,再到8月即将举行的运动会,人形机器人赛事蔚然成风的同时,也引发了社会大众的疑问:人形机器人企业是否存在“秀肌肉”、博眼球之嫌?
对于这一犀利的提问,宇树科技创始人、CEO王兴兴在现场正面回应称:“我们的目标一直是通过AI技术让机器人做各种全身动作,真正解放人类的生产力,但在这个终极目标实现之前,我们先参加一些表演、一些赛事来向大家展示机器人的情况,并且产生一部分商业价值。”
宇树科技因16台H1机器人在央视春晚表演舞蹈而声名大噪,今年5月下旬又举办了业内首个人形机器人格斗比赛,宇树机器人G1“AI策算师”夺冠。
除了王兴兴,今年4月初在业内首个人形机器人半马比赛中夺冠的天工机器人负责人、北京人形机器人创新中心总经理熊友军也回应道:“举办机器人比赛非常有意义。”之所以这样说,首先,通过大众喜闻乐见的比赛形式,传递和普及机器人的发展现状,以及相关技术和知识。其次,比赛是非常好的机器人技术训练场,很多比赛场景来自人类真实的生态场景,符合机器人的发展方向,有助于提升机器人的技术。最后,比赛是了解机器人潜在客户,并建立起一条与机器人企业沟通的桥梁,能够促进机器人加速产业化,以及加速在真实场景中的试点应用。
“通过赛事可以看到机器人的性能,这是一个好的起点。下一步能看到机器人产生价值、能干活的比赛,将是生产力的比赛。”穹彻智能联合创始人、上海交通大学教授、上海创智学院副院长卢策吾如是指出。
美国初创具身智能企业Physical Intelligence的联合创始人兼CEO Karol Hausman表示,海外也有一些机器人相关的比赛,但与中国的规模无法相比。“非常期待能够看到中国的比赛与机器人技术的发展与验证。”
具身智能面临的技术难题
Karol Hausman提出,在具身智能的发展中,VLA模型是关键突破。这一观点引发了产业界的共鸣与认同。VLA模型可以让机器人通过互联网数据学习,无须体验每个场景,还能与其他机器人连续获取数据。
记者获悉,所谓VLA,是指视觉—语言—动作模型,是多模态大模型中的新算法框架。基于此,Physical Intelligence研发了通用机器人基础模型π0,经预训练和后期高质量数据培训,使机器人能完成如打开洗衣机、叠衣服等复杂任务,在陌生环境下任务完成率达 80%—90%。目前虽已展示物理智能潜力,但在泛化能力、稳定性等方面仍有挑战,未来希望实现机器人100%稳定完成任务,推动物理智能的进一步发展。
针对具身智能面临的数据瓶颈,银河通用创始人兼CTO、北京大学助理教授、智源具身智能研究中心主任王鹤主张采用合成数据为主、真实数据校准的训练范式,通过十亿级高质量仿真数据训练端到端模型,可实现零样本泛化。他透露,目前该公司的研究成果已在零售、工业等场景逐步落地。
上海人工智能实验室青年科学家、具身智能中心负责人庞江淼持相似看法。他认为,合成数据有助于本体和场景泛化。同时他坦言,持续压低真实数据采集数量,提升合成数据的质量,直到全合成数据能够零样本泛化,还需要一定时间。
千寻智能联合创始人、清华大学交叉信息研究院助理教授高阳也表示,机器人数据采集成本高——需遥操作+物理交互,而且难以用语言描述——如游泳,这导致形成了“无智能—少机器人—少数据”的恶性循环。基于此,可利用互联网视频数据,通过跟踪视频中物体运动预训练模型,再迁移到机器人遥操作数据微调,结合强化学习,解决仿真与现实的差距。
商业化落地路径
对于具身智能的商业化落地进程,众擎机器人创始人、董事长赵同阳表示,当前人形机器人的基础能力还不足,例如还无法稳定地从A点走到B点、上下电梯等。在这种情况下,需要先解决全地形适应、稳定行走,再进一步发展抓取、服务等上层应用,从而突破行业瓶颈。
王兴兴透露,今年上半年,宇树科技在人形机器人租赁市场比较火爆,这说明人形机器人已经带来一定的产业价值。
王鹤也指出,截至目前,银河通用机器人已经在北京开设了7家无人药店,由人形机器人一天24小时负责拣药工作,对接骑手,能够解决夜间急需用药的需求,同时也解决了夜间员工招聘的问题。今年计划在北京、上海、深圳三城开设100家药店。
星动纪元创始人兼CEO、清华大学交叉信息研究院助理教授陈建宇认为,具身智能要跨越三个阶段的“鸿沟”:第一个鸿沟便是创新者阶段,包括机器人产品、灵巧手等,这个阶段已经开始;突破第一道鸿沟后,就能够进入真正的to B各个行业领域,做到真正地解放生产力。当跨越第二道鸿沟后,机器人会真正进入to C消费级市场,进入家庭消费品阶段,而在这个阶段的终局将是数以亿计的应用规模。
智源研究院院长王仲远在接受记者采访时表示,在具身智能发展过程中,智源研究院希望探索出独特的发展路径:一是数字智能物理化。通过大模型技术将数字世界的智能能力延伸至物理世界,推动机器人从“单一功能”向“通用功能”进化。二是低成本功能化。简单来说,即聚焦垂直场景,降低单台机器人成本并强化特定能力,通过规模化落地积累数据,逐步拓展应用边界,让很多小型机器人也能够走进千家万户。因为大型人形机器人技术复杂度高,商业化周期更长;而小型专用机器人若能在细分场景实现极致性价比,可能率先渗透家庭与产业场景,为具身智能的长期发展奠定基础。
(编辑:吴清 审核:李正豪 校对:颜京宁)