WAIC 2024丨组团秀肌肉的人形机器人,比语言大模型更具前景?
发布时间:2024-12-10 | 发布者: 东东工作室 | 浏览次数: 次(原标题:WAIC 2024丨组团秀肌肉的人形机器人,比语言大模型更具前景?)
为期4天的2024世界人工智能大会(下称“WAIC”)7月7日正式落下帷幕。本届WAIC现场,能够随处走动、跑跳、上下楼梯的人形机器人成为最吸睛的亮点之一;多家垂直于机器人关节、小脑、手臂等细分领域的厂商亮相WAIC,让现场堪比大型机器人“器官市场”;人形机器人、具身智能等概念也成为与会者口中的热门概念。
“我们非常希望与机器人厂商合作开发应用,目前也在跟一些厂商谈。”7月8日,一位国产算力厂商的生态负责人在会后对经济观察网表示。与此同时,多位参展商工作人员对记者表示,未来的大模型技术,将不再局限于语言模型,而机器人将会是更好的载体。
人形机器人组团亮相
在WAIC期间,18台采用不同技术架构的人形机器人列阵在世博园展览馆入口依次排开,被称作“十八金刚”。据了解,这十八位机器人各有来头。
居于列阵首位的是国家地方共建人形机器人创新中心首次发布的开源通用人形机器人公版机“青龙”,这也是国内首款全尺寸通用人形机器人公版机;与此同时,来自复旦大学的光华一号,宇树科技的H1,达闼的XR4“七仙女”小紫,开普勒的先行者K1,傅利叶的GR-1,乐聚的夸父4代,松延动力的Song,智元机器人的远征A2等企业、事业单位的人形机器人也位列其间,共同在WAIC期间迎来送往。
不过,看上去既炫酷又震撼的“十八金刚”,可能还处在观赏性大于实用性的“幼年”阶段。
“目前机器人发展最核心的问题,在于灵魂与肉体之间的结合。”松延动力生产及交付副总裁付鹏鹏告诉经济观察网,“AI大模型现在仍然是局限在屏幕里的,如果要载入机器人本体,涉及的技术难度非常高。所以现在的AI机器人去拿一杯水,动作都很慢,思考的时间都需要很久。”
多位业内人士也在现场对经济观察网表示,人形机器人虽然看起来炫酷,但距离产业真正成熟恐怕还很遥远。目前专注于非人类语言信息处理的公司,其技术进展也很缓慢。
事实上自2024年以来,人形机器人在资本市场的热度一度飞升,该领域已经出现了两笔规模较大的早轮融资——宇树科技今年2月份完成了B2轮近10亿元人民币融资,投资方包括美团、金石投资、源码资本,老股东深创投、中网投、容亿、敦鸿和米达钧石跟投;今年6月,银河通用机器人完成7亿元天使轮融资,投资方共有22家,包括美团点评战投、北汽产投、商汤国香基金、讯飞基金等战略及产业投资方,以及启明创投、蓝驰创投、经纬创投、源码资本、IDG资本等头部财务机构,光源资本担任融资财务顾问并参与早期投资。
比大语言模型更具想象空间
“人形机器人究竟能用来干什么?”这是经济观察网记者在WAIC现场听到被问及次数最多的问题。
早些时候,特斯拉CEO马斯克曾公开表示,特斯拉Optimus机器人将于2025年开始限量生产,以供给特斯拉工厂使用,从而进一步提升生产效率和自动化水平。事实上,大部分人形机器人也都有量产计划,应用领域集中在制造业、服务业、医疗、教育以及建筑工程等行业。
不过,技术真正成熟的机器人,或许更具想象空间。
“当前大模型所处理的工作尚未脱离语言,但自然界中能被人类认知的信息不超过5%,这些信息中只有不到5%的内容能被语言表达,在这个基础上AI学习到的信息很有限。如果直接让AI去理解世界,它可能不需要语言,就能做得会比人很好,而实现的载体就是机器人。”摩尔线程市场生态总监吕其恒在WAIC现场对经济观察网表示。
他指出:“未来,如果给机器人装上眼睛,让它看世界;装上其他传感器,让它理解世界,那么机器人即使不会语言,也能学会人类的一切。就像现在,AI能帮助人类总结信息、提炼观点,这是人类历史上第一次智力劳动可以被取代,智力成果可以被生产。如果机器人的大脑不再完全依赖语言模型,而是通过更多的手段学习之四海,我们就可能会创造出一个意想不到的智能体,其智慧甚至可能超越人类。”
作为全功能GPU为核心的国产算力公司,摩尔线程在本届WAIC上宣布升级了AI旗舰产品夸娥(KUAE)智算集群解决方案,将算力服务从千卡级别扩展至万卡规模,使其平台能够承载万P级浮点的通用加速计算,服务于万亿参数级别的复杂大模型训练,为国产AI模型训练的主战场“备足弹药”。
“万卡规模将成为标配,只有AI模型训练的规模足够大,才能做得足够好。” 吕其恒认为,“历史上的工业革命,往往来自一个偶然的精巧设计,比如爱因斯坦的相对论、量子力学,或者是现代钢铁的出现等工程上的突破。但今天的AI技术靠训练就能‘堆’出效果,给了人们大力出奇迹的机会。更何况,一旦最终成功训练出一个超级智慧体,其智慧的扩张边际成本将几乎为零。”
与此同时,他指出,当前具身机器人的发展有两个难点:首先是解决机器人的控制与协调问题,让它能站住,关节能控制,行动的时候不摔倒,实现这一目标难度很高,本质上是机器人动力学问题;其次,机器人需要一个大脑,使它像人的行为一样自然协调,不同肢体之间互相配合,同时对外界刺激作出反应,成本还要低,这就需要极好的产品,而中国一些厂商已经走在全球前列。
如果未来AI能够获取语言信息之外的全栈信息,那么它或许还可以帮助人类做决策。吕其恒告诉经济观察网,目前AI还不能做决策,受制于两个因素:首先,AI无法获得全栈信息,尤其是非理性的情绪信息;其次,基于康德提出的二律背反(康德的哲学概念中,二律背反是指对同一个对象或问题所形成的两种理论或学说虽然各自成立,但是却相互矛盾的现象),人对于事物做出哪种解释并不是基于理性,而是价值观。其实在金融领域,如果让AI帮助人来做决策,很可能会更有效,因为金融行业唯一需要被战胜的就是信息缺失和情绪波动。
他也感慨道,如果机器人真的具备了学习能力,它或许将比大语言模型更具想象空间。对于人类来说,过去的技能是摘果子,但未来的世界可能会是一片麦田,令我们手足无措。