《科创板日报》6月14日讯今日,腾讯RoboticsX机器人实验室公布了智能体研究的最新进展,通过将前沿的预训练AI模型和强化学习技术应用到机器人控制领域,让腾讯机器狗Max的灵活性和自主决策能力得到大幅提升。
(资料图片仅供参考)
Max是腾讯开发的多模态四足机器人,其学习真狗的过程都在虚拟世界里面训练而成,不需要进行实机训练和调整。
具体来看,在第一个预训练学习中,RoboticsX实验室与腾讯游戏展开合作,使用游戏研发过程中的动捕数据集,让Max学会走、跑、跳、站立等动作。
第二个预训练学习通过额外的网络参数来将第一阶段掌握的机器狗灵动姿态与外界感知联系在一起,使得机器狗能够通过已经学会的灵动姿态来应对外界环境,完成匍匐前进、跨栏跑、障碍物跑酷穿梭等高难度动作。
在第三阶段的学习中,附加的网络会获取与复杂任务有关的信息,例如在游戏中,获取对手的信息、旗子的信息,最终使得机器狗在策略侧面能自主形成认知。
在基于预训练好的模型下,机器狗通过深度强化学习,不仅能够在运动过程中保持灵活、稳定,克服路障,还具备了一定的推理和决策能力:
在双狗障碍追逐游戏中,当追击者意识到自己在躲避者碰到旗子之前已经无法追上它的时候,追击者就会放弃追击,而是在远离躲避者的位置徘徊,目的是为了等待下一个重置的旗子出现。
另外,当追击者即将抓到躲避者的最后时刻,或者躲避者在快要接触旗子的时候,机器狗喜欢跳起来做出一个“扑”的动作。这些都是机器狗为了确保自己的胜利采取的主动加速措施。
腾讯方面表示,预训练AI模型和深度强化学习技术为未来机器人解决其他复杂任务提供了一套通用的解决方案。为机器人走入现实生活,服务人类打下了坚实的基础。
▌GPT等AI大模型有望让机器人智能化更上一层
腾讯机器狗的案例是AI赋能机器人的生动诠释。AI所造就的机器人,与传统机器人最大的区别在于,AI机器人表现出一些与人类相似的智能特征,从原先的“自动化”(工程师藉由程序设计编写规则,让机器人遵守)迈向了真正的“自主学习”。
从产业端来看,已有特斯拉的Optimus、波士顿动力Atlas/Spot等AI机器人出圈。
进入AIGC时代,GPT等AI大模型的出现则有望让机器人智能化更上一个台阶。过往的机器人更多依赖人们手写代码从而在特定场景下完成特定任务,难以与人类进行多维度交互,而通用大模型的突破为人机交互提供新的思路,通过引入多模态让人们能够更采用更直接、轻便、灵活的方式对奇迹人实现操控。
开源证券分析师孟鹏飞表示,2023年,以GPT-4为代表的AI大模型迎来突破性进展,将进一步提升特斯拉机器人交互、决策、感知能力,加速迭代落地。OpenAI领投人形机器人公司1X证明了AI在人形机器人领域大有可为。
国泰君安分析师肖群稀认为,AI大模型的出现,会从语音、视觉、决策、控制等多方面实现同人形机器人的结合,形成感知、决策、控制闭环。
国信证券分析师吴双表示,GPT大模型技术在人形机器人上的应用有助于其商业化进程推进。一方面,大模型可解决“大脑”自主思考问题,使其具备理解与推理能力;另一方面,更强算力可提升机器人“小脑”运动控制能力。