您的位置:首页 >知识精选 >正文

卡内基梅隆大学MetaAI研究人员开发出能够掌握多种技能的机器人学习代理

摘要 人类是社会性动物,即使从很小的时候就可以互相学习。婴儿会敏锐地观察他们的父母、兄弟姐妹或照顾者。他们通过观察、模仿和重播所看到的东...

人类是社会性动物,即使从很小的时候就可以互相学习。婴儿会敏锐地观察他们的父母、兄弟姐妹或照顾者。他们通过观察、模仿和重播所看到的东西来学习技能和行为。

婴儿学习和探索周围环境的方式启发了卡内基梅隆大学和 Meta 的研究人员开发一种新方法来教机器人如何同时学习多种技能并利用它们来处理看不见的日常任务。研究人员着手开发一种人工智能机器人,其操控能力相当于 3 岁儿童。

该团队推出了 RoboAgent,这是一种人工智能代理,它利用被动观察和主动学习,使机器人能够获得与幼儿同等的操作能力。

“RoboAgent 是通用机器人代理的一个重要里程碑,它们是高效的学习者,在新情况下有效,并且能够随着时间的推移扩展其行为,”计算机科学学院机器人研究所的兼职教师 Vikash Kumar 说。“当前的机器人是高度专业化的,并且经过单独的单独任务训练。相比之下,我们着手创建一个能够在未见过的场景中展示广泛技能的单一人工智能代理。RoboAgent 像人类婴儿一样学习——结合大量的被动观察和有限的主动游戏。”

RoboAgent可以跨不同场景完成12种操控技能。这项研究指出了一个能够适应不断变化的环境的机器人学习平台。与过去的研究不同,该团队在真实环境(而不是模拟)中展示了他们的工作,并且使用的数据比以前的项目少得多。

机器人研究所副教授阿比纳夫·古普塔 (Abhinav Gupta) 表示:“与其他人相比,机器人特工能够掌握更复杂的技能。” “我们展示了比现实世界中单个机器人代理所实现的任何技能都更加多样化的技能,并且具有效率和对未见过的场景的独特泛化规模。”

该团队的代理通过自我体验和互联网数据中包含的被动观察相结合来学习。当父母引导孩子时,研究人员通过任务远程操作机器人,为其提供有用的自我体验。

“我们方法的有效性和效率源于我们新颖的政策架构,它允许我们的代理人即使在经验有限的情况下也能进行推理,”博士 Homanga Bharadwaj 说。机器人学专业的学生。“RoboAgent 通过根据运动的时间块而不是常用的按时间步操作来预测和聚合决策,从而响应指定的文本/视觉目标。”

机器人主要从自己的经验中学习,而不是从周围被动发生的事情中学习。这种对环境中发生的事情固有的盲目性从根本上限制了机器人所经历的多样性以及它们适应新情况的能力。为了克服这些限制,RoboAgent 从互联网上的视频中学习 - 类似于婴儿如何通过被动观察 周围环境来获取知识和行为。

“RoboAgent 利用这些视频中包含的信息来了解人类如何与物体交互的先验知识,并使用各种技能来成功完成任务,”博士莫希特·夏尔马 (Mohit Sharma) 说。机器人学专业的学生。“此外,在多个场景中观察类似的技能可以让它了解完成任务所需的技能和不需要的技能。当遇到未知的任务或未见过的环境时,它会利用这些经验教训。”

机器人研究所助理教授 Shubham Tulsiani 表示:“能够进行这种学习的智能体让我们更接近通用机器人,它可以在各种看不见的环境中完成各种任务,并随着收集更多经验而不断进化。” “RoboAgent 可以使用有限的域内数据快速训练机器人,同时主要依靠互联网上大量可用的免费数据来学习各种任务。这可以使机器人在家庭、医院和其他公共场所等非结构化环境中更加有用。”

该团队正在开源其经过训练的模型、代码库、硬件驱动程序,以及最值得注意的是本研究中收集的整个数据集。RoboSet 是商用硬件上最大的公开可用机器人数据集。该团队希望这将使其他人能够重用、改编和传递它,随着时间的推移,形成一个真正基础的通用机器人代理。

版权声明:本文由用户上传,如有侵权请联系删除!