麻省理工新AI:单目相机即可自主学习控制机器人

数十年来,创造真正具有适应性的机器人的梦想——能够在复杂环境中导航并以最少的人工干预执行复杂任务的机器,一直难以实现。传统的机器人技术严重依赖精确的编程、详细的传感器数据,并且通常需要大量的人工监督。然而,麻省理工学院(MIT)最近取得的突破正在挑战这些传统方法,为新一代机器人铺平了道路,这些机器人可以通过观察来学习和适应,从根本上改变了这些机器的设计、训练和部署方式。

核心要素是开发人工智能系统,该系统允许机器人仅使用视觉数据就能理解自己的身体和周围的世界。这与先前的方法大相径庭,先前的方法需要大量的传感器——触觉传感器、力传感器和精确的位置编码器——才能为机器人提供对其物理交互的全面理解。麻省理工学院的新系统被称为神经雅可比场(Neural Jacobian Fields),它使机器人能够仅通过*观察*自己的运动来学习控制策略。这种自我观察由单个标准摄像头实现,使机器人能够建立其几何形状和可控性的内部模型。该系统不依赖于预先编程的指令或广泛的人工监督;相反,它通过反复试验来学习,并根据视觉反馈改进其运动。这个过程以大约 12 赫兹的频率实时运行,从而实现持续的观察、计划和行动。其影响是深远的,特别是对于软体机器人,由于所用材料的柔性和可变形性,传统的传感器集成通常具有挑战性。

简化机器人构造的影响不止于此。无需专用传感器或复杂的控制调整来训练机器人的能力大大降低了机器人技术开发和部署的门槛。这尤其与中小型企业相关,例如 13 岁的企业家 Aariyan Tanvir,他已经开始探索人工智能在其业务中的应用。这种新方法的可访问性通过使用消费级摄像头进一步强调,这使其成为各种应用的一种经济高效的解决方案。此外,这项研究不仅限于单个机器人平台。该框架已成功应用于具有截然不同架构的机器人,这证明了它的多功能性和可扩展性。这种适应性至关重要,因为机器人技术领域正在多元化,其应用范围从执行精度极高的手术机器人到展示复杂动作的微型机器人大象,甚至能够通过分析织物图像来编织衣服的机器人。

除了简化培训和降低成本的直接好处外,这项研究还与人工智能和机器学习领域的更广泛趋势保持一致。像麻省理工学院 CSAIL 的 AI 驱动的模拟器 LucidSim 等系统的开发展示了生成合成数据以加速机器人学习的能力。通过在模拟环境中训练机器人,研究人员可以克服真实世界数据收集的局限性,并使机器人能够以最小的微调将技能转移到物理世界。这种方法呼应了大型语言模型(LLM)的进展,LLM 通过在海量数据集上进行预训练,使人工智能系统能够执行各种任务,而只需有限的特定任务训练。关于机器人技术是否正处于其自身的“ChatGPT 时刻”——一个快速且变革性进步的时期——的问题正在被越来越多地讨论,麻省理工学院的工作无疑是朝着这个方向迈出的重要一步。正如麻省理工学院最近的创新所证明的那样,开发允许任何人训练机器人的工具进一步实现了该领域的民主化,并开启了以前无法想象的人机协作的可能性。甚至对机器人自修复等概念的考虑,虽然看似未来主义,但突显了对创新解决方案的持续探索,以增强机器人的弹性和自主性。

麻省理工学院在人工智能驱动的机器人学习方面取得的最新进展代表了机器人技术领域的一场范式转变。通过使机器人能够通过视觉学习,而无需依赖广泛的传感器数据或人工干预,这项技术有望开启一个新时代,即适应性强、易于使用且智能的机器。其影响是深远的,影响了从制造业和医疗保健到物流甚至日常生活的各个行业。随着研究继续突破可能的界限,机器人技术的未来看起来越来越有希望,这得益于人工智能的力量以及机器人可以无缝集成并增强我们生活的愿景。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注