未来的机器人共同工作互相学习

未来机器人样子_未来机器人_未来机器人作用/

通过“强化学习”,每个智能体都可以适应周围环境并与群体协作。 未来的分布式机器人可以互相学习、协同工作、共同完成复杂的任务。图片来自网络

未来机器人作用_未来机器人样子_未来机器人/

分布式代理(Agent)具有自主性、交互性、反应性和主动性。

据美国《连线》杂志网站近日报道,目前人工智能研究大多集中在个体代理(Agents,能够自主行动的软件或硬件实体),而人工智能系统一直以来都是作为个体来运作的。 ,但是这些个体agent无法组合成一个团队来学习和工作,也无法相互配合完成相应的任务。 麻省理工学院航空航天教授乔纳森·豪认为,这种工作模式失去了巨大的机会。 未来,机器人应该协同工作、互相学习。

在分布式计算领域,人们通常将分布式系统中连续自主运行、具有自主性、交互性、反应性、主动性的计算实体称为Agent。 例如,一辆在街上独自行驶的汽车,一个不断调整以适应周围环境变化的恒温器。

Howe领导的研究团队一直致力于改变“移动和人工智能设备协作和相互学习的方式”,希望通过人工智能的核心能力——机器学习,帮助智能物体让彼此变得更加聪明。

Howe 看到了未来,机器人可以互相学习并协同工作,从而改变物流(机器人完成订单并将其送货上门)和太空探索(机器人协作探索新领域)等行业。 真正的挑战是让这些人工智能机器人为实验室外的现实世界做好准备,这才是人工智能应该存在的地方。

单个机器人以团队形式工作

现实世界比人工智能机器人开发实验室环境复杂得多。 在团队合作中,人们会思考,对方在做什么? 怎样才能共同完成任务呢? 这项任务将如何改变? 等等。 这些问题在机器人团队工作时都会被“考虑”。

为了让机器人分组工作,豪的团队让机器人在周围环境中进行反复试验,像人类一样学习。 利用他们自己开发的新算法以及在机器人行业的经验,该团队对它们进行了优化,使用一种称为强化学习的机器学习技术来使它们适应周围的环境。

该团队甚至更进一步研究了当涉及“多代理”时会发生什么。 “多智能体”强化学习这一新兴学科提出了许多挑战,包括:如何让独立智能体在其他方面达成共识并达成一致? 当一个具有智能功能的机器人认为它知道正确的做事方式,但实际上是错误的时,会发生什么?

“如果我们对于什么时候去吃饭都有不同的想法,你们需要多少沟通才能达成一致?” 豪说道。 “这看起来是一个相对简单的问题,但在机器人系统中,我们有很多问题需要处理。通常这些问题存在很多不确定性。”

只有当一个可行的深度学习平台出现时,才有可能真正回答这些问题。 Howe 和他的团队使用由 Amazon EC2 GPU 实例支持的 AWS Deep Learning AMI 环境,该环境可以在云上执行非常复杂的计算,而无需管理机架和服务器。 他们的最终目标是快速、准确地训练和运行强化学习模型,确保机器人能够处理现实世界行为的影响。 例如,当机器人意见不一致时,它们之间不断的聊天不会淹没网络。

复杂计算需要云平台

在智能机器人共同学习的理想生态系统中,整体大于部分之和,这需要大量的技术努力才能实现。

在 Amazon Web Services (AWS)、波音和 IBM 的联合资助下,Howe 的团队一段时间以来一直在进行深入研究,研究如何使用足够的计算能力来运行复杂的强化学习算法,以保持一群机器人不断地进行通信和在线。 调整他们的行为。 新的强化学习系统被称为分层多智能体教学,通过优化的奖励功能和更有效的沟通,成功提高了机器人团队范围内的学习和协作解决问题的能力。 借助基于云的服务,团队的每个成员都可以访问所需的计算能力。

“在这种基于模拟的训练中,我们正在测试数百种设置,速度至关重要。” 郝教授的硕士生金东吉(音译)说道。 “机器学习直接转化为我们在更短的时间内进行训练的能力。” 能够在机器内运行更多迭代。 AWS提供了强大的GPU实例,大大缩短了训练时间,加快了我们的研究步伐。”

Howe 认为这项研究的商业化需要 5 到 10 年的时间,但它可能成为未来人工智能应用的基本推动者。 他说,协作型、有弹性的机器人的用途几乎是无限的。 (于浩源)