面向协作机器人的安全、可组合和分布式强化学习的形式化方法
赞助单位:美国国家科学基金会(NSF)
奖励编号:IIS-2024606
PI: Calin Belta
文摘:许多应用程序需要不同类型的机器人团队相互协作,并与人类协作来完成复杂的任务。例如,考虑一个未来的机器人餐厅,其目标是制作热狗,并将它们与饮料一起提供给即将到来的顾客。几个机器人操纵者有传感器和执行器,允许他们操纵和烤热狗,把它们放在面包里,并添加香料。另一个机器人有一个抓手,可以拿杯子和倒饮料。移动轮式机器人可以在餐厅周围移动,向顾客打招呼,然后为他们提供热狗和饮料。一名人类主管向机器人团队提供高级任务规范,以及一些有用的事实,然后观察团队的工作。如果出现问题,或者机器人无法有效协调,主管可以进行干预并给出更多指示。许多其他应用领域都有类似的场景,包括农业、军事监视、搜索和救援。本项目提出了一种解决此类问题的方法,该方法利用机器人的操纵和合作能力,允许丰富的任务规范和与人类的交互,同时确保整体操作的安全性。该澳门威尼斯人注册网站研究计划与教育和推广计划相结合,该计划包括为本科生和高中生提供丰富的机器人相关活动。
提出的技术方法汇集了机器(强化)学习、形式化方法和最优控制的工具。将开发一种丰富的、易于理解的时态逻辑规范语言来形式化需求,例如上面的例子中的需求,并指定先验知识。计算框架的核心是一个度量规范满意度的度量,它将用于指导学习过程。这一指标将与控制屏障功能相结合,以确保安全。提出的方法是组合的——新任务的策略将从一个学习过的策略库中构建,几乎没有额外的探索。
欲了解更多信息,请点击这里。