基于自然语言交互的机器人任务理解与指令生成方法研究

黄颖怡¹

扫码查看

作者信息

1. 桂林理工大学
折叠

摘要

机器人语音交互可以将自然语言描述的开放式任务转换为机器人能够理解的结构化任务表示，以便机器人能够更直观地理解人类的意图和需求。如何让机器人更高效、准确地处理人类自然语言并执行相应动作，实现机器人更高级别的自主决策和执行能力成为当下研究的热点。当前，在机器人研究领域，有关自然语言处理的研究多以英文为主，指令识别准确率高、数据集丰富，已具备良好效果。相较于英文，中文语言结构多样、逻辑关系复杂，且面向中文语言处理的研究起步较晚，使得人机交互过程中信息传递不够准确，无法满足非专业用户灵活制定机器人任务的需求。因此，本文针对机器人中文指令解析效率低、准确率不足的问题，重点研究了自然语言交互的机器人任务理解与指令生成方法，对机器人中文指令语句进行三元组关键信息关系抽取，用基于语义相似度的方法对机器人指令信息进行映射，通过搭建机器人抓取任务平台、设计软件系统架构对机器人任务理解与指令生成方法进行了验证，具体工作如下：首先，针对指令解析过程中复杂指令关键信息提取困难的问题，提出一种基于参数共享的联合机器人中文指令关系抽取的方法。该方法基于CASREL构建融合选择性自注意力机制的SSANs-CASREL模型。SSANs-CASREL模型解决了关系抽取过程存在的实体重叠问题，又因选择性自注意力机制的加入，解决了主实体信息待强化的问题。在自建中文机器人指令数据集上的实验结果表明，SSANs-CASREL模型在机器人进行中文指令三元组抽取任务时的F1值可达91.63%，相较于未加入选择性自注意力机制的模型提升了4.59个百分点，相较于仅加入自注意力机制的模型提升了0.81个百分点。其次，为了让机器人更准确、高效地理解用户指令意图，本文在预先设定动作集的哈希表规则映射下引入词语相似度计算。通过融合知网和同义词词林知识库的方法，根据词语所存在知识库的不同，调整知网和同义词词林指令集的计算权重，并在经典词语相似度算法评估数据集MC30上进行测试。最后利用加入同义词实体信息的三元组数据集进行指令映射准确率测试。最后，为了进一步验证本文研究内容的准确率和使用价值，把指令解析和计算机视觉的相关内容结合，在真实环境下进行机器人抓取实验。本文基于RGB-D相机、UR5机械臂、Robotiq2F-140二指夹持器在ROS系统内进行实验。通过分析机器人关键信息提取、指令映射结合的指令解析情况和实际抓取情况表明，本文提出的中文指令解析方法具有合理性和可行性。

关键词

机器人/任务理解/指令生成/自然语言交互

引用本文复制引用

授予学位

硕士

学科专业

机械

导师

张秋菊/苏高峰

学位年度

2024

学位授予单位

江南大学

语种

中文

中图分类号

段落导航