基于混合深度学习的多模态场景指令分类方法

MULTI-MODAL SCENE INSTRUCTION CLASSIFICATION METHOD BASED ON HYBRID DEEP LEARNING

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：为提高家庭服务机器人指令中目标对象预测的准确率,提出一种基于混合深度学习的多模态自然语言理处理(Natural Language Processing,NLP)指令分类方法.该方法从语言特征、视觉特征和关系特征多模态入手,采用两种深度学习方法分别以多模态特征进行编码.对于语言指令,采用多层双向长短期记忆(Bi-LSTM)进行子词嵌入和编码;对于非语言场景,使用卷积神经网络进行编码.最终得到每个目标-源对可能性的区域范围.实验结果表明,该方法能够提高机器人接收指令任务中目标对象预测的准确率且性能优于现有其他方法.

作者：

吴桂玲

展开 >

作者单位：

信阳农林学院信息工程学院河南信阳 464000

关键词：

深度学习自然语言处理多模态双向LSTM 生成式对抗网络

基金：

河南省科技攻关计划

项目编号：

182102210533

出版年：

2022

DOI：

10.3969/j.issn.1000-386x.2022.01.026

计算机应用与软件

上海市计算技术研究所上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心

影响因子：0.615

ISSN：1000-386X

年,卷(期)：2022.39(1)

参考文献量1