摘要
针对CNN应用于文本分类任务中,存在固定大小的卷积核会限制复杂语言结构特征的提取,以及CNN在最大值池化时会丢失大量特征信息这两类问题,引入胶囊网络替代CNN提取文本特征,根据Sabour等人提出的动态路由算法作为胶囊网络内部的传播原理,并将其与LSTM连接形成融合神经网络模型,并与文本分类任务中常用的CNN,LSTM,LSTM连接CNN三个基线模型进行比较.实验结果表明,胶囊网络相较于使用卷积核的CNN能够不受特征检测器结构和大小的限制,更加灵活地学习文本整体与部分的内在空间关系;不仅能够检测固定的文本特征,而且能够检测特征的变体及其可能性.LSTM连接胶囊网络的模型能有效提升文本分类的F1值,达到0.932,相比其他基线模型拥有最佳性能.
基金项目
国家自然科学基金(61802155)
国家社会科学基金(13BTQ046)
江苏高校哲学社会科学研究重点项目(2018SJZDI142)
江苏省高等学校大学生创新创业训练计划项目(201910329008Z)
江苏警官学院科学研究项目(2017SJYZQ01)