首页|基于字句动态特征和自注意力的情感分析方法

基于字句动态特征和自注意力的情感分析方法

扫码查看
针对评论情感分析任务中文本长度失衡引起的特征稀疏、特征缺失和提取信息不全等问题,提出了一种基于字句动态特征和自注意力的情感分析方法.首先基于预训练模型对评论进行动态特征编码,使用句向量对不足固定长度的部分进行补全,并表征超出的截断部分,以缓解批训练下文本尺寸失衡引起的特征稀疏和特征缺失问题.然后使用基于自注意力机制的特征重组方法动态整合字句融合特征,并优化权重参数以降低计算和训练时间复杂度.最后在开源数据集上分别进行了消融实验和对比实验.测试结果表明,本文方法在准确率上有较优的改进效果.
Emotional Analysis Approach Based on Dynamic Word-Sentence Features and Self-attention
Traditional models suffer from feature sparsity,feature loss and incomplete comment feature extraction problems due to the imbalance of comment length.This paper proposes an emotional analysis approach based on dynamic word-sentence features and self-attention(DWSF-SA),to alleviate the incomplete extraction problem caused by the imbalance of text size under batch training.DWSF-SA first follows pre-training on dynamic feature embedding,then employs sentence vectors to complete the less parts and represents the truncated parts by fixed length.Moreover,DWSF-SA also introduces a self-attention mechanism to dynamically integrate the word-sentence fusion features,and makes optimization on the weight parameters to accelerate the computation and training.The ablation and comparison experiments on publicly available datasets demonstrate that the proposed DWSF-SA outperforms traditional approaches in accuracy metrics.

emotional analysisfeature embeddingpre-training modelself-attention mechanismweight parameters

刘强、朱金森、赵龙龙、沙宇晨、刘尚东、季一木

展开 >

南京邮电大学计算机学院,南京 210023

南京邮电大学高性能计算与大数据处理研究所,南京 210023

情感分析 特征编码 预训练模型 自注意力机制 权重参数

国家重点研发计划专项国家重点研发计划专项江苏省自然科学及高校自然科学重大项目江苏省自然科学及高校自然科学重大项目江苏省创新创业人才项目江苏博士后基金江苏省六大人才高峰项目江苏省博士后研究实践创新项目江苏省博士后研究实践创新项目之江实验室开放项目教育部人文社会科学基金青年项目南京邮电大学人才启动基金

2018AAA01033002018AAA0103302BK2017090020KJA5200012019K024JY02KYCX19_0921KYCX19_09062021KF0AB0520YJC880104NY219132

2024

数据采集与处理
中国电子学会 中国仪器仪表学会信号处理学会 中国仪器仪表学会中国物理学会微弱信号检测学会 南京航空航天大学

数据采集与处理

CSTPCD北大核心
影响因子:0.679
ISSN:1004-9037
年,卷(期):2024.39(1)
  • 12