信息技术2024,Issue(5) :22-29,37.DOI:10.13274/j.cnki.hdzj.2024.05.004

基于ALBERT-Seq2Seq模型的多标签农业文本分类方法

Multi-label classification for agricultural text based on ALBERT-Seq2Seq model

香慧敏 李东亚 白涛
信息技术2024,Issue(5) :22-29,37.DOI:10.13274/j.cnki.hdzj.2024.05.004

基于ALBERT-Seq2Seq模型的多标签农业文本分类方法

Multi-label classification for agricultural text based on ALBERT-Seq2Seq model

香慧敏 1李东亚 1白涛2
扫码查看

作者信息

  • 1. 新疆农业大学计算机与信息工程学院,乌鲁木齐 830052
  • 2. 新疆农业大学计算机与信息工程学院,乌鲁木齐 830052;新疆农业信息化工程技术研究中心,乌鲁木齐 830052
  • 折叠

摘要

针对多标签分类采用现有静态词向量模型无法捕获文本完整语义的问题,文中结合AL-BERT 与序列到序列模型,提出一种用于农业文本多标签分类的神经网络模型ALBERT-Seq2Seq.该模型采用ALBERT预训练语言模型动态获取农业文本语义信息,利用其内部多层双向Transformer架构挖掘农业文本信息的深层特征,接着引入Seq2Seq模型构造出多标签分类器并进行训练.在AGRI-ML2020农业文本多标签数据集上进行算法性能测试,实验结果表明,该模型分类F1值达89.5%,能够有效提升农业文本多标签分类效果.

Abstract

To solve the problem that the existing static word vector model cannot capture the complete se-mantics of text for multi-label classification,a neural network model ALBERT-Seq2Seq for agricultural text multi-label classification is proposed in this paper by combining ALBERT with sequence-to-sequence mod-el.The model uses ALBERT pre-training language model to dynamically acquire agricultural text semantics information,uses its internal multi-layer bidirectional Transformer architecture to mine the deep features of agricultural text information,and then constructs a multi-label classifier by introducing Seq2Seq model and trains it.The algorithm performance test on AGRI-ML2020 agricultural text multi-label data set shows that the F1 value of this model reaches 89.5%,which can effectively improve the effect of agricultural text multi-label classification.

关键词

自然语言处理/多标签分类/序列到序列模型/农业文本/深度学习

Key words

natural language processing/multi-label classification/sequence to sequence model/agricul-tural text/deep learning

引用本文复制引用

基金项目

新疆维吾尔自治区重点研发计划(2017B01006-1)

新疆维吾尔自治区高等学校基本科研业务费项目(XJE-DU2022J009)

出版年

2024
信息技术
黑龙江省信息技术学会 中国电子信息产业发展研究院 中国信息产业部电子信息中心

信息技术

CSTPCD
影响因子:0.413
ISSN:1009-2552
段落导航相关论文