首页|基于ALBERT-Seq2Seq模型的多标签农业文本分类方法

基于ALBERT-Seq2Seq模型的多标签农业文本分类方法

扫码查看
针对多标签分类采用现有静态词向量模型无法捕获文本完整语义的问题,文中结合AL-BERT 与序列到序列模型,提出一种用于农业文本多标签分类的神经网络模型ALBERT-Seq2Seq.该模型采用ALBERT预训练语言模型动态获取农业文本语义信息,利用其内部多层双向Transformer架构挖掘农业文本信息的深层特征,接着引入Seq2Seq模型构造出多标签分类器并进行训练.在AGRI-ML2020农业文本多标签数据集上进行算法性能测试,实验结果表明,该模型分类F1值达89.5%,能够有效提升农业文本多标签分类效果.
Multi-label classification for agricultural text based on ALBERT-Seq2Seq model
To solve the problem that the existing static word vector model cannot capture the complete se-mantics of text for multi-label classification,a neural network model ALBERT-Seq2Seq for agricultural text multi-label classification is proposed in this paper by combining ALBERT with sequence-to-sequence mod-el.The model uses ALBERT pre-training language model to dynamically acquire agricultural text semantics information,uses its internal multi-layer bidirectional Transformer architecture to mine the deep features of agricultural text information,and then constructs a multi-label classifier by introducing Seq2Seq model and trains it.The algorithm performance test on AGRI-ML2020 agricultural text multi-label data set shows that the F1 value of this model reaches 89.5%,which can effectively improve the effect of agricultural text multi-label classification.

natural language processingmulti-label classificationsequence to sequence modelagricul-tural textdeep learning

香慧敏、李东亚、白涛

展开 >

新疆农业大学计算机与信息工程学院,乌鲁木齐 830052

新疆农业信息化工程技术研究中心,乌鲁木齐 830052

自然语言处理 多标签分类 序列到序列模型 农业文本 深度学习

新疆维吾尔自治区重点研发计划新疆维吾尔自治区高等学校基本科研业务费项目

2017B01006-1XJE-DU2022J009

2024

信息技术
黑龙江省信息技术学会 中国电子信息产业发展研究院 中国信息产业部电子信息中心

信息技术

CSTPCD
影响因子:0.413
ISSN:1009-2552
年,卷(期):2024.(5)