计算机工程与设计2024,Vol.45Issue(10) :3074-3080.DOI:10.16208/j.issn1000-7024.2024.10.025

基于标签注意力与多粒度网络的层级专利分类

Hierarchical patent classification based on label attention and multi-granularity network

廖列法 张燕琴
计算机工程与设计2024,Vol.45Issue(10) :3074-3080.DOI:10.16208/j.issn1000-7024.2024.10.025

基于标签注意力与多粒度网络的层级专利分类

Hierarchical patent classification based on label attention and multi-granularity network

廖列法 1张燕琴2
扫码查看

作者信息

  • 1. 江西理工大学信息工程学院,江西赣州 341000;江西现代职业技术学院 院长办公室,江西 南昌 330095
  • 2. 江西理工大学信息工程学院,江西赣州 341000
  • 折叠

摘要

针对中文专利的多层级自动分类任务中不同层级之间标签丰富语义信息及依赖关系和不同粒度大小的特征信息被忽略问题,提出一种RoBERTa-ALMG模型.通过RoBERTa预训练模型获取专利文本的高级语义表征,在标签注意力模块中借助双重多层感知机和注意力机制动态生成标签文本向量表示,通过前向传播过程实现不同层级之间的知识传递与信息共享,借助多粒度特征抽取模块捕捉层级之间的不同粒度特征和信息.在国家信息中心公布的数据集上的实验结果表明,该模型的表现优于其它模型.

Abstract

In the multi-hierarchy automatic classification task of Chinese patents,the rich semantic information,dependencies of labels and the feature information of different granularities between hierarchies are ignored,and the RoBERTa-ALMG model was proposed.The advanced semantic representation of the patent text was obtained through RoBERTa pre-training model,and the label text vector representation was dynamically generated with the help of dual multilayer perceptron and attention mechanisms in the label attention module.Knowledge transfer and information sharing between different hierarchies were realized through the forward propagation process.Different granularity features and information between hierarchies were captured using the multi-granularity feature extraction module.Experimental results of the dataset published by the National Information Center show that the model outperforms other models.

关键词

专利分类/层级分类/预训练模型/标签注意力/多粒度特征抽取/特征信息/信息共享

Key words

patent classification/hierarchical classification/pre-training model/label attention/multi-granularity feature extrac-tion/feature information/information sharing

引用本文复制引用

基金项目

国家自然科学基金项目(71462018)

国家自然科学基金项目(71761018)

出版年

2024
计算机工程与设计
中国航天科工集团二院706所

计算机工程与设计

CSTPCD北大核心
影响因子:0.617
ISSN:1000-7024
段落导航相关论文