首页|基于ERNIE和DPCNN的科技文献摘要结构要素识别

基于ERNIE和DPCNN的科技文献摘要结构要素识别

扫码查看
[目的]构建一种高效的科技文献摘要结构要素识别模型,实现对一段式摘要的结构要素识别.[方法]以知识增强语义表示模型(ERNIE)对科技文献的摘要文本进行表征,通过深度金字塔卷积神经网络(DPCNN)进行文本特征抽取,构建科技文献摘要结构要素识别模型.[结果]所构建的模型在图书情报领域数据集上识别文献摘要结构要素的精确率、召回率、F1宏平均值均高于0.95,比基准模型具有更好的识别性能.[局限]使用的语料具有一定的领域倾向,模型的领域通用性还有待验证.[结论]构建的模型可以更好地对文本特征进行抽取,有效提升了科技文献摘要结构要素的识别性能.
Identifying Structural Elements of Scholarly Abstracts with ERNIE-DPCNN
[Objective]This paper proposes an effective model to extract key elements from unstructured abstracts of academic literature automatically.[Methods]First,we used the ERNIE model to represent the abstracts.Then,we utilized the DPCNN to extract semantic features.Finally,we built the identification model.[Results]We evaluated the proposed model using a library and information science dataset.The precision,recall,and Fl-score values were all above 0.95,which outperformed benchmark models.[Limitations]Since the corpus used in this study is from a specific domain,more research is needed to assess the model's performance in other fields.[Conclusions]The proposed model can represent the abstract more comprehensively,improving the structural elements'identification performance from unstructured abstracts.

Structural Element Identification of AbstractsText RepresentationERNIEDPCNN

胡忠义、税典程、吴江

展开 >

武汉大学信息管理学院 武汉 430072

武汉大学电子商务研究与发展中心 武汉 430072

摘要结构要素识别 文本表征 ERNIE DPCNN

教育部哲学社会科学研究重大课题攻关项目

20JZD024

2024

数据分析与知识发现
中国科学院文献情报中心

数据分析与知识发现

CSTPCDCSSCICHSSCD北大核心EI
影响因子:1.452
ISSN:2096-3467
年,卷(期):2024.8(1)
  • 22