重庆理工大学学报2023,Vol.37Issue(21) :205-212.DOI:10.3969/j.issn.1674-8425(z).2023.11.021

面向计算机科学领域的专业实体识别

Professional entity recognition for computer science

陈祥 张仰森 李尚美 胡昌秀 成琪昊
重庆理工大学学报2023,Vol.37Issue(21) :205-212.DOI:10.3969/j.issn.1674-8425(z).2023.11.021

面向计算机科学领域的专业实体识别

Professional entity recognition for computer science

陈祥 1张仰森 2李尚美 1胡昌秀 1成琪昊1
扫码查看

作者信息

  • 1. 北京信息科技大学 智能信息处理研究所,北京 100101
  • 2. 北京信息科技大学 智能信息处理研究所,北京 100101;国家经济安全预警工程北京实验室,北京 100044
  • 折叠

摘要

为获取科研学术论文中涉及的专家研究领域等专业实体信息,给学术论文或科技项目评审专家的推荐提供理论参考,面向计算机科学领域,提出了一种基于RoBERTa-wwm的实体识别模型对专家学术论文中包含的专业实体进行识别.首先,以已有的专家基本信息数据表为参照,利用中国知网高级检索功能和爬虫技术获取表中列举专家的学术论文摘要数据;接着,将摘要数据经人工标注后,通过RoBERTa-wwm预训练模型获取具有语义特征的字符向量作为下游模型的输入;最后,将上游的语义字符向量输入BiLSTM-CRF模型中实现对文本中的专业实体识别.通过实验验证,提出的模型在自主标注的数据集中取得了更好的效果.其中,模型F1 值达到了89.94%,高于实验中的对比模型,具有良好的识别专业实体的能力.

关键词

专业实体识别/RoBERTa-wwm/专家研究领域/计算机科学

Key words

professional entity identification/RoBERTa-wwm/expert research field/computer sci-ence

引用本文复制引用

基金项目

国家自然科学基金(62176023)

出版年

2023
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
参考文献量13
段落导航相关论文