情报学报2024,Vol.43Issue(1) :34-47.DOI:10.3772/j.issn.1000-0135.2024.01.004

基于语义相似关系的学科交叉主题识别方法

Interdisciplinary Topic Identification Method Based on Semantic Similarity Relationship

王卫军 宁致远 董昊 乔子越 杜一 周园春
情报学报2024,Vol.43Issue(1) :34-47.DOI:10.3772/j.issn.1000-0135.2024.01.004

基于语义相似关系的学科交叉主题识别方法

Interdisciplinary Topic Identification Method Based on Semantic Similarity Relationship

王卫军 1宁致远 2董昊 2乔子越 2杜一 2周园春2
扫码查看

作者信息

  • 1. 河南财经政法大学图书馆,郑州 450046;中国科学院计算机网络信息中心,北京 100190;中国科学院大学,北京 100049
  • 2. 中国科学院计算机网络信息中心,北京 100190;中国科学院大学,北京 100049
  • 折叠

摘要

识别不同学科间共有的研究内容是学科交叉知识发现的一种研究思路.学科间具有相似语义的研究内容,能够更好地体现学科之间知识的融合、交流现象.针对从科技文献数据中获取语义相似学科交叉研究主题的问题,本文提出了一种基于无监督对比学习的科技文献及关键词语义相似关系表示学习方法,构建了一种语义相似学科交叉主题识别模型.该模型将Spearman相关系数作为评价学科交叉主题的指标,解决了现有研究缺少学科交叉研究数据集的问题.研究结果表明,本文模型较好地获取了科技文献及其关键词之间的语义相似关系,能够较好地反映两个学科之间的交叉态势.

Abstract

Identifying the research content shared among different disciplines is the research idea of interdisciplinary knowledge discovery.Research content with similar semantics better reflects the integration and exchange of knowledge between disciplines.To address the problem of obtaining semantically similar interdisciplinary research topics from scien-tific and technical literature data,this study proposes an unsupervised contrastive learning method for semantic similarity relationship representation learning of scientific and technical literature and keywords,and then constructs a semantically similar interdisciplinary topic identification model.The model uses the Spearman correlation coefficient as an index for evaluating interdisciplinary topics,thus addressing the lack of interdisciplinary research datasets in current research.Exper-iments reveal that the model correctly captures the semantic similarity relationship between scientific and technical litera-ture and their keywords,and that the experimental results properly represent the intersection tendency between the two dis-ciplines.

关键词

科研项目/学科交叉主题/对比学习/表示学习

Key words

research projects/interdisciplinary topic/contrastive learning/representation learning

引用本文复制引用

基金项目

国家自然科学基金重点项目(61836013)

国家自然科学基金优秀青年科学基金项目(T2322027)

中国科学院青年创新促进会项目(2021166)

出版年

2024
情报学报
中国科学技术情报学会 中国科学技术信息研究所

情报学报

CSTPCDCSSCICSCDCHSSCD北大核心
影响因子:1.296
ISSN:1000-0135
参考文献量3
段落导航相关论文