首页|基于语步识别的科技文献结构化自动综合工具构建

基于语步识别的科技文献结构化自动综合工具构建

扫码查看
[目的]借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点.[方法]提出了一种基于语步识别的科技文献结构化自动综合工具的建设思路,即通过语步识别与研究问题、研究方法、研究进展短语抽取,自动揭示单篇文献中的关键知识内容;通过层次聚类与类簇标签生成,实现多篇文献的知识整理归纳;通过设计树形综合结构,指导结构化综合结果输出.[结果]研发了结构化自动综合工具,能够自动综合文献集内容,并按照"研究问题-研究方法-研究进展"的树形结构揭示文献集的研究脉络与骨架.[局限]由于聚类技术的限制,目前还存在聚类准确率不足、聚类簇个数难以确定等问题,影响了自动综合效果.[结论]基于语步识别技术,构建面向实际应用的结构化自动综合工具,支持文献检索、自动综合、结果循证等功能,验证了基于语步识别实现结构化自动综合思路的可行性和有效性.
Constructing Automatic Structured Synthesis Tool for Sci-Tech Literature Based on Move Recognition
[Objective]This paper utilizes Al technology to construct an automatic structured synthesis tool,which organizes the sci-tech research frameworks structurally and reveals their main points.[Methods]The new tool was developed based on move recognition.First,we identified the research questions,methodology,and progress keywords to extract the most important knowledge points from each literature.Then,we employed hierarchical clustering and cluster label generation methods to synthesize the knowledge.Third,we designed a tree structure for the synthesis outputs.[Results]The proposed tool could automatically synthesize the literature contents and reveal their framework with a"research question,methodology,and progress"tree structure.[Limitations]Insufficient clustering accuracy and difficulty determining cluster numbers reduce our model's synthesis performance.[Conclusions]The synthesis tool based on move recognition could automatically retrieve structured literature contents.

Scientific and Technological LiteratureMove RecognitionAutomatic Structured SynthesisPhrase ExtractionHierarchical ClusteringLabel Generation

刘熠、张智雄、王宇飞、李雪思

展开 >

中国科学院文献情报中心 北京 100190

中国科学院大学经济与管理学院信息资源管理系 北京 100190

科技文献 语步识别 结构化自动综合 短语抽取 层次聚类 类簇标签生成

中国科学院特别研究助理资助项目国家科技图书文献中心(NSTL)专项

E1290905E1290905

2024

数据分析与知识发现
中国科学院文献情报中心

数据分析与知识发现

CSTPCDCSSCICHSSCD北大核心EI
影响因子:1.452
ISSN:2096-3467
年,卷(期):2024.8(2)
  • 19