西安文理学院学报(自然科学版)2021,Vol.24Issue(4) :114-122.

中文期刊论文数据治理工作实践——以挖掘中国知网题录及PDF文档为例

Practice of Data Governance of Chinese Journal Papers ——Take the Mining of CNKI Bibliographical References and PDF Documents as An Example

朱玉强 范翠丽
西安文理学院学报(自然科学版)2021,Vol.24Issue(4) :114-122.

中文期刊论文数据治理工作实践——以挖掘中国知网题录及PDF文档为例

Practice of Data Governance of Chinese Journal Papers ——Take the Mining of CNKI Bibliographical References and PDF Documents as An Example

朱玉强 1范翠丽2
扫码查看

作者信息

  • 1. 山东师范大学 图书馆,济南250014
  • 2. 山东科学技术出版社,济南250002
  • 折叠

摘要

为探讨数据治理工作在既定规范下取得相同或相近质量成果的可能性,尝试提升数据治理手段和工具的智能化与自动化,以某高等学校在中文期刊发表论文数据治理工作实践为例,使用Python编写程序自动挖掘从中国知网下载的题录及PDF文档内容,实现署名作者身份甄别、业绩点核算、文章所属期刊被各类评价体系收录情况统计等工作.结果表明,所编写程序自动化程度高,基本达到预期效果,在数据治理工作尚无成熟统一的大平台支撑背景下,编写个性化数据治理工具大有可为.

关键词

数据治理/文本挖掘/Python

引用本文复制引用

出版年

2021
西安文理学院学报(自然科学版)
西安文理学院

西安文理学院学报(自然科学版)

影响因子:0.209
ISSN:1008-5564
参考文献量8
段落导航相关论文