首页期刊导航|中国科学数据(中英文网络版)
期刊信息/Journal information
中国科学数据(中英文网络版)
中国科学数据(中英文网络版)

2096-2223

中国科学数据(中英文网络版)/Journal China Scientific DataCSCDCSTPCD北大核心
正式出版
收录年代

    25份市售金银花代用茶的质量调查及活性成分分析数据集

    童凯代良丽黄书琴钟佳雪...
    347-355页
    查看更多>>摘要:为了进一步完善金银花代用茶的质量标准,本研究调查分析了 25份不同品牌市售金银花代用茶的质量相关特征。根据预包装食品标签通则对 25 份市售商品金银花代用茶的标签合规性进行检查,根据农业行业标准对金银花代用茶进行性状考察并评定等级。采用pH计测定样品pH值;采用紫外分光光度法测定样品总黄酮含量;采用高效液相色谱法测定绿原酸含量。利用SPSS、Excel等统计工具,分析数据之间的相关性和分布特征。根据 25 份市售金银花的调查检测,共计 361个检测结果。本数据集将为金银花代用茶国家标准的制定提供参考价值。

    金银花代用茶质量调查活性成分

    面向机器阅读理解的医学域数据集MedicalQA

    马宁吕文蓉郭泽晨
    356-365页
    查看更多>>摘要:机器阅读理解旨在利用算法让计算机理解段落语义并回答用户提出的问题,该任务所用数据集的质量可直接影响模型的实验结果。为丰富机器阅读理解的医学领域数据集,本文以爬虫和人工标注的方式构建了面向机器阅读理解的医学域数据集MedicalQA。本数据集以寻医问药网和 39健康网两大医疗平台为主要数据来源,包含 19502 个段落、问题和答案,内容涉及内科、外科、妇产科等 9 大科室。数据集形式为excel文件,由 5 列组成,第一列为段落ID,第二列为段落所属科室,第三列为段落内容,第四列为问题,第五列为问题对应答案。本数据集的构建,有利于机器阅读理解模型的鲁棒性研究以及医学问答系统的构建,也能促进机器阅读理解领域的医学数据集共享。

    机器阅读理解医学域数据集

    数据论文引用计量规律初探——基于中国数据期刊的案例研究

    张丽丽惠嘉怡刘瑞霖
    366-388页
    查看更多>>摘要:数据出版是一种创新数据共享形式。为更好地了解数据出版,本文通过文献综述和案例调研,构建了数据论文计量框架,遴选国内数据期刊《中国科学数据(中英文网络版)》和《全球变化数据学报(中英文)》,揭示两刊数据出版与数据共享情况。统计涵盖两刊论文指标(学科领域、团队规模、资金来源)、数据指标(数据来源、规格与规模、数据曝光)、引证指标(被引、施引、时间)等 30余个特征项。结果显示,宏观趋势方面,数据出版成为数据共享的重要途径,并在规范数据质量、汇聚特色主题数据、推进团队合作、争取资金支持等方面具有优势。中观运营层面,国家数据中心为数据出版提供平台保障。微观资源层面,出版数据集兼具学科差异性和跨域共性治理需求。其中,数据曝光、访问引用转化率等指标,为数据可复用性测度提供线索。此外,独立数据出版在我国尚处发展上升期,建议加强数据文化建设、扩展运营模式、提升资源治理能力与平台建设水平,完善技术迭代与激励评价机制等。

    开放数据数据论文数据出版数据重用数据引用引用计量