首页期刊导航|数据分析与知识发现
期刊信息/Journal information
数据分析与知识发现
数据分析与知识发现

张晓林

月刊

2096-3467

jishu@mail.las.ac.cn

010-82626611

100190

北京中关村北四环西路33号

数据分析与知识发现/Journal Data Analysis and Knowledge DiscoveryCSSCICHSSCDCSCD北大核心CSTPCD
查看更多>>本刊是中国科学院主管、中国科学院文献情报中心主办的学术性、计算机信息管理技术专业刊物,它集图书馆界、情报界、各种现代技术的应用和情报信息服务工作导向于一身,面向情报信息界、图书馆界和档案界,技术导向强、信息量大、内容丰富,是国内唯一一份被中国图书馆学会和中国科技情报学会共同推荐的专业技术类中文核心期刊,并被中国科学院授予“优秀期刊”。
正式出版
收录年代

    基于开源情报的军事知识图谱问答智能服务研究

    范俊杰马海群刘兴丽
    118-127页
    查看更多>>摘要:[目的]基于开源情报构建一种军事知识图谱的检索式问答服务系统.[方法]将RoBERTa预训练模型和数据增强技术相结合,解决低资源的军事问答中问句分类和命名实体识别问题,并结合军事领域实体特点提出三维特征的实体链接方法.接着,采用RoBERTa预训练模型和依存句法分析方法,解决简单意图和部分复杂意图问题的关系匹配问题.最终,应用启发式规则完成答案的提取.[结果]问句分类与实体识别F值分别为99.62%、98.35%,关系抽取准确率达到99.72%,问答系统应用评测平均准确率达到91.70%.[局限]本问答系统的军事知识图谱存在自动扩展效率低下的问题,因此,影响了问答服务质量.[结论]本研究实现了一种具备高可解释性和高准确率的军事知识问答智能服务.

    军事知识图谱问答智能服务开源情报RoBERTa

    多视角提供数字产品预测可靠性的推荐策略研究——基于直觉模糊集的自然噪声检测机制

    邓江洲伍奇王河洺杜茂康...
    128-136页
    查看更多>>摘要:[目的]考虑原始评分信息的准确性及其预测结果的可靠性,以提升推荐系统的准确性.[方法]从信息输入和输出两方面,设计三种方案为已有推荐算法的预测结果提供可靠性概率.在信息输入方面,借助直觉模糊集理论,提出模糊自然噪声检测机制识别和修正有误评分;在信息输出方面,分别采用二次模糊噪声检测、矩阵分解和深度神经网络获得待预测位置的可靠性概率,并根据设定的可靠性判别条件,识别出不可信的预测评分并对其修正.[结果]在两个公开数据集上的实验结果显示,与原始推荐算法相比,引入所提模糊自然噪声检测方法和三种可靠性方案后的相应方法在F1值和NDCG评估指标上分别最高提升了 6.4%和7.2%.[局限]所设计的可信推荐策略不适用于只包含隐式反馈的数据集.[结论]从评估信息可靠性的视角,为提升推荐算法的性能提供了新的解决方案.

    直觉模糊集自然噪声可靠性机器学习推荐系统

    基于链路预测与多维指标的企业技术机会发现方法研究

    张彪陈云伟董坤
    137-148页
    查看更多>>摘要:[目的]从技术融合角度出发,综合采用链路预测、指标评价方法识别企业技术机会,为企业进行战略性研发布局提供参考.[方法]基于目标企业专利数据构建知识元素共现网络,采用链路预测方法识别潜在知识组合,从企业内部技术禀赋、外部创新环境两个角度创建多维指标,评价潜在知识组合的可行性,进而构建潜在知识组合分布图,识别企业技术机会.[结果]采用6种机器学习算法构建链路预测模型,准确率最高达到0.810.不仅为目标企业精准识别到10项技术机会,更呈现了技术描述与功能模块的对应关系.[局限]仅关注以IPC对形式呈现的知识组合,对于多个IPC形式的知识组合有待进一步探索.[结论]结合链路预测方法与多维指标评价方法,能够更精准、细粒度地识别企业技术机会.

    企业技术机会链路预测内部技术禀赋外部创新环境

    全球碳中和战略行动政策量化评价与前沿发展趋势研究

    汤匀李岚春岳芳胡何欣...
    149-163页
    查看更多>>摘要:[目的]通过科学量化评价主要发达国家/地区碳中和战略行动政策,推动我国碳达峰碳中和政策的制定与工作部署.[方法]深度挖掘全球主要发达国家/地区碳中和战略行动政策,优化政策量化PMC指数模型,并以Web of Science核心数据库为文献来源考察碳中和相关技术演化路径,探讨全球碳中和战略行动特点与发展趋势.[结果]日本在2021年更新颁布的《2050碳中和绿色增长战略》内容制定最为全面.碳中和领域相关学科和技术发展趋势具有交叉性和多边合作性.中国科学院和清华大学是全球碳中和领域机构合作网络关键枢纽.[局限]研究方法属于传统技术优化手段,研究对象仅针对部分国家/地区.[结论]制定碳中和战略行动政策时需从国家层面出发,联合尽可能多的领域机构参与研讨,充分利用新兴科研技术,加强全球人才交流与合作,有力支撑能源清洁转型,加快实现"双碳"目标.

    碳中和战略行动政策量化评价前沿主题分析文本挖掘PMC指数模型

    博士学位论文综合质量等级识别方法及有效性验证

    彭笑菊曲建升
    164-175页
    查看更多>>摘要:[目的]探索全面综合评价博士学位论文质量等级的新方法.[方法]将数据包络分析方法应用于博士学位论文综合质量评价,与常规总评分分级方法相比较,探讨是否能得到更为准确、合理、全面的评价结果.[结果]基于数据包络分析的等级划分是全面评价博士学位论文质量的有效方法,能够识别总评分相似样本的综合质量差异;相较于总评分评级,数据包络分析更能包容学位论文质量表现的多样性,而非仅依据分值高低判断论文质量优劣.研究以抽检"不合格论文"和"优秀博士论文"为标志样本进行有效性验证.[局限]该分析方法必须基于标准规范的专家评阅分数,虽能确定学位论文综合质量等级,但无法给出学位论文质量"及格线"."及格线"必须由学科领域专家参与评价后确定.[结论]与随机抽检的方法不同,数据包络分析具有快速、准确、灵敏的性能特点,在博士教育评价实践中具有实际应用价值.

    科研评价数据包络分析学位论文博士培养质量

    《数据分析与知识发现》期刊征文

    176页