首页期刊导航|数据分析与知识发现
期刊信息/Journal information
数据分析与知识发现
数据分析与知识发现

张晓林

月刊

2096-3467

jishu@mail.las.ac.cn

010-82626611

100190

北京中关村北四环西路33号

数据分析与知识发现/Journal Data Analysis and Knowledge DiscoveryCSSCICHSSCDCSCD北大核心CSTPCD
查看更多>>本刊是中国科学院主管、中国科学院文献情报中心主办的学术性、计算机信息管理技术专业刊物,它集图书馆界、情报界、各种现代技术的应用和情报信息服务工作导向于一身,面向情报信息界、图书馆界和档案界,技术导向强、信息量大、内容丰富,是国内唯一一份被中国图书馆学会和中国科技情报学会共同推荐的专业技术类中文核心期刊,并被中国科学院授予“优秀期刊”。
正式出版
收录年代

    研究发现给复杂产品增加拟人化的宣传能促进产品销售

    本刊讯
    97页

    增加类簇级对比的SCCL文本深度聚类方法研究

    李婕张智雄王宇飞
    98-109页
    查看更多>>摘要:[目的]改进SCCL模型在文本深度聚类任务上的效果,提出一种新的基于SCCL的文本深度聚类模型ISCCL.[方法]ISCCL模型基于句向量预训练语言模型对输入文本进行数据增强和编码获取两组增强表征,在SCCL模型的基础上增加两层非线性网络,将增强表征降维到维度与聚类数量相同的类簇特征空间.从列空间的角度构造正负簇对进行对比学习,引导模型挖掘对聚类任务有用的特征,并减少假正样本产生的影响.[结果]在 AgNews、Biomedical、StackOverflow、20NewsGroups 和 zh10 共 5 种基准数据集中,ISCCL模型的聚类准确率分别达到88.89%、48.74%、78.17%、56.97%和86.42%,较SCCL模型提升0.69%~2.67%.[局限]需要预先设定类簇特征空间维度(与聚类数目K值相同),然而在实际应用中往往很难明确原始数据的具体聚类数目,应当根据数据情况适当调整.[结论]ISCCL模型能够有效提取类簇特征,在SCCL模型的基础上提升了文本深度聚类效果.

    对比学习深度聚类SCCL类簇特征学习表示学习

    融合内容和图片特征的中文摘要生成方法研究

    全安坤李红莲张乐吕学强...
    110-119页
    查看更多>>摘要:[目的]为解决现有根据单一文本特征生成的中文摘要质量不佳问题,提出一种融合内容和图片特征的中文摘要生成方法.[方法]使用BERT提取文本特征,使用ResNet提取图片特征,该特征能够对文本特征进行补充与验证,并利用注意力机制将两种模态特征进行融合,最终将融合后的特征送入指针生成网络模型进一步生成质量更高的中文摘要.[结果]实验结果表明,所提方法相较于仅使用单一文本模态生成中文摘要的方法,在ROUGE-1、ROUGE-2和ROUGE-L指标上分别有1.9、1.3和1.4个百分点的提升.[局限]实验数据主要来源于新闻领域,在其他领域中的效果有待验证.[结论]加入图片信息能够使融合后的特征保存更多重要信息,帮助模型更好地定位关键内容,使生成的摘要更具有概括性和可读性.

    特征融合BERTResNet注意力机制摘要生成

    一种用于解析问答推理过程的多轮迭代检索算法研究

    周长顺应文豪钟珊龚声蓉...
    120-131页
    查看更多>>摘要:[目的]针对当前阅读理解类问答推理过程中传统无监督检索方式句子关联性不足的问题,设计一种检索模型,研究问答任务的推理过程,探求问答任务的可解释性.[方法]提出一种新型无监督检索模型ISR,模型中融合皮尔逊相关系数、GloVe词嵌入、IDF加权等主要模块,ISR模型通过多轮迭代方式细粒度检索推理句.[结果]对比模型MSSwQ,ISR模型在MultiRC数据集上进行实验,P、R、F1指标平均高出2.4、1.8、2.1个百分点;在HotPotQA数据集上进行实验,P、R、F1指标平均高出4.8、2.6、3.7个百分点.[局限]检索采用硬匹配,可能存在过分匹配的情形.[结论]本文模型能够提升检索推理句的准确性,检索的推理句能够有效应用于问答任务的推理过程.

    阅读理解问答无监督框架多轮迭代问答推理推理句检索

    一种以科研团队为服务对象的科研人员推荐模型

    刘成山李普国汪圳
    132-142页
    查看更多>>摘要:[目的]本研究提出一种针对科研团队的深度学习组推荐模型,旨在满足科研团队招聘科研人员的需求,提高推荐效率.[方法]首先应用自注意力机制学习团队的语义表示,接着采用神经协同过滤模型学习团队与科研人员间的非线性关系,最终得到团队与人员的契合程度作为推荐的依据.[结果]实验结果显示,在公共数据集上,与基线模型相比,本文模型在推荐正确率和F1值上分别提高10.22和10.25个百分点,在实际推荐场景中表现优异.[局限]深度学习模型的参数量较小,仍有优化空间.[结论]本文模型可以有效提高科研人员招聘的效率,有助于科研服务机构提升服务水平,满足科研团队招聘人员的需求.

    组推荐科研团队科研人员推荐自注意力机制

    教师如何看待在课堂上使用人工智能

    本刊讯
    142页

    融合多特征深度学习的印章识别及应用研究

    张志剑夏苏迪刘政昊
    143-155页
    查看更多>>摘要:[目的]为传承和弘扬印章文化,提升对复杂情境下印章的识别效果,结合知识图谱和可视化技术对识别结果及相关知识进行结构化展示.[方法]提出一种融合多特征的深度学习模型.首先,提取印章图像的颜色特征图、边缘特征图和灰度特征图;其次,将三种特征图输入深度学习模型进行识别;再次,将识别结果与知识图谱中的节点进行比对;最后,对相关知识进行可视化展示.[结果]采集并标注《寒食帖》等13幅字画上所含的印章,将其中两幅作品作为测试集.与VGG16模型相比,本文模型的精确率、召回率、F1值分别提高28.40、28.67和28.54个百分点.在未融合多特征的情况下,精确率、召回率、F1值分别下降24.30、20.16和22.74个百分点.[局限]本文模型仅能对印章的全局特征进行提取和识别,缺少对印章局部语义信息的识别和推理能力.[结论]本文方法在印章识别任务上具有良好的效果,其中多维度的特征图可以提升模型对复杂情境的识别能力和鲁棒性.

    印章识别深度学习知识图谱数字人文

    多维度注意力机制下网络舆情视觉情感识别模型及识别效果研究

    王晰巍王秋月蔡宏天
    156-167页
    查看更多>>摘要:[目的]为弥补当前视觉情感分析研究的不足,构建基于ResNet34改进的情感分析模型,分析和提高图像情感分类的精度.[方法]首先基于ResNet34架构建立视觉情感识别模型,然后通过融合CBAM模块和Non-Local模块,对情感特征进行学习、表示,最后利用以上模型对情感特征进行分类识别,并且与VGG16和ResNet50模型进行对比以验证构建模型的优越性及精度.[结果]通过实验验证所构建的模型的识别效果,研究结果表明模型的准确率、精确率、召回率和F1值分别达到84.42%、84.10%、83.70%和83.80%.与基线模型进行对比,所提模型的准确率相比于VGG16和ResNet50模型分别提升4.17和3.44个百分点,F1值分别提升4.20和3.30个百分点.[局限]测试的数据集规模相对不大,未采用皮尔曼系数等计算标注的效果,未将基于视觉的情感分类算法进行比较.[结论]从视觉情感分析视角对情感识别模型进行优化,补充了情感计算的分析模态,为舆情信息情感特征提取和分析提供了支撑.

    网络舆情视觉情感识别

    《数据分析与知识发现》期刊征文

    168页