首页期刊导航|数据分析与知识发现
期刊信息/Journal information
数据分析与知识发现
数据分析与知识发现

张晓林

月刊

2096-3467

jishu@mail.las.ac.cn

010-82626611

100190

北京中关村北四环西路33号

数据分析与知识发现/Journal Data Analysis and Knowledge DiscoveryCSSCICHSSCDCSCD北大核心CSTPCD
查看更多>>本刊是中国科学院主管、中国科学院文献情报中心主办的学术性、计算机信息管理技术专业刊物,它集图书馆界、情报界、各种现代技术的应用和情报信息服务工作导向于一身,面向情报信息界、图书馆界和档案界,技术导向强、信息量大、内容丰富,是国内唯一一份被中国图书馆学会和中国科技情报学会共同推荐的专业技术类中文核心期刊,并被中国科学院授予“优秀期刊”。
正式出版
收录年代

    融合多特征和注意力机制的多模态情感分析模型

    吕学强田驰张乐杜一凡...
    91-101页
    查看更多>>摘要:[目的]针对当前多模态情感分析中多模态特征提取不充分,模态内部信息和模态间交互信息结合不充分的问题,提出一种融合多特征和注意力机制的多模态情感分析模型.[方法]在多模态特征提取方面,增加视频模态中人物的肢体动作、性别和年龄特征;对于文本模态,融合基于BERT的字粒度语义向量和融合义原信息的词粒度语义向量,丰富了多模态数据的低层特征.利用自注意力机制和跨模态注意力机制以实现模态内部信息和模态间信息的充分结合.将各模态特征进行拼接,通过软注意力机制为各模态特征分配注意力权重,通过全连接层输出最终的情感分类结果.[结果]在公开数据集CH-SIMS和本文构建的热点舆情评论视频数据集HPOC上与Self-MM模型对比,实验结果表明,本文模型在CH-SIMS数据集上的二分类准确率、三分类准确率和F1值分别提升1.83、1.74和0.69个百分点,在HPOC数据集上分别提升1.03、0.94和0.79个百分点.[局限]视频中人物所处的场景可能不断变化,不同的场景可能蕴含不同的情感信息,模型未考虑融合人物所处的场景信息.[结论]本文模型丰富了多模态数据的低层特征,充分结合模态内部信息和模态间信息,能够有效提升情感分析的效果.

    多特征多模态情感分析注意力机制

    融合边缘采样和Tri-training的用户评论情感分析方法

    江亿平张婷夏争鸣李玉花...
    102-112页
    查看更多>>摘要:[目的]针对用户评论数据量大、情感倾向模糊、内容短小等特点,提出融合边缘采样和Tri-training的用户评论情感分析方法.[方法]通过构建基于一对多拆解策略的多分类支持向量机,并融合考虑余弦相似度的边缘采样策略构造初始集,提出结合软投票机制的Tri-training算法.[结果]本文算法对Tri-training算法投票机制的改进,进一步减小了多个分类器对于样本分类投票判断失误的概率,使所有类别精确率均在79%以上.[局限]未考虑多媒体数据的信息提取.[结论]与传统及近年改进的半监督学习算法相比,本文提出的融合边缘采样和Tri-training的算法在分类准确率和效率上具有一定的优越性.

    用户评论情感分析边缘采样Tri-training

    基于短视频网络的互联网舆情演化研究

    魏宏程朱恒民魏静叶东宇...
    113-126页
    查看更多>>摘要:[目的]短视频已成为互联网舆情传播的新途径.为揭示短视频舆情的演化特征,本文提出基于短视频网络的舆情演化分析方法.[方法]分别计算短视频标题、封面和视频内容间相似度,构建短视频网络;基于层次聚类法从网络中识别视频主题,计量视频中音频与标题的情感;将视频发布账号划分为不同类别的利益相关者;最后,从主题、情感和利益相关者三个维度分析短视频舆情演化.[结果]研究结果表明,利用视频的多模态特征和视频间关系,可以有效地描述短视频舆情演化态势,且"标题+封面+视频内容"模态组合的SSE为6.708,优于其他单模态或多模态组合.[局限]本文使用的抖音平台短视频的音频数据包含纯背景音乐,使得音频模态的分析存在一定偏差.[结论]本研究有利于掌握短视频舆情中主题与群体情绪的演化,发掘不同视频账号的关注点与情感变化,及时对短视频舆情进行监管与引导.

    舆情演化短视频网络多模态特征利益相关者

    学术论文创新质量评价研究——以多能干细胞技术为例

    汪雪锋于慧妍郑思佳雷鸣...
    127-138页
    查看更多>>摘要:[目的]通过构建学术论文创新质量评价模型,探讨基于定量与定性相结合的科技评价方法,促进科学研究的渐进性创新.[方法]兼顾创新新颖性和影响性特征,采用Doc2Vec算法将非结构化文本内容转化为向量空间模型,继而运用余弦相似度测度文本内容相似度,同时应用待评价论文局部引文网络构建创新影响指数计算方法,并将新颖性和影响性测度结果映射到二维散点图中,基于区域划分构建学术论文创新质量评价模型.[结果]多能干细胞技术实证结果显示:本文方法与F1000推荐结果基本一致,能够在一定程度上弥补当前学术论文创新质量评价的不足.[局限]仅讨论了学术论文新颖性、学术论文创新影响两个因素,存在一定的片面性.[结论]本文构建的评价模型能够为定性的同行评议提供定量数据支撑,是对学术论文创新质量定量评价的有益探索.

    创新质量新颖性颠覆性指数Doc2Vec算法多能干细胞

    科技成果的文化影响概念框架与REF2021案例研究

    曾燕昝婷婷杨晓屈明剑...
    139-150页
    查看更多>>摘要:[目的]分析国外科技成果的文化影响案例,为我国科技成果的文化价值评估提供参考.[方法]建立16个文化影响类别和4类研究成果概念框架并借助Notion AI工具,完成英国REF2021影响评估案例中科技医药领域的29个文化影响案例的影响类别和成果类别标引,对案例文本进行结构化分析.[结果]分析结果揭示了科技医药领域文化影响类别的丰富多样性,最突出的类别为"参与或被应用到各类传媒或文化载体中",不同学科与不同类型的研究成果的文化影响表现具有差异性.[局限]案例数量偏少,所建立的文化影响概念框架有待进一步完善,未包含对文化意识形态方面的影响分析等.[结论]本文所提文化影响的概念框架有助于解释案例文本;不同学科和不同类型研究成果的文化影响差异揭示了分类评价的必要性和意义;文化影响的概念框架还有待进一步扩展才能更好地为评估决策提供支持.

    科技成果文化影响评估文化影响类别案例文本结构化分析

    基于机器阅读理解的智能咨询问答系统构建

    王翼虎白海燕
    151-162页
    查看更多>>摘要:[目的]改善现有智能咨询系统不足,解决系统难以回答学术问题的局限.[方法]利用深度学习、机器阅读理解、数据增强、信息检索和语义相似度等技术,自建数据集并构建学术知识问答系统,同时针对学术文献特点设计多元段落召回指标,以多维特征提升召回准确度.[结果]通过双模型联合构建学术知识问答系统,ROUGE-L得分达到0.733 8,解决问题正确率达到88.65%,多元段落召回指标准确率也达到88.38%.[局限]仅使用单一领域内容进行实验,在处理复杂的、涉及多个领域的问题时,存在一定的局限性.[结论]将机器阅读理解技术与参考咨询服务深度融合,可以提高学术资源的利用效率和共享效率,为科研人员提供更加全面和准确的信息支持.

    深度学习机器阅读理解智能咨询服务问答系统

    爱思唯尔推出面向生命科学研发的人工智能语义检索工具SciBite Chat

    162页