首页期刊导航|数据分析与知识发现
期刊信息/Journal information
数据分析与知识发现
数据分析与知识发现

张晓林

月刊

2096-3467

jishu@mail.las.ac.cn

010-82626611

100190

北京中关村北四环西路33号

数据分析与知识发现/Journal Data Analysis and Knowledge DiscoveryCSSCICHSSCDCSCD北大核心CSTPCD
查看更多>>本刊是中国科学院主管、中国科学院文献情报中心主办的学术性、计算机信息管理技术专业刊物,它集图书馆界、情报界、各种现代技术的应用和情报信息服务工作导向于一身,面向情报信息界、图书馆界和档案界,技术导向强、信息量大、内容丰富,是国内唯一一份被中国图书馆学会和中国科技情报学会共同推荐的专业技术类中文核心期刊,并被中国科学院授予“优秀期刊”。
正式出版
收录年代

    GUIDE平台帮助AI通过实时人类反馈进行学习

    113页

    基于交叉注意力的双通道文本关系抽取

    叶乃夫袁得嵛张郅侯晓龙...
    114-125页
    查看更多>>摘要:[目的]针对现有文本关系抽取模型只能获得部分文本特征的问题,构建基于交叉注意力的双通道文本关系抽取模型,提升文本关系抽取的全面性和准确性,实现领域数据集高性能关系抽取.[方法]本文提出基于交叉注意力的双通道文本关系抽取模型DCCAM(Dual Channel Cross Attention Model),设计融合序列通道和图通道的双通道结构,构建自注意力和门控注意力的交叉注意力机制,促进文本特征高度融合,更深入地挖掘文本潜在的关联信息.在公开数据集和构建的两类警务领域数据集中进行实验.[结果]在公开数据集NYT和WebNLG上的实验结果表明,DCCAM模型F1值与SAPCNN、GraphRel 2p模型相比分别提升3个百分点和4个百分点.此外,消融实验结果证明了各模块提升文本抽取能力的有效性.在警务领域的电信诈骗类数据集和帮助信息网络犯罪类数据集上的实验结果表明,DCCAM模型能够提高警务领域文本关系抽取效果,与GraphRel模型相比F1值分别提高8.8和11.8个百分点.[局限]未从大语言模型的角度进行文本关系抽取技术的探索.[结论]DCCAM模型可以显著提升文本关系抽取的能力,是警务工作中文本关联分析的解决方案.

    文本关系抽取双通道机制交叉注意力机制

    社交网络友谊质量可以对抗孤独感

    125页

    基于MacBERT的碳中和实体关系联合抽取

    朱西平肖丽娟高昂郭露...
    126-135页
    查看更多>>摘要:[目的]为实现碳中和数据间的语义关联性挖掘、提升整体三元组抽取准确性,提出一种基于MacBERT的实体关系联合抽取HmBER模型.[方法]在HmBER模型中,通过相似度度量、实体边界辅助训练以及在关系抽取中引入实体类别特征,提升碳中和实体关系联合抽取的性能.[结果]与Multi-head、CasRel、SpERT和STER模型结果对比表明,HmBER模型的F1值在碳中和数据集上分别平均提升2.39%、13.84%.[局限]本方法处理的数据需要通过句子的意义推测实体关系联合抽取结果,没有做更深潜在语义的挖掘.[结论]HmBER模型有效地解决数据漏标与实体边界错误问题,为实体关系联合抽取提供了高准确抽取思路.

    实体关系联合抽取碳中和边界错误数据漏标

    在手机和笔记本电脑上高效使用精简大语言模型已经实现

    135页

    基于概念链和图注意力网络的下位词扩展

    王煜栋白宇叶娜陈建军...
    136-145页
    查看更多>>摘要:[目的]解决交互式检索场景中下位词扩展存在的主题漂移问题通过.[方法]利用图注意力网络编码概念链与文本关系图节点,其中,概念链通过词交互过程建模获得,关系图通过字共现关系获得.通过引入注意力机制,克服传统文本编码过程中丢失查询场景信息的问题.[结果]实验结果表明,本文方法比最好方法PRGC的F1值提升2.0%.[局限]本文方法针对交互式场景进行设计,对交互数据的质量存在一定依赖性.[结论]本文模型将概念链的结构特征和语义特征有效融合到文本特征中,同时对概念链和候选文本进行注意力计算,减少了在编码过程中造成的场景主题信息损失,缓解了主题漂移问题.

    下位词扩展概念链图注意力网络主题漂移

    《数据分析与知识发现》期刊征文

    146页