首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    前言

    周傲英杨世宇张岩峰毛嘉莉...
    1609-1610页

    支持访问行为身份追踪的跨域密文共享方案

    申远宋伟赵常胜彭智勇...
    1611-1628页
    查看更多>>摘要:作为在云环境下被广泛应用的密文数据授权访问机制,密文策略属性基加密(ciphertext-policy attribute-based encryption,CP-ABE)具有细粒度、1对多和拥有者可控的特点.由于多个用户可能拥有相同属性集合,传统属性基加密机制难以追溯到滥用解密权限的恶意授权用户身份.虽然现有研究解决了恶意用户的特定解密权限滥用行为(白盒攻击与黑盒攻击)的身份追踪问题,但仍难以实现针对授权用户访问行为的身份追踪,这将导致潜在的安全风险和数据访问知情权合规性问题.为了在现实应用场景中实现密文数据访问行为身份追踪,方案基于密文策略属性基加密机制构造跨域密文共享方法,通过数字签名和交互式外包解密流程将可追踪密钥和授权用户访问行为绑定为访问请求,并利用区块链的不可篡改性实现访问请求的完整性保护.为了解决引入区块链所导致的访问行为身份追踪效率低下问题,方案引入加密倒排索引结构以优化区块遍历效率,并通过BLS签名和隐私集合交集思想实现索引查询的隐私保护.理论分析和实验验证表明所提方案是实用与高效的.

    密文策略属性基加密跨域密文数据共享访问行为追踪区块链遍历优化

    基于信息瓶颈理论的鲁棒少标签虚假信息检测

    王吉宏赵书庆罗敏楠刘欢...
    1629-1642页
    查看更多>>摘要:虚假信息检测对于维护网络舆情安全具有重要意义.研究表明,虚假信息在信息内容和传播结构上较真实信息具有显著不同.为此,近年来研究致力于挖掘信息内容和信息传播结构,提升虚假信息检测的精准性.然而,现实场景中虚假信息的标注往往需要大量地与官方报道等比照分析,代价较为昂贵,现有方法对标注信息的过分依赖限制了其实际应用.此外,虚假信息传播者可通过在评论区控评等手段恶意操纵虚假信息的传播,增加了虚假信息检测的难度.为此,基于信息瓶颈理论提出一种鲁棒少标签虚假信息检测方法,通过互信息最大化技术融合无标注样本信息,克服虚假信息检测对标签的过分依赖问题;并通过对抗训练的策略模拟虚假信息传播者的恶意操纵行为,基于信息瓶颈理论学习鲁棒的虚假信息表征,在高质量表征虚假信息的同时消除恶意操纵行为的影响.实验表明,该方法在少标签识别和鲁棒性 2个方面均取得了优于基准方法的效果.

    虚假信息检测图神经网络互信息图表示学习鲁棒表示学习少标签学习

    基于本地差分隐私的分布式图统计采集算法

    傅培旺丁红发刘海蒋合领...
    1643-1669页
    查看更多>>摘要:社交网络、社交物联网等应用场景产生的海量分布式图结构数据,被应用服务商采集并以此提供各类以数据为驱动的服务,或将引发严重的隐私风险.在此背景下,如何针对具备强关联性的分布式图结构数据实现安全高效的采集,成为大规模图结构数据应用服务的瓶颈.面向分布式图结构数据隐私保护的节点或边本地差分隐私模型无法有效处理隐私保护效果和数据有效性之间的冲突关系.针对该问题,提出基于本地差分隐私的分布式图统计采集算法,同时实现度分布、三角计数序列和聚类系数 3个不同统计指标采集,并适应不同有效性和隐私保护的需求.首先,采用分组机制及对称一元编码机制,设计具备高强度隐私保护的基于Node-LDP的度分布采集算法;其次,基于所提度分布采集算法获取阈值,引入剪枝算法缓解随机加噪的噪声边过多问题,并分别提出基于Node-LDP和Edge-LDP的三角计数序列采集算法;再次,在前述三角计数序列采集算法基础上引入拉普拉斯机制,从而分别提出基于Node-LDP和Edge-LDP的聚类系数采集算法,进而实现不同保护强度及数据效用需求下的分布式图结构多指标采集;最后,实验和对比结果表明,所提算法能同时提高隐私保护强度和数据效用,比现有单一或多统计指标采集算法更具优势.

    图结构数据本地差分隐私隐私保护技术数据效用图统计数据采集

    基于半监督学习的未知异常检测方法

    程渝栋周昉
    1670-1680页
    查看更多>>摘要:异常检测旨在识别偏离预期行为模式的数据.虽然半监督异常检测方法可以充分利用有限的标签数据作为先验知识来提高检测准确性,但是收集到的标记异常(即已知异常)很难覆盖所有类型的异常并且在现实场景中往往存在着一些新型的异常(即未知异常),这些异常可能与已知异常表现出不同的特性,因此难以被现有的半监督异常检测方法识别.针对该问题,提出了一种基于半监督学习的未知异常检测(semi-supervised unknown anomaly detection,SSUAD)方法,旨在同时识别已知异常和未知异常.该方法利用闭集分类器对已知异常和正常分类,利用未知异常检测器检测未知异常.此外,还考虑了异常场景中异常和正常极端不平衡的情况,设计了有效的数据增强方法来扩充异常样本的数量.在UNSW-NB15和KDDCUP99数据集以及一个真实数据集SQB上进行了实验,实验结果表明,相较于现有的异常检测方法,SSUAD在异常检测性能指标AUC-ROC(area under receiver operating characteristic curve)和AUC-PR(area under precision-recall curve)上都有明显的提升.证明了SSUAD的有效性和合理性.

    异常检测分布外检测半监督学习未知异常表格数据

    大语言模型驱动的选址推荐系统

    高云帆郁董卿王思琪王昊奋...
    1681-1696页
    查看更多>>摘要:选址作为商业决策和城市基础设施规划的核心环节,对实体店铺、城市基础设施能否发挥预期效用具有重要作用.现有的选址推荐系统数据服务编排较为固定,无法对不同用户需求系统做出及时调整,应用场景受限,人机交互的系统灵活性和可扩展性差.最近,以GPT-4为代表的大语言模型(large language model,LLM)展现出了强大的意图理解、任务编排、代码生成和工具使用能力,能够完成传统推荐模型难以兼顾的任务,为重塑推荐流程、实现一体化的推荐服务提供了新的机遇.然而,一方面选址推荐兼具传统推荐共有的挑战;另一方面,由于其基于空间数据,具有独特的挑战.在这一背景下,提出了大语言模型驱动的选址推荐系统.首先,拓展了选址推荐的场景,提出了根据位置寻找合适店铺类型的场景推荐任务,结合了协同过滤算法和空间预训练模型.其次,构建了由大语言模型驱动的选址决策引擎.语言模型本身在处理空间相关的任务上存在诸多缺陷,例如缺少空间感知能力、无法理解具体位置、会虚构地名地址等.提出了一种在语言模型框架处理空间任务的机制,通过地理编码、逆编码、地名地址解析等工具提升模型的空间感知能力并避免地址虚构问题,结合选址推荐模型、场景推荐模型、外部知识库、地图可视化完成选址推荐中的多样化任务.实现选址任务的智能规划、执行与归因,提升了空间服务系统的交互体验,为未来人工智能驱动的选址推荐系统提供新的设计和实现思路.

    选址推荐推荐系统大语言模型智能代理地理空间分析

    面向信息系统推荐与决策的高阶张量分析方法

    王贝伦张嘉琦蔡英豪王兆阳...
    1697-1712页
    查看更多>>摘要:张量数据(或多维数组)在各个行业的信息系统中广泛存在,例如医疗系统中的功能性磁共振成像(fMRI)数据和商品数据信息系统中的用户-产品数据.将这些数据用以预测张量特征与单变量响应之间的关系,可以实现数据赋能,提供更精准的服务或解决方案,例如疾病决策诊断或商品推荐.然而,现有的张量回归方法存在 2个主要问题:一是可能丢失了张量的空间信息,导致预测结果不准确;二是计算成本过高,导致服务或解决方案不及时.对于具有高阶结构的大规模数据而言,这 2点则显得更为突出.因此为了实现数据赋能,即利用张量数据来提高信息服务或解决方案的质量和效率,提出了稀疏低秩张量回归模型(sparse and low-rank tensor regression model,SLTR).该模型通过对张量系数应用 范数和张量核范数使得张量系数具有稀疏性和低秩性两大特点,这样既保留了张量的结构信息又可以方便地解释数据.利用近端梯度方法优化了混合正则化器,使得求解过程可扩展且高效.除此之外证明了SLTR的严格误差界.在多个模拟数据集和一个视频数据集上的实验结果表明,SLTR相比于之前的方法,在更短的时间内获得了更好的预测性能.

    张量回归并行近端法数据可解释性张量范数分类

    图卷积宽度跨域推荐系统

    黄玲黄镇伟黄梓源关灿荣...
    1713-1729页
    查看更多>>摘要:跨域推荐(cross-domain recommendation,CDR)通过利用其他域的额外知识,有效缓解了传统推荐系统遭遇的数据稀疏性问题.但是当前的CDR方法忽略了用户-项交互图所蕴含的高阶信息.为此,提出了一个新的框架,称为图卷积宽度跨域推荐系统(graph convolutional broad cross-domain recommender system,GBCD).具体地,将传统的用户-项交互的 2-部图扩展到一个(D+1)-部图,以建模每个域中用户和项之间的关系,然后使用公共用户作为源域和目标域之间的桥梁来传递信息.通过图卷积网络(graph convolutional network,GCN)学习用户与项之间的高阶关系,以聚合领域信息.然而,由于GCN在大量节点下收敛速度非常慢,并倾向于吸收不可靠的交互噪声,导致鲁棒性较差.为此,将域聚合特征输入到宽度学习系统(broad learning system,BLS),并利用BLS的随机映射特征增强了GCN的鲁棒性,进而获得了较好的推荐性能.在2个真实数据集上进行的实验结果表明,GBCD优于各种先进的跨域推荐方法.

    跨域推荐多部图构造宽度学习系统图卷积网络推荐系统

    基于对比学习的多兴趣感知序列推荐系统

    赵容梅孙思雨鄢凡力彭舰...
    1730-1740页
    查看更多>>摘要:序列推荐的近几年工作通过聚类历史交互物品或者利用图卷积神经网络获取交互的多层次关联信息来细化用户兴趣.然而,这些方法没有考虑具有相似行为模式的用户之间的相互影响以及交互序列中时间间隔不均匀对用户兴趣的影响.基于上述问题,提出一种基于对比学习的多兴趣感知序列推荐模型MIRec,一方面考虑了序列内部的物品依赖和位置依赖等局部偏好信息,另一方面通过图信息聚合机制获取相似用户之间的全局偏好信息;然后将融合局部偏好和全局偏好的用户表示输入胶囊网络中,学习用户交互序列中的多兴趣表示;最后通过对比学习使用户的历史交互序列靠近增强的交互序列,获得对时间间隔不敏感的用户多兴趣表示,为用户提供更准确的推荐.所提模型在 2个真实数据集上进行了充分实验,实验结果验证了所提模型的有效性.

    多兴趣全局偏好局部偏好胶囊网络序列推荐

    基于定位数据的全景超分辨图像交互可视化框架

    王晨泽沈雪豪黄振立王政霞...
    1741-1753页
    查看更多>>摘要:超分辨定位成像和全景数字病理结合,为研究人员观察整个样本的亚细胞结构提供了有力工具,同时也带来了全景超分辨图像海量数据可视化的挑战.然而,现有的超分辨图像可视化方法无法处理大规模定位数据、不能提供高分辨全景图像和无法交互可视化全景图像.针对以上问题,提出了一个基于定位数据的全景超分辨图像交互可视化框架,称为PNanoViewer,旨在普通计算机上实现大规模定位数据的快速交互可视化.该框架基于随机采样策略构建定位数据的多分辨率层级结构,以交互方式可视化多尺度全景超分辨图像;同时采用分块策略和多线程并行策略,分批次处理大规模定位数据,既防止内存溢出又加快了处理速度.从数千万到数亿个定位点数据集上的实验结果表明,PNanoViewer框架能够可视化任意规模的定位数据.将该框架与目前 3种流行的超分辨图像可视化方法PALMsiever,ThunderSTORM,QC-STORM从数据量、分辨率和速度 3个方面进行对比,PNanoViewer都具有明显优势.同时也为大规模定位数据的可视化提供了一个有益的探索.

    交互可视化大规模定位数据全景超分辨图像全景数字病理多分辨率层级结构