首页期刊导航|大数据
期刊信息/Journal information
大数据
人民邮电出版社
大数据

人民邮电出版社

双月刊

2096-0271

bdr@bjxintong.com.cn

010-81055448

100078 

北京市丰台区成寿寺路11号邮电出版大厦8层

大数据/Journal Big Data ResearchCSTPCD
查看更多>>本刊以“开放、创新姿态,推动大数据技术的研究与应用,促进技术交流,推广创新成果,服务大数据社会”为宗旨。编辑方针和业务范围为:报道大数据技术应用领域中具有前瞻性、独立性和创新性的产业与技术发展见解;产业的新研究应用成果与发展动态;关键技术、热点的前沿性研究与应用;具有先进性和推广价值的应用方案等,有效促进我国大数据技术研究与应用的交流,全方位展示我国大数据产业的发展、技术趋势和创新应用成果,推动大数据产业的发展,使大数据技术真正应用于社会,服务于社会发展。
正式出版
收录年代

    专题:政务数据处理

    1-2页

    政务数据标识技术研究进展及下一代政务数据标识体系

    王昀郭毅峰苏晓亮周武爱...
    3-15页
    查看更多>>摘要:政务数据标识是建设全国一体化政务大数据体系的一项基础性工作.对数据标识技术的研究进展进行了总结,比较了不同数据标识技术编码规则的异同,并进一步总结了政务数据标识及应用进展.结合政务数据所具有的权责明确、安全性要求高、兼容性需求强等特点,提出了下一代政务数据标识体系Gcode.Gcode由外部码、内部码和安全码3个部分组成.其中,外部码兼容了统一社会信息用代码,内部码建立了"机构-部门-系统-数据"的关联关系,安全码通过引入区块链技术实现防伪验真.Gcode具有权责明确、兼容性强、安全性高等特点,能够支持政务数据跨层级、跨地域、跨系统、跨部门、跨业务共享,可有力推动实现政务数据"一数一源".

    政务数据数据标识数据治理

    我国政务数据分类分级实施关键问题与实践研究

    王跃苏娜
    16-26页
    查看更多>>摘要:数据分类分级是保障数据安全流通、推动数据价值释放的基础前提.聚焦政务数据分类分级这一政府数字化改革中的关键任务,采用基于理论的案例研究方法,基于各省级地方及部委公开发布的方案,对我国政务数据分类分级实施情况进行系统梳理与量化分析.总结了我国政务数据分类分级实施的四大关键过程与五大特点;从政务数据分类分级的特殊复杂性出发,提出我国政务数据分类分级实施存在整体目标定位不清、分类分级对象各异、分类分级关系割裂、安全分级标准不一4个问题,并提供应对方案;基于国家某部委政务数据分类分级实践,验证应对方案的科学性、有效性,为构建全国统一的政务数据分类分级体系提供参考.

    数字政府政务数据分类分级实施

    省级政务大数据平台建设模式研究与启示

    孟凡杨群力高阳李文斌...
    27-39页
    查看更多>>摘要:建设高质量政务大数据资源平台是实现跨部门、跨区域、跨层级政务信息集成融合,加快建设数字政府、提升公共服务和社会治理等数字智能化水平的重要基础工程.首先,回顾我国电子政务发展历程,并总结出传统省级政务大数据平台的3种建设模式以及存在的问题,即数据鲜活性低、数据一致性差、业务协同管理难、基础支撑力弱和总体投入高.其次,对江苏信用一体化信息资源管控平台进行案例分析,阐述以江苏案例为例的原因,针对传统建设模式存在的问题,提出对应的解决思路和总体架构设计,并梳理出江苏案例的4个借鉴价值.最后,在总结江苏研究和实践经验的基础上,归纳出5点建议,为各省研究、制定省级政务大数据平台的建设指南等政策性文件提供参考.

    政务大数据信息资源管控系统建设模式社会信用体系

    基于联邦学习的政务大数据平台应用研究

    吴坚平陈超超金加和吴春明...
    40-54页
    查看更多>>摘要:当前数字政府建设已进入深水区,政务大数据平台作为数据底座支撑各类政务信息化应用,其隐私数据的安全性和合规性一直被业界广泛关注.联邦学习是一类解决数据孤岛的重要方法,基于联邦学习的政务一体化大数据平台应用具有较高的研究价值.首先,介绍政务大数据平台及联邦学习应用现状;然后,分析政务大数据平台面临的隐私数据的采集、分类分级、共享三大管理挑战;接着,阐述基于联邦学习的推荐算法和隐私集合求交技术的解决方法;最后,对政务大数据平台隐私数据的未来应用进行了总结和展望.

    政务大数据联邦学习推荐算法隐私集合求交

    "数据赋能"驱动智能化政府建设的逻辑与路径

    王蕤刘震
    55-64页
    查看更多>>摘要:在社会全面数字化的时代,政府的智能化趋势不可阻挡.在技术与数据的协同作用下,我国数字政府建设呈现电子化、网络化和智能化的发展趋势.数据是数字政府建设的核心资源,建设智能化数字政府必然要求充分发挥数据的价值.数据赋能推动数字政府建设的逻辑如下:数据赋能政府的开放性运行;数据赋能政府的整体性运行;数据赋能政府的协同性运行;数据赋能政府的科学性运行.通过数据赋能推动数字政府建设的具体路径要求:以数字政府的整体性运行为基础保障数据的开放共享;以数字政府的协同性运行为基础保障数据的统一与管理;以数字政府的开放性为基础保障数据的统筹协调与再分配;以数字政府的科学性为基础保障数据来源的多元性.

    数据赋能智能化政府智能化政府运行逻辑智能化政府建设

    面向非平行语料的语音转换技术综述

    李鹏程张旭龙王健宗程宁...
    65-81页
    查看更多>>摘要:语音转换是语音及人工智能领域的一项研究课题,其目标是在保持源语音内容不变的情况下改变语音的音色,使其听上去像是由另一个目标说话人说出的,同时还需保证语音的质量和自然度.面向非平行语料的语音转换技术是当下的热门研究内容,其使用非平行的多说话人语音数据集进行模型训练,能完成多对多以及任意对任意的语音转换.对近年来面向非平行语料的语音转换进行了全面的总结和分析.首先概述了早期面向平行语料的语音转换及其缺陷,然后对当下面向非平行语料的语音转换的各类实现方法进行介绍和对比分析,最后对语音转换技术进行了总结和展望.

    语音转换人工智能深度学习

    知识与句法融合的因果关系抽取网络

    汪诗蕊解博涵丁玲陈建廷...
    82-92页
    查看更多>>摘要:因果关系抽取作为关系抽取的一个重要任务,近年来得到了广泛关注.现有的因果关系抽取方法大多将句法结构和背景知识割裂开进行研究,早期的因果关系抽取方法偏重于从句法结构层面进行分析,随着深度学习技术的发展,预训练模型结合背景知识的方法成为主流.然而上述两种方法均未完全融合句内信息和外部知识,带来了不同程度的信息缺失.为了解决这一问题,提出了结合句法结构和背景知识的因果关系抽取模型.该模型将句子解析为同时包含句法和知识的知识句法图结构,使用图卷积网络进行信息融合.模型同时考虑了句法和知识两部分信息,从而进一步丰富了实体嵌入,达到了良好的因果关系抽取效果.本模型在EventStoryLine数据集上取得了良好效果,F1值达到0.445,与现有方法相比提高了2.3%.

    因果关系抽取预训练模型图卷积网络自然语言处理

    Bootstrap样本大数据模型和分布式集成学习方法

    罗凯靖张育铭何玉林黄哲学...
    93-108页
    查看更多>>摘要:传统Bootstrap抽样和Bagging集成学习通常以串行方式实现,计算效率低,且存在样本不可重用、扩展性差等问题,不适合高效的大规模Bagging集成学习.从大数据分布式计算的思维入手,提出新的Bootstrap样本划分(BSP)大数据模型和分布式集成学习方法.BSP数据模型通过分布式生成算法将训练数据表达成分布式Bootstrap样本集的集合,存储成HDFS分布式数据文件,为后续的分布式集成学习提供数据支持.分布式集成学习方法从BSP数据模型中随机选取多个BSP数据块,读入集群各个节点的虚拟机,用串行算法对选取的数据块并行计算统计量或训练建模,再将所有的计算子结果回传至主节点中,生成最终的集成学习结果,此过程中可加入对子结果的质量选择以进一步提高预测效果.BSP数据模型的生成和分布式集成学习采用非Map-Reduce计算范式进行,每个数据块的计算独立完成,减少了计算节点间的数据通信开销.提出的算法在Spark开源系统中以新的算子方式实现,供Spark应用程序调用.实验表明,新方法可以高效地生成训练数据的BSP数据模型,提高数据样本的可重用性,在基于有监督机器学习算法构建的大规模Bagging集成学习实验中,计算效率能提高50%以上,同时预测精度进一步提高约2%.

    Bootstrap抽样Bagging集成学习分布式集成学习Spark

    基于动态动作覆盖的深度强化学习新闻推荐

    董相宏安俊秀
    109-118页
    查看更多>>摘要:新闻推荐系统对新媒体新闻传播有着重要作用.提出了一种以深度强化学习为基础的推荐系统,旨在结合神经网络的表征能力和强化学习的策略选择能力来提升新闻推荐效果.使用动态动作掩码加强对用户短期兴趣的判断能力,使用优化缓存机制提升经验缓存的使用效率,通过区域遮蔽性质的奖励设计加快模型训练,从而提高推荐系统在新闻推荐领域的表现.实验表明,所提模型在新闻数据集上的推荐准确率与主流的神经网络推荐方法相当,且在排序性能上优于当前先进的推荐算法.

    新闻推荐强化学习动态掩码优势缓存内在奖励