首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    大规模神经记录的峰电位聚类算法(特邀)

    徐明亮李芳媛马浩然何飞...
    1-34页
    查看更多>>摘要:峰电位聚类是指在进行细胞外神经记录时,从神经电极记录中检测、聚类并确认出不同峰电位信号,并以一定的可靠度与假定的不同神经元对应。它是对细胞外神经记录进行预处理分析的基本步骤,也是神经科学中神经解码的首要步骤,更是当前高带宽脑机接口(BCI)的重要研究方向之一。传统峰电位聚类包括峰电位检测、峰电位对齐、特征提取、特征聚类等步骤。当前,随着神经电极数量和密度不断增加,神经记录的规模呈爆炸式增长,这对峰电位聚类算法的效率和精度提出重大挑战。此外,针对现有峰电位聚类算法特征提取和表征能力不强、信噪比低、信息混叠等问题,各种算法增强方案乃至人工智能和大数据峰电位聚类方案应运而生,极大促进了对大脑复杂原理和工作机制的理解。研究首先概述侵入式BCI、神经编解码与峰电位聚类的相关性,接着阐述了各类峰电位聚类算法的原理和一般过程,并探讨了大脑神经信号与具体行为的映射关系与应用,最后展望了未来神经编解码所面临的挑战和发展趋势。

    峰电位聚类侵入式脑机接口神经编解码机器学习深度学习

    模板运算代码的自动生成与调优框架

    刘金硕文尧
    35-47页
    查看更多>>摘要:针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架。在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统一计算设备架构(CUDA)核函数,同时根据单GPU或多GPU环境生成不同的主机端代码。在代码调优阶段,根据不同的GPU型号确定候选参数范围,动态调用生成的CUDA核函数以确定最优参数。在多GPU的情况下,自动生成的主机端代码能够使用计算与通信重叠的方法进行边界数据交换。在4种不同的GPU与7、13、19、27点模板运算中,该框架能找到最优的参数配置。实验结果表明,对于Tesla V100-SXM2,以调优过的参数进行模板运算,该框架在单精度4种模板运算下的每秒万亿次浮点运算数(TFLOPs)分别为1。230、1。680、1。120、1。480,在双精度下分别为0。690、1。010、0。480、1。470,平均性能达到手工优化代码的98%,并且描述更简单,支持多GPU扩展。

    模板运算统一计算设备架构计算图领域专用语言代码生成自动调优

    基于多源域适应的单细胞智能分类

    魏琢艺罗迈李文兵曾远松...
    48-55页
    查看更多>>摘要:单细胞核糖核酸(RNA)测序技术被成功应用于产生人体组织和器官的高分辨率细胞图谱,这加深了研究者们对人类疾病组织中细胞异质性的理解。细胞注释是单细胞RNA测序数据分析中非常关键的一步,许多典型的模型利用一个有标签的单细胞参考数据集去注释目标数据集,但目标数据集中部分细胞类型可能不在参考数据集中。整合多个参考数据集可以更好地覆盖目标数据集中的细胞类型,然而多个参考数据集和目标数据集之间存在因测序技术差异等原因造成的批次效应。为此,提出一种基于多源域适应的单细胞分类模型,利用多个已标注细胞类型的参考数据集分别与未标注细胞类型的目标数据集进行对抗训练,消除了批次效应。采用虚拟对抗训练,进一步提升模型预测结果对数据点周围局部微小扰动或噪声的鲁棒性,防止过拟合。在多个单细胞数据集上的实验结果表明,该模型比目前主流模型的细胞识别精度至少提升了 5个百分点,为新测序的单细胞身份鉴定提供了新的选择和参考。

    单细胞核糖核酸测序单细胞分类多源域适应对抗训练深度学习

    小角中子散射物理模型自动化筛选

    李亚康陈刚
    56-64页
    查看更多>>摘要:小角中子散射(SANS)实验数据的分析过程需要科研人员选择样品对应的物理模型进行迭代拟合来表征样品的结构和属性。目前选择物理模型的方法大多是基于人工经验,分析门槛高、准确率较低。基于标准神经网络模型的小角中子散射实验样品物理模型自动化筛选方法面临着图像缺乏局部特征、类内差异大、类间差异小等问题。设计双模态特征融合卷积神经网络(BFF-CNN)模型,先引入物理感知的傅里叶-贝塞尔变换(FBT)来提取散射图像的全局结构信息,再将原始图像与FBT变换图像通过两个子网络分别进行特征提取与特征融合,以提升神经网络整体的特征表达能力。提出受限Softmax(R-Softmax)损失函数,通过在原生Softmax损失函数的基础上添加惩罚项来限制输入样本被分配到非本真类的概率,可在Softmax损失接近0时缓解梯度的消失问题,进而提高收敛速度。在自建的小角中子散射图像数据集上的实验结果表明,BFF-CNN的预测准确率和平均召回率相比于ResNet-18、PMG等模型提升幅度较大,采用R-Softmax与中心损失函数的联合学习策略后的预测准确率和召回率相比只采用Softmax损失函数提升了 5。4和10。5个百分点,具有较好的小角中子散射图像分类效果。

    小角中子散射物理模型神经网络傅里叶-贝塞尔变换特征融合

    卫星MIMO通信系统抗移动无人机集群干扰的在线BSS算法

    秦媛张杭朱宏鹏李炯...
    65-76页
    查看更多>>摘要:移动无人机(UAV)集群可以对卫星多输入多输出(MIMO)通信系统下行链路近距离实施压制式恶意干扰,导致接收信号的信干比(SIR)很低,严重影响通信质量。由于移动无人机信号的传输具有快衰落特性,因此此类扰信混合不仅具有时变性,而且存在突变性。采用盲源分离(BBS)算法实现扰信分离,提出一种部分回溯自适应变步长动量项等变自适应盲分离(PR-V-M-EASI)算法。算法以自适应变步长动量项EASI算法为基础,将串音误差作为分离性能指标自适应调整步长和动量项因子,加快算法的迭代速度,以适应混合矩阵的时变性。此外,算法还通过部分回溯分离的方式提升混合矩阵突变阶段的分离性能,降低分离算法的复杂度。仿真结果表明,PR-V-M-EASI算法能够在不影响收敛速度的前提下改善混合矩阵突变导致的分离精度下降,可有效对抗移动无人机集群施放的强恶意干扰。

    卫星多输入多输出系统无人机集群干扰等变自适应盲分离动量项部分回溯变步长

    序列特征与学习过程融合的知识追踪模型

    李子杰周菊香韩晓瑜甘健侯...
    77-85页
    查看更多>>摘要:知识追踪是人工智能技术与教育相结合的新兴领域,旨在通过学生过去完成习题的交互序列对学生的知识状态进行评估,是实现大规模个性化学习服务的关键核心技术。随着深度学习在计算机视觉、自然语言处理、推荐系统等领域的广泛应用,知识追踪领域也出现了大量基于神经网络的方法,简称深度知识追踪(DKT)模型。针对目前已有DKT模型在可解释性和准确性方面的不足,提出一种序列特征与学习过程融合的知识追踪模型SLKT,模型包括知识状态模块、序列特征模块、预测模块。知识状态模块用以模拟学生学习过程,序列特征模块捕捉学习者近期学习状况。通过序列特征和学习过程的融合,有效解决了基于知识状态建模方法无法考虑学习者近期学习状况的问题,同时提出一种带约束的动态Q矩阵表示练习和知识点之间的关系,从而更好地进行学习者学习过程建模,在确保较好可解释性的同时有效提升模型的准确性。在3个知识追踪领域公共数据集上的实验结果表明,相比DKT、动态键值记忆网络(DKVMN)、自注意力的知识追踪(SAKT)、卷积知识追踪(CKT)等深度追踪模型,SLKT模型在曲线下面积(AUC)、准确率指标评估中表现较优。

    智慧教育深度学习知识追踪学习过程建模Q矩阵

    基于文本知识增强的问题生成模型

    陈佳玉王元龙张虎
    86-93页
    查看更多>>摘要:预训练语言模型在大规模训练数据和超大规模算力的基础上,能够从非结构化的文本数据中学到大量的知识。针对三元组包含信息有限的问题,提出利用预训练语言模型丰富知识的问题生成方法。首先,利用预训练语言模型中丰富的知识增强三元组信息,设计文本知识生成器,将三元组中的信息转化为子图描述,丰富三元组的语义;然后,使用问题类型预测器预测疑问词,准确定位答案所在的领域,从而生成语义正确的问题,更好地控制问题生成的效果;最后,设计一种受控生成框架对关键实体和疑问词进行约束,保证关键实体和疑问词同时出现在问题中,使生成的问题更加准确。在公开数据集WebQuestion和PathQuestion中验证所提模型的性能。实验结果表明,与现有模型LFKQG相比,所提模型的BLUE-4、METEOR、ROUGE-L指标在WebQuestion数据集上分别提升0。28、0。16、0。22个百分点,在PathQuestion数据集上分别提升0。8、0。39、0。46个百分点。

    自然语言理解问题生成知识图谱预训练语言模型知识增强

    基于多头注意力机制融合常识知识的共情对话生成

    程腾腾姚春龙于晓强李旭...
    94-101页
    查看更多>>摘要:当前对话生成技术已取得显著进展,然而为了更好地满足人类交流的需求,研究人员开始将共情引入对话生成领域。共情作为人际交流的重要组成部分,有助于更好地理解他人的情感和感受。通过引入常识知识来加强对用户情感和处境的理解,然而目前方法对非情感知识采用统一编码以及对常识知识融合采用简单的向量拼接,导致某些常识知识特征的影响可能降低,并且各个知识之间的关联刻画模糊。为此,提出一种基于多头注意力机制融合常识知识的共情对话模型ATT-EDM。该模型对引入的5种关系(xReact、xWant、xNeed、xIntent、xEffect)进行单独编码,保留了每种常识各自的特征,并利用多头注意力机制融合常识知识,对每种知识在注意力层进行运算,以更准确地反映它们各自的影响,同时更有效地刻画各个常识知识之间的联系。在数据集EmpatheticDialogues上的实验结果表明,该模型在困惑度(PPL)、准确率和Distinct-2指标上优于基线模型,PPL降低到36。435 0,准确率和Distinct-2分别达到37。96%、3。345 5,能够生成质量更高、内容更丰富、共情能力更强的同理心响应。

    自然语言处理共情对话生成同理心注意力机制常识知识

    多尺度融合与双输出U-Net网络的行人重识别

    胡庆
    102-109页
    查看更多>>摘要:受行人姿态的多变性和行人被遮挡等因素的影响,行人重识别模型难以提取行人关键特征。为增强模型的特征表达能力,提出一种基于多尺度融合与双输出U-Net网络的行人重识别方法,旨在解决现有方法中难以提取行人关键特征、特征表达能力较低的问题。首先,提出多尺度融合的双输出U-Net网络,并对输出特征进行欧氏距离和散度距离约束;其次,设计联合损失函数,解决生成对抗网络在训练过程中不易收敛的问题,提高训练过程的收敛速度。在3个公共基准数据集上的仿真实验结果表明,相比经典特征提取网络,所提特征提取网络的平均精度均值(mAP)提升超过10%,所提行人重识别方法相比主流方法的mAP提高约2%,该方法能够增强模型的特征表达能力,提高行人重识别的准确率。

    行人重识别生成对抗网络特征提取多尺度融合联合约束

    基于持续同调的倾斜时间序列分类算法

    严银凯彭宁宁易丽莎
    110-123页
    查看更多>>摘要:针对现有时间序列分类算法对高维拓扑信息以及时序顺序信息提取能力不足等问题,提出一种基于持续同调的倾斜时间序列分类算法。该算法结合时序数据方差,将原始单变量时序数据嵌入二维点云,同时展现出周期内和周期间的时序变化;在滑动窗口划分的子区间上进行时间倾斜,将点云分解为不同结构,从而使算法适应更多的时序数据,有效捕捉时序顺序信息;利用持续同调技术在点云上构建Vietoris-Rips(VR)复形流,从不同尺度分析各个维度下孔洞数量的变化,从而提取到更全面的时序数据的拓扑结构特征,并通过计算持久性图像得到点云中的拓扑特征。在此基础上,以持久性中心表示向量作为输入,使用随机森林模型对点云进行分类。在9个UCR时间序列数据集上进行对比实验,结果显示,该算法在其中8个数据集上取得了最高的准确率,相较于其他6种传统时间序列分类算法分类准确率提高了 0。5~24个百分点,F1值提高了 0。9~23。9个百分点,表明该算法在时间序列数据分类方面具有较高的精度和良好的鲁棒性。

    时间序列时间序列分类时间倾斜持续同调持久性图