首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于正则模糊划分的模糊系统及其逼近性质

    彭小玉潘小东申涵寒何红梅...
    79-86页
    查看更多>>摘要:文中讨论了带有不同模糊基函数的模糊系统的逼近问题.首先,基于一维正则模糊划分和重叠函数建立多维正则模糊划分,以划分中的元素为模糊基函数设计模糊系统,应用Weierstrass逼近定理证明了该模糊系统是通用逼近器,给出了模糊系统的逼近误差界.其次,提出了多项式型、指数型和对数型模糊系统,并给出了带有隶属函数参数的逼近误差界.最后,通过数值实验对不同模糊系统的逼近能力进行了比较,实验结果进一步验证了理论分析的正确性.

    模糊系统正则模糊划分模糊基函数重叠函数逼近误差界

    基于异常检测的标签噪声过滤框架

    许茂龙姜高霞王文剑
    87-99页
    查看更多>>摘要:噪声是影响机器学习模型可靠性的重要因素,而标签噪声相比特征噪声对模型训练更具决定性的影响.噪声过滤是处理标签噪声的一种有效方法,它不需要估计噪声率,也不需要依赖任何损失函数,然而 目前大多数标签噪声过滤算法都会面临过度清洗问题.针对此问题,文中提出了基于异常检测的标签噪声过滤框架,并在此框架下给出了一种自适应近邻聚类的标签噪声过滤算法AdNN(Label Noise Filtering via Adaptive Nearest Neighbor Clustering).该算法分别考虑分类问题中的每一个类别,把标签噪声检测问题转化成离群点检测问题,识别出每一个类别的离群点,然后根据相对密度去除离群点中的非噪声样本,得到噪声备选集,最后通过噪声因子对噪声备选集中的离群点进行噪声识别和过滤.实验结果表明,在合成数据集和公开数据集上,所提噪声过滤方法可以减轻过度清洗现象,同时能够得到很好的噪声过滤效果和分类预测性能.

    标签噪声过滤离群点检测自适应k近邻相对密度噪声因子

    基于Lp范数的非负矩阵分解并行优化算法

    黄路路唐舒宇张伟代祥光...
    100-106页
    查看更多>>摘要:非负矩阵分解算法可以从高维数据中提取出低维和稀疏的有用信息,是处理图像聚类、数据压缩和特征提取等问题的重要手段.传统非负矩阵分解算法大多采用欧几里得距离来度量重构误差,尽管其在许多任务中已经显示出有效性,但在解决实际应用问题时仍面临着聚类效果欠佳、收敛速度慢、稳定性较差等问题.为解决这些问题,文中采用Lp范数作为非负矩阵分解的损失函数,通过调节系数p来获得更好的聚类结果.基于协同优化理论和Majorization-Minimization算法,使用粒子群优化算法来并行求解基于Lp范数的非负矩阵分解问题,并在多个真实数据集上验证了所提方法的可行性和有效性.实验结果表明所提算法明显提升了程序的执行效率且一系列评价指标均优于传统非负矩阵分解算法.

    非负矩阵分解Lp范数聚类并行优化收敛速度

    基于深度学习的图像分割综述

    黄雯珂滕飞王子丹冯力...
    107-116页
    查看更多>>摘要:图像分割是计算机视觉中的一项基本任务,其主要目的是从图像输入中提取有意义和连贯的区域.多年来,图像分割领域已经开发出了各种各样的技术,包括基于传统方法,以及利用卷积神经网络的最新图像分割技术.随着深度学习的发展,更多的深度学习算法也被应用到图像分割任务中.特别地,近两年学者对深度学习的兴趣高涨,涌现了许多应用于图像分割任务的深度学习算法.然而大部分新的算法还没有被归纳分析,这将不利于后续研究的进行.文中对近两年发表的基于深度学习的图像分割研究进行了全面回顾.首先对图像分割的常用数据集进行简要介绍,然后阐明了基于深度学习的图像分割的新分类,最后讨论了现有的挑战并对今后的研究方向进行了展望.

    图像分割语义分割深度学习网络结构监督学习

    无监督单目深度估计研究综述

    蔡嘉诚董方敏孙水发汤永恒...
    117-134页
    查看更多>>摘要:深度估计作为三维重建、自动驾驶和视觉SLAM等领域中的关键环节,一直是计算机视觉领域研究的热点方向,其中无监督学习的单目深度估计技术由于具有方便部署、计算成本低等优点,受到了学术界和工业界的广泛关注.首先梳理了深度估计的基本知识及研究现状,简要介绍了基于参数学习、基于非参数学习、基于有监督学习、基于半监督学习和基于无监督学习的深度估计的优势与不足;其次全面总结了基于无监督学习的单目深度估计研究进展,按照结合可解释性掩膜、结合视觉里程计、结合先验辅助信息、结合生成式对抗网络和实时轻量级网络这五大类对无监督学习的单目深度估计进行归纳和总结,对典型的框架模型进行了介绍和分析;然后,介绍了基于无监督学习的单目深度估计在医学、自动驾驶、农业、军事等领域的应用;最后,简单介绍了用于无监督深度估计的常用数据集,提出了基于无监督学习的单目深度估计未来研究方向,并对这个快速发展领域中的各方向研究进行了展望.

    计算机视觉深度学习无监督学习单目深度估计

    基于自注意力机制和多尺度输入输出的医学图像分割算法

    丁天舒陈媛媛
    135-141页
    查看更多>>摘要:更精细化的糖尿病性视网膜病变眼底图像分割结果,可以更好地辅助医生进行诊断.大规模高分辨率的分割数据集的出现,为更精细化的分割提供了有利条件.基于U-Net的主流分割网络,使用基于局部运算的卷积操作进行像素预测时无法充分挖掘全局信息,网络模型采用单输入单输出的结构,难以获取多尺度特征信息.为了最大程度地利用现有的大规模高分辨率的眼底图像病灶分割数据集,实现更精细化的分割,需要设计更好的分割方法.文中基于自注意力机制和多尺度输入输出结构对U-Net进行改造,提出了一种新的分割网络SAM-Net,用 自注意力模块代替传统卷积模块,增大网络获取全局信息的能力,引入多尺度输入和多尺度输出结构,使网络更容易获取多尺度特征信息.使用图片切片方法来缩小模型的输入尺寸,防止神经网络模型因为输入图片像素过大而导致训练难度增大.最终在IDRiD数据集和FGADR数据集上进行实验,结果表明,SAM-Net可以达到比其他方法更优的性能.

    U-Net自注意力机制糖尿病性视网膜病变分割神经网络

    结合注意力机制的多重引导点云配准网络

    刘旭珩柏正尧许祝杜佳锦...
    142-150页
    查看更多>>摘要:针对点云配准过程中仅仅利用点云特征寻求对应关系使得离群点多、配准精度不高的问题进行研究,提出了一种使用点云之间匹配点概率矩阵和点云空间信息特征矩阵共同搜寻对应关系,并且相互配合确定对应点权重的点云配准网络——AMGNet.首先使用点云特征提取网络获得两片待配准点云的高维特征;然后采用Transformer对独立特征进行上下文信息融合,之后利用关键点提取模块选取出特征更强的点,使用SoftBBS方法获得点云匹配点概率矩阵后,结合点云空间特征矩阵搜索到最终的对应关系,同时,权重分配也使用了双重矩阵共同决定的策略;最后使用奇异值分解获得需要的刚性变换矩阵.在ModelNet40,7Scenes等人工合成数据集和真实场景数据集上进行了多次实验.结果表明,在ModelNet40目标未知实验中的旋转矩阵和平移向量的均方误差分别降低至0.025和0.004 6.AMGNet配准精度较高,抗干扰能力强,泛化能力强.

    点云配准注意力机制多重矩阵引导加权SVD

    基于扩张卷积条件生成对抗网络的红外小目标检测

    张国栋陈志华盛斌
    151-160页
    查看更多>>摘要:基于深度神经网络的 目标检测方法凭借自身强大的建模能力,在通用 目标检测任务中取得了良好的表现.然而,在红外小目标信号弱、像素小的本质特征的影响下,深度神经网络层次的加深和池化操作的大量使用导致小目标语义信息丢失,使得现有方法的检测效果并不理想.文中从红外小 目标特性这一关键问题出发,提出了一种新颖的基于扩张卷积条件生成对抗网络的 目标检测算法.所提方法应用扩张卷积设计了生成网络,充分利用上下文信息建立层与层之间的关联,将红外小 目标更多的语义信息保留到深层网络中,增强目标特征,进而提高检测性能.此外,设计了融合通道与空间维度的混合注意力模块,在特征提取时有选择性地放大目标信息,抑制背景信息;设计了 自注意关联模块处理层与层之间信息融合过程中产生的语义冲突问题.文中使用多种评价指标将所提网络模型与 目前先进的其他红外小目标检测方法进行对比,证明了该方法在复杂背景下目标检测性能的优越性.在公开的SIRST数据集上,所提模型的F分数为64.70%,相比传统方法提高了 8.29%,相比深度学习方法提高了 7.29%;在公开的ISOS数据集上,所提模型的F分数为64.54%,相比传统方法提高了 23.59%,相比深度学习方法提高了 6.58%.

    红外小目标检测条件生成对抗网络特征融合注意力机制扩张卷积

    基于层次化Conformer的语音合成

    吴克伟韩超孙永宣彭梦昊...
    161-171页
    查看更多>>摘要:语音合成需要将输入语句的文本转换为包含音素、单词和语句的语音信号.现有语音合成方法将语句看作一个整体,难以准确地合成出不同长度的语音信号.通过分析语音信号中蕴含的层次化关系,分别设计基于Conformer的层次化文本编码器和基于Conformer的层次化语音编码器,并提出了 一种基于层次化文本-语音Conformer的语音合成模型.首先,该模型根据输入文本信号的长度,构建层次化文本编码器,包括音素级、单词级、语句级文本编码器3个层次,不同层次的文本编码器描述不同长度的文本信息;并使用Conformer的注意力机制来学习该长度信号中不同时间特征之间的关系.利用层次化的文本编码器,能够找出语句中不同长度需要强调的信息,有效实现不同长度的文本特征提取,缓解合成的语音信号持续时间长度不确定的问题.其次,层次化语音编码器包括音素级、单词级、语句级语音编码器3个层次.每个层次的语音编码器将文本特征作为Conformer的查询向量,将语音特征作为Conformer的关键字向量和值向量,来提取文本特征和语音特征的匹配关系.利用层次化的语音编码器和文本语音匹配关系,可以缓解不同长度语音信号合成不准确的问题.所提模型的层次化文本-语音编码器可以灵活地嵌入现有的多种解码器中,通过文本和语音之间的互补,提供更为可靠的语音合成结果.在LJSpeech和LibriTTS两个数据集上进行实验验证,实验结果表明,所提方法的梅尔倒谱失真小于现有语音合成方法.

    语音合成文本编码器语音编码器层次化模型Conformer

    基于全局与局部特征的二阶段文档图像可见水印去除模型

    赵江锋和红杰陈帆杨树斌...
    172-181页
    查看更多>>摘要:可见水印是一种常用的数字图像版权保护手段.分析可见水印去除结果可以验证图像上水印的有效性,并为水印设计者提供设计或添加水印的参考和启发.目前,大多数的水印去除方法都是基于自然图像的研究,而文档图像在生活中也被广泛使用,但由于缺乏公开的文档图像去水印数据集,相关文档图像的水印去除研究较少.为了探究水印去除方法在文档图像上的水印去除效果,构建了一个文档图像水印去除数据集(SDIWRD).在对文档图像可见水印去除的研究中发现,使用已有的水印去除方法得到的水印去除结果中容易留下水印主体伪影或者轮廓伪影.为了解决这个问题,提出了一种基于全局与局部特征的二阶段文档图像可见水印去除模型(RWRNet),该模型采用由粗到细的二阶段的半实例归一化编解码器架构.在粗略阶段,使用全局与局部特征提取模块增强对全局空间特征的捕捉能力,同时保留对局部细节信息的提取能力,从而帮助进行水印去除;在细化阶段,细化网络共享粗略阶段权重,并构建循环特征融合模块来充分挖掘粗略阶段编解码器的重要特征,为细化阶段提供丰富的上下文信息,帮助进行细致的水印去除.此外,还结合了结构相似性损失来帮助获取更好的视觉质量.所提方法在SDIWRD数据集上进行了实验,实验结果显示PSNR达到了 41.21dB,SSIM达到了 99.07%,RMSE降低至3.64,优于现有水印去除方法.另外也在公开的CLWD彩色水印去除数据集进行了实验,实验结果显示PNSR达到了 39.31dB,SSIM达到98.81%,RMSE降低至3.50,也优于现有水印去除方法.实验结果证明了所提方法具有良好的泛化性和去水印的能力,能有效减轻水印伪影.最后还提出了一些防止水印去除的建议,在相关网站1)可公开访问所提出的方法和数据集.

    可见水印水印去除全局与局部特征提取循环特征融合文档图像