首页期刊导航|中国图象图形学报
期刊信息/Journal information
中国图象图形学报
中国图象图形学报

李小文

月刊

1006-8961

jig@irsa.ac.cn

010-64807995 8261442

100101

北京9718信箱

中国图象图形学报/Journal Journal of Image and GraphicsCSCD北大核心CSTPCD
查看更多>>本刊是集计算机图象图形高科技理论与应用研究成果、成果产品化与商情动态于一体的综合性学术期刊。是核心期刊、权威性杂志。作为中国图象图形学学会的会刊,利用学会在国内外广泛的科技信息渠道、全方位多层面的学科交叉应用,积极向产业界宣传科技成果,热心向科技界推荐最新产品。
正式出版
收录年代

    视觉Transformer与多特征融合的脑卒中检测算法

    赵琛琦王华虎赵涓涓冀伦文...
    923-934页
    查看更多>>摘要:目的 急性缺血性卒中是最常见的脑卒中类型,具有发病率高、死亡率高和致残率高的特点.患者发病前症状不明显、发病急骤以及溶栓治疗时间窗窄等问题导致其成为临床上的高危疾病.中医望诊可以在疾病发展早期,通过观察患者形、色、气和神的变化,对患者病情进行诊断和预测,达到"治未病"的目的,与人工智能技术相结合,可以解决缺乏客观和定量评价标准的问题.因此,通过中医望诊中的脸部和手部图像,充分利用两种图像的颜色、纹理等特征以及二者之间的关系特征,本文提出一种基于序列自注意力网络的急性缺血性卒中辅助诊断方法.方法 对脸部和手部图像进行山根和大鱼际处的感兴趣区域提取.采用YCbCr颜色空间和灰度共生矩阵,提取区域图像的颜色和纹理特征,将颜色特征和纹理特征进行融合并将其与原图像特征相结合,得到的特征图序列化地输入到Transformer模型中,进一步学习高层次的空间特征和注意力特征.将模型输出结果输入到多层感知机中,从而实现急性缺血性卒中的检测.结果 在收集的急性缺血性卒中患者数据集上进行实验,结果表明,提出的基于序列自注意力网络的方法取得了83.57% 的准确率,获得较高性能,在速度和便携性上具有很大的优势.结论 该方法采用端到端的学习方式,能够有效解决目前临床诊断因医疗资源的差异而受到影响的问题,对于初步判断患者疾病具有指导性的作用,为诊断急性缺血性卒中提供了一种新思路和新方法.

    中医望诊特征提取特征融合端到端Transformer

    多分支深度特征融合的中医脑卒中辅助诊断

    王麒达冀伦文强彦王华虎...
    935-947页
    查看更多>>摘要:目的 脑卒中发病征兆不明显,发病速度快且致死率高,目前医学领域的主要诊疗手段仍是针对脑卒中病时和病后,但在病前预测方面缺少有效办法.中医对于治未病等效果显著,其中望诊更是中医诊疗的重要方式.本文结合中医望诊,基于面部与手部图像提出了一种多分支深度特征融合的中医脑卒中辅助诊断方法.方法 针对不同部位图像,分别构建两部位的双分支特征提取模块,将面部和手部的重点区域作为主体分支提取主要特征.根据中医望诊在面部与手部诊疗的特点,进一步将眉心的纹理特征和掌心的颜色特征作为辅助信息提取辅助特征;在此基础上提出信息交互模块(information interaction module,IIM),将主要特征与辅助特征进行有效信息交互,从而辅助主体分支提取更有区别性的信息;最终将两部位的特征进行融合降维用于脑卒中辅助诊断.结果 本文将采集的3011例面部和手部图像数据进行筛查扩充后作为实验数据集,并在不同评价指标下与当前主流的分类模型进行对比.实验结果表明,本文方法在准确性上达到了83.36%,相比ResNet-34、DenseNet121、VGG16(Vis-ual Geometry Group 16-layer net)和InceptionV3等其他主流分类模型性能提高了3%7%;在特异性和敏感性方面分别为82.47% 和85.10%,其效果优于对比方法.结论 本文方法能够有效结合中医望诊的诊疗经验并通过传统面部和手部图像实现对脑卒中的有效预测,为中医望诊在脑卒中方面的客观化和便捷化发展提供了帮助.

    中医望诊脑卒中图像识别特征提取特征融合卷积神经网络

    多区域融合注意力网络模型下的核性白内障分类

    章晓庆肖尊杰东田理沙陈婉...
    948-960页
    查看更多>>摘要:目的 核性白内障是主要致盲和导致视觉损害的眼科疾病,早期干预和白内障手术可以有效改善患者的视力和生活质量.眼前节光学相干断层成像图像(anterior segment optical coherence tomography,AS-OCT)能够非接触、客观和快速地获取白内障混浊信息.临床研究已经发现在AS-OCT图像中核性白内障严重程度与核性区域像素特征,如均值存在强相关性和高可重复性.但目前基于AS-OCT图像的自动核性白内障分类工作较少且分类结果还有较大提升空间.为此,本文提出一种新颖的多区域融合注意力网络(multi-region fusion attention network,MRA-Net)对AS-OCT图像中的核性白内障严重程度进行精准分类.方法 在提出的多区域融合注意力模型中,本文设计了一个多区域融合注意力模块(multi-region fusion attention,MRA),对不同核性区域特征表示进行融合来增强分类结果;另外,本文验证了以人和眼为单位的AS-OCT图像数据集拆分方式对核性白内障分类结果的影响.结果 在一个自建的AS-OCT图像数据集上结果表明,本文模型的总体分类准确率为87.78%,比对比方法至少提高了1%.在10种分类算法上的结果表明:以眼为单位的AS-OCT数据集优于以人为单位的AS-OCT数据集的分类结果,F1和Kappa评价指标分别最大提升了4.03%和8%.结论 本文模型考虑了特征图不同区域特征分布的差异性,使核性白内障分类更加准确;不同数据集拆分方式的结果表明,考虑到同一个人两只眼的核性白内障严重程度相似,建议白内障的AS-OCT图像数据集拆分以人为单位.

    核性白内障分类眼前节光学相干断层成像图像(AS-OCT)多区域融合注意力模块深度学习核性区域

    面向高度近视条纹损伤的深监督特征聚合网络

    谭晓刁逸超陈新建石霏...
    961-972页
    查看更多>>摘要:目的 条纹状损伤是高度近视向病理性近视发展过程中的一种重要眼底改变.临床研究表明,在无创的眼底光学相干断层扫描(optical coherence tomography,OCT)图像中,条纹状损伤主要表现为视网膜色素上皮层—Bruch's膜—脉络膜毛细血管复合体(retinal pigment epithelium-Bruch's membrane-choriocapillario complex,RBCC)损伤,具体包括RBCC异常和近视牵引纹.由于OCT图像中条纹损伤存在目标小、边界模糊等问题,其自动分割极具挑战性.本文提出了一种基于特征聚合下采样和密集语义流监督的特征融合分割网络(deep-supervision and fea-ture-aggregation based network,DSFA-Net),用于实现OCT图像中条纹损伤的自动分割.方法 为减少网络参数量,DSFA-Net以通道减半的U-Net为基准网络,在编码器路径中设计并嵌入特征聚合下采样模块(feature aggregation pooling module,FAPM),使得网络在下采样过程中保留更多的上下文和局部信息,在解码器路径中设计并嵌入一种新的深监督模块——密集语义流监督模块(dense semantic flow supervision module,DSFSM),使得网络在解码过程中聚合不同分辨率图像之间的细节和语义信息.结果 方法在上海市第一人民医院提供的751幅2维眼底OCT B扫描图像上进行验证与评估.相比于U-Net,本文方法在参数量降低53.19%的情况下,平均Dice相似系数(Dice similarity coefficient,DSC)、Jaccard和敏感度指标分别提高了4.30%、4.60%和2.35%.与多种较流行的语义分割网络相比,本文网络在保持最小网络参数量的同时,分割性能取得了较明显提升.为了更加客观地评估FAPM与DSFSM模块的性能,本文同时进行了一系列消融实验.在基准网络添加FAPM模块后,平均DSC、Jaccard和敏感度指标分别提高了1.05%、1.35%和3.35%.在基准网络添加DSFSM模块后,平均DSC、Jaccard和敏感度指标分别提高了4.90%、5.35%和5.90%.在基准网络添加FAPM与DSFSM模块后,平均DSC、Jaccard和敏感度指标分别提高了6.00%、6.45%和5.50%.消融实验的结果表明,本文提出的DSFSM和FAPM模块可以有效提升网络的分割性能.结论 本文提出的DSFA-Net提升了眼底OCT图像中条纹损伤的分割精度,具备潜在的临床应用价值.

    高度近视条纹损伤光学相干断层扫描(OCT)深监督特征聚合卷积神经网络(CNN)医学图像分割

    结合目标检测与匹配修正的手腕骨兴趣区域提取

    毛科技汪敏豪陈立建陆伟...
    973-987页
    查看更多>>摘要:目的 在骨龄智能评估研究中,如何准确地提取手腕参照骨的兴趣区域(region of interest,ROI)是保证骨龄精确评估的关键.基于传统深度学习的方法用于手腕骨ROI提取,存在个别参照骨漏判、误判等情况,导致平均提取准确率较低.本文结合目标检测强大的定位和识别能力,以准确提取所有手腕骨ROI为目的,提出了一种参照骨自动匹配与修正方法.方法 针对不同参照骨形状、位置等特征表现出的规律性和关联性,本文采集了大量不同性别、不同年龄段的人手腕图谱作为参照骨样本匹配,然后分多个阶段提取参照骨ROI:1)基于目标检测算法初步提取出所有参照骨候选ROI,并根据一定的阈值剔除置信度较低的区域;2)结合参照骨的大数据样本构建位置点匹配模型,对剔除区域进行自动匹配与填补,保证ROI提取的完整性;3)通过多尺度滑动窗口以及ROI分类模型,对填补得到的ROI位置进行滑动修正,进一步保证提取准确率.结果 实验结果表明,本文结合目标检测与匹配修正的方法优于现有绝大多数方法.其中,匹配修正方法在目标检测算法的提取结果基础上,提升了约1.42%的平均准确率,当结合Faster R-CNN(region-convolutional neural network)算法时能达到最高98.45%的交并比(intersec-tion-over-union,IoU)准确率.结论 本文方法利用手腕骨的位置特征,对个别提取困难的参照骨类型进行重新匹配与修正,有效地弥补了传统方法泛化能力不足的缺点.本文方法能够同时面向人手腕中所有参照骨ROI提取,具备良好的扩展性和易操作性.

    兴趣区域(ROI)目标检测位置匹配大数据滑动窗口

    面向旷场实验视频分类的特征拼接矩阵学习方法

    肖照林杨志林刘欢金海燕...
    988-1000页
    查看更多>>摘要:目的 旷场实验(open field test,OFT)是行为学与药理实验分析中常用的实验方法.为了对比测试组和参考组被测小鼠的行为特征差异,通常需要耗费大量精力对旷场实验数据进行处理和观测.由于旷场实验数据量大且较依赖观测人员的主观判断,导致对小鼠行为差异观测的精度较低且缺乏量化评价指标.为此,本文提出一种基于卷积神经网络(convolutional neural networks,CNN)的旷场实验视频分类方法,可基于量化特征对两组小鼠的行为差异自动分类.方法 从视频空域和时域中提取22维的小鼠运动行为特征,经过量化后生成特征矩阵,进而以矩阵拼接方式构造可学习的行为特征矩阵样本,利用不同结构卷积神经网络对提取的行为特征矩阵样本进行训练和分类,并分析网络结构对分类结果的影响,在实现两组小鼠分类的基础上,对不同维度小鼠行为特征对分类精度的重要性进行评价.结果 在真实旷场实验数据集上的实验分析表明,本文算法的分类准确率为99.25%.此外,由实验结果分析发现小鼠的大角度转向频次、停留区域与时间对小鼠分类的重要性高于其他维度特征.结论 提出的特征拼接矩阵学习方法能够准确识别两组小鼠旷场实验视频的差异,本文方法的分类准确率明显优于现有人工分析及经典机器学习方法.

    旷场实验(OFT)行为分析视频分类特征拼接矩阵卷积神经网络(CNN)

    基于图像的介入器械前端变形建模与受力估计

    任龙飞孟偲刘博白相志...
    1001-1008页
    查看更多>>摘要:目的 血管介入手术中介入器械与血管壁之间的接触力对手术安全有着重要意义,然而目前缺乏直接测量器械前端与血管壁接触力的传感器和有效手段.为解决这一难题,本文提出了一种通过图像观察器械前端变形程度从而估计器械与血管壁接触力的方法.方法 通过模拟血管介入手术过程来获取介入器械导丝的变形量和与之相对应的力,从而对介入器械前端接触力与变形量关系进行建模.将介入器械前的端接触力分为垂直于接触面方向的力和沿着接触面方向的力并分别加以处理;使用介入器械前端变形段的最大曲率变化量描述器械变形量,通过图像观察导丝变形来计算导丝的最大曲率.为求解最大曲率,使用器械上3个点构成的三角形并求其外接圆曲率来表示这3点所在段的曲率,在介入器械前端进行依次遍历求取最大值以获得最大曲率.通过实验分析验证介入器械受力与最大曲率之间的关系.结果 实验表明介入器械前端的接触力与器械前端最大曲率变化率之间存在着映射关系,且这种关系能用函数表达式准确地表达出来,通过函数式来预测受力的平均误差在10%以内.结论 研究表明,通过图像分析导丝前端的变形量、估计导丝前端接触力,进而判断血管手术过程中介入器械与血管壁的接触状态的方法是可行的,所计算的导丝前端受力能为手术过程提供参考信息.

    血管介入手术介入器械接触力介入器械变形量导丝图像最大曲率