首页期刊导航|图学学报
期刊信息/Journal information
图学学报
图学学报

李华

双月刊

2095-302X

txb@cgn.net.cn txxb_2011@163.com

010-82317091

100191

北京海淀学院路37号中国图学学会学报编辑部

图学学报/Journal Journal of GraphicsCSCD北大核心CSTPCD
查看更多>>本刊是中国工程图学会主办的全国中文核心期刊和全国科技文统计用刊。本刊面向国内外公开发行,主要刊载图学专业有关图学理论与应用、图学教育理论、计算机图学与CAD、科学可视化、工业设计、图样标准化等有关方面的学术论文,重要研究成果和技术经验总结,国内外重要论著的评述和学术动态。
正式出版
收录年代

    面向大模型艺术图像生成的提示词工程研究

    王常圣
    1243-1255页
    查看更多>>摘要:随着人工智能技术在艺术领域的迅速发展,提示词驱动的艺术图像生成已变得非常流行.然而,提示词生成艺术图像的规律和方法还未被充分研究.该研究通过CLIP模型计算和专家评估对Midjourney模型生成的图像进行定量评价,并结合网络民族志的参与式观察,全面揭示提示词生成艺术图像的规律和方法.研究结果发现,随着版本的提升(Midjourney V2 到V5),Midjourney模型在美学质量方面得到显著地提升,突显了艺术家和创作者需要不断学习来适应新版本 AI 模型的重要性.为此,提出了优化的提示词公式,可快速高效地生成各种风格的高美学质量的图像.AI 模型在不同主题中表现出不同的能力,Midjourney 模型较为擅长生成油画、水彩水墨和二次元角色等,并在具象与抽象主题中表现得同样出色,而在素描和彩铅风格方面相对较弱.创作者应利用其优势风格进行图像创作.此外,还发现特定版本的优秀提示词组合可以极大提升生成图像的质量,精心设计提示词至关重要,且新版本并不一定比之前的版本更好.提示创作者需探索并积累与版本匹配的优秀提示词.该研究不仅揭示提示词生成艺术图像的规律和方法,也为创作者在 AI 艺术创作领域提供了理论和实践方面的指导.

    AI绘画提示工程CLIP模型人工智能艺术文本生成图像网络民族志

    结合Transformer与Kolmogorov Arnold网络的分子扩增时序预测研究

    刘灿锋孙浩东辉
    1256-1265页
    查看更多>>摘要:随着医辽诊断和治疗干预技术的不断进步,医学时间序列数据呈现指数级增长.人工智能(AI),尤其是深度学习在挖掘医学时间序列数据潜在信息方面展现出巨大潜力.为此,首次提出将 Transformer 与Kolmogorov arnold网络(KAN)相结合的方法,用于核酸扩增实验数据的预测分析.通过实验数据分析,证实模型在准确预测扩增趋势和终点值方面的有效性,终点值误差仅为 1.87,R-square系数为 0.98,且模型能准确识别不同样本类型的实验数据.进一步地,通过消融实验和超参数调优,深入探究模型各组成部分及其参数对预测性能的影响.最后,在 911 条临床数据上对 10 种深度学习模型进行泛化能力测试的结果表明,Transformer-KAN模型在预测准确性和泛化能力上均优于其他模型,不仅为改进大流行病常规诊断技术提供了新视角,还为进一步研究KAN模型及相应基础理论提供了实验佐证.

    深度学习时间序列预测核酸扩增检测技术Kolmogorov-Arnold网络Transformer

    基于多模态大模型的高速公路场景交通异常事件分析方法

    吴精乙景峻贺熠凡张世渝...
    1266-1276页
    查看更多>>摘要:针对现有交通异常事件检测系统无法深入感知事件的局限性,以及人工审核报警事件成本高的问题,研究了一种结合多模态大模型(MLLM)的高速公路场景交通异常事件分析方法,设计并验证了 3 种基于MLLM的任务:一是自动生成异常事件的详细工单描述,提升事件的感知深度;二是利用MLLM对报警事件进行复审,减少误报,提高检测准确性;三是基于 MLLM 生成异常事件视频描述,增强事件的可解释性.实验结果显示,基于 MLLM 的工单描述方法通过视觉指令调优数据集的构建和模型微调,提升了工单信息的完整性和准确性.报警事件复审方面,MLLM能够有效审核出由图像质量低下、虚警误报和类别错误导致的误报,降低了人工审核成本.此外,基于 MLLM 的视频描述方法通过事件视频图像的采样与描述,实现了对异常事件的高效分析,提高了事件解释性.尽管开源模型在特定场景下略逊于闭源模型,但两者均展现出对多种误报问题的审核能力,证实了 MLLM 在异常事件审核中的应用潜力.该研究为智能交通监控系统提供了新的解决方案,提高了异常事件处理的自动化水平和实用性.

    多模态大模型监控视频异常事件检测视频理解工单描述交通异常事件审核

    基于人工智能生成内容的产品造型设计与评价方法

    路鹏吴凡唐建
    1277-1288页
    查看更多>>摘要:生成式人工智能(GAI)已然成为产品设计的新质生产力,显著提高了设计效率.然而,目前尚缺乏系统的应用方法以及多类型GAI协同应用的案例.为彰显GAI对产品设计的革新作用,提出基于人工智能生成内容(AIGC)的造型设计和评价方法.首先,应用 ChatGPT 分析用户的感性需求,将其归纳为造型设计的目标意象.同时,将ChatGPT作为Midjourney的提示词生成器,以生成产品必要的提示词短语.其次,依据目标意象与必要提示词短语,利用Midjourney构建造型参考资料库,并通过感性问卷从中筛选出备选方案.然后,结合灰关联分析(GRA)和层次分析(AHP)评价备选方案,以筛选出最佳造型,并使用Rhino优化人机关系.最后,使用Stable Diffusion生成最佳造型的渲染效果.以摩托车和吸尘器为案例,对该方法进行了论证.研究发现,多类型生成式人工智能协作模式在用户意象需求分析、造型意象转化和造型细节优化方面表现突出,能够革新造型设计流程和提高设计效率.该方法为产品造型设计师提供了基于AIGC的设计方法,并建立了AIGC的量化评价方法.

    造型设计生成式人工智能设计评价灰色关联分析法层次分析法

    基于密度图多目标追踪的时空数据可视化

    宋思程陈辰李晨辉王长波...
    1289-1300页
    查看更多>>摘要:时空数据追踪的可视化问题已经受到了广泛的关注,其研究重点在于展示数据的动态细节,并确保轨迹与观测结果的一致性.为此,提出了一种融合深度学习与传统追踪技术的模型,用于执行追踪任务,从而提高可视化的速度和准确度.首先,生成一个高质量的柏林噪声数据集并在该数据集上训练了一个多目标追踪模型.其次,提出了双阶段、多模型的深度学习框架来增强对动态场景的分析深度.最后,为了能够连续地展现详尽的追踪信息,提出了一种可以增强追踪信息的视觉效果结合轨迹和矢量场的可视化解决方案.在不同的案例中展示了该方法的有用性和鲁棒性,并从多个方面进行了量化评估和比较.结果表明该方法可以帮助用户在不同场景中理解多目标追踪信息.

    照数据可视化深度学习时空数据多目标跟踪

    基于MBI-YOLOv8的煤矸石目标检测算法研究

    李珍峰符世琛徐乐孟博...
    1301-1312页
    查看更多>>摘要:为在煤矸石分拣领域实现检测性能与资源消耗的平衡,提出一种基于改进YOLOv8 的适用于低性能检测平台的高效实时轻量化目标检测算法.首先以YOLOv8n为基础网络架构,引入MobileNetv3 替换原有的主干网络,利用其轻量级结构特性降低模型参数量及运算量,提高模型检测速度;其次引入特征增强网络BIFPN模块,通过多尺度特征融合来弥补引入轻量级网络带来的检测精度损失,实现在保证检测精度的情况下完成模型轻量化;最后引入Inner-CIoU边界框回归损失函数平衡不同质量图像的训练结果,提高模型的定位能力,进一步提高检测精度及速度.为验证改进算法的有效性,进行了实验对比分析,将其与 YOLOv3-tiny,YOLOv5n,YOLOv7 以及YOLOv8n等算法在自建数据集上进行对比.实验结果表明,该算法展现出了最优的综合检测性能,在保证检测精度的前提下,其参数量降低到 1 188 725,相较于YOLOv8n减少了 60.46%,运算量由原模型的 8.1 GFLOPs降低到 2.8 GFLOPs,FPS由YOLOv8n的 86.02 Hz提升到 216.58 Hz.研究表明,该算法是一种高效实时轻量化煤矸石检测算法,综合检测性能有效提高,实现了模型检测性能与计算资源消耗的平衡,在煤矸石检测领域有较大的潜力和优越性.

    煤矸石分拣目标检测实时性YOLOv8n

    基于R-YOLOv7和MIMO-CTFNet的指针式仪表自动读数方法

    李盛涛侯立群董亚松
    1313-1327页
    查看更多>>摘要:针对现有方法中表盘关键信息提取过程繁琐、读数误差较大和相机抖动导致的运动模糊问题,提出了一种基于 R-YOLOv7 和 MIMO-CTFNet 的指针式仪表自动读数方法.首先,构建兼顾精度和轻量化的R-YOLOv7 算法实现指针式仪表表盘和表盘关键信息检测;然后,设计了MIMO-CTFNet算法以实现运动模糊仪表图像的复原;最后,利用提取的表盘关键信息进行基于小刻度线的角度法读数.实验结果表明改进后的R-YOLOv7 在表盘关键信息检测数据集上所需的参数量、FLOPs、ADT和mAP50:95 分别为 12 M个、60.30 G次、17.04 ms和 86.5%;改进后的MIMO-CTFNet算法在采集的运动模糊数据集上的PSNR和SSIM分别达到33.05 dB和 0.935 3;该读数方法的读数最大引用误差为 0.35%,需要运动模糊处理和无需运动模糊处理的图像读数时间分别为 0.561 s和 0.128 s,从而验证了该方法的有效性.

    指针式仪表R-YOLOv7MIMO-CTFNet自动读数轻量化

    基于YOLOv8的轻量化无人机图像目标检测算法

    闫建红冉同霄
    1328-1337页
    查看更多>>摘要:针对无人机图像目标像素低、背景复杂、模型部署难等问题,提出一种基于YOLOv8 的轻量级多尺度特征融合小目标检测算法.为了降低网络参数量,提高模型检测速度,使用fasternet block替换C2f的bottleneck,构建轻量化特征提取模块 FasterC2f;为了增强模型多尺度特征融合能力,设计全新的聚焦扩散特征金字塔结构,使颈部网络每层特征图都聚焦三层特征信息;设计共享卷积检测头,在优化模型参数量的同时,让每个检测头都包含不同尺度特征信息;重构小目标检测网络,采用更大尺度的三层检测头,提高模型对小目标的特征学习能力.在 Visdrone 数据集上的实验结果表明,与 YOLOv8s 相比,该模型的精确率、召回率和mAP分别提高了 5.1%,5.4%和 6.6%,参数量降低了 68%,模型文件体积减少了 15.3 MB,FPS提高了 16%,表明该模型具有检测精度高、检测速度快、模型易部署等优点.

    YOLOv8无人机小目标检测轻量化特征融合

    基于观察质量场的虚拟对象协同操作方法

    栾帅吴健樊润泽王莉莉...
    1338-1348页
    查看更多>>摘要:在虚拟现实(VR)中,对象操作是关键的交互方式.特别是在协作VR应用中,执行高效且准确地操作是非常重要的.然而,传统的协作操作技术未能充分考虑到与操作相关的对象、目标以及环境动态之间的相互作用,并且未提供有效地指导以帮助用户在操作时选择最佳视点.为了解决这一问题,引入了一种基于观察质量场(OQF)的新型协作操作技术,旨在提高操作的准确性和效率.并根据用户的观察质量分数,引导其选择最合适的视角,以实现更加高效和协调的对象操控.首先介绍OQF的概念及其构建方法,并提出 2 种策略加速OQF更新过程,随后提出了一种利用OQF的指导来操作物体的协同操作方法.通过在 3 种不同的虚拟环境:客厅、仓库和管道场景中进行的含 36 名参与者的用户研究,评估了其操作效率和准确性.结果表明,与传统方法相比,OQF技术显著减少了任务完成时间、位置误差、旋转误差和任务负荷.

    虚拟现实协作对象操作观察质量场人机交互

    虚拟现实中场景和时间对用户空间方向认知的影响

    任洋甫于歌傅月瑶胥森哲...
    1349-1363页
    查看更多>>摘要:方向感是用户通过观察或漫游场景,根据个人感知建立心理地图,并理解和判断地图信息,产生对方向、角度、距离等信息判断的能力.在心理学和医学等领域,大量研究表明方向感由空间记忆、空间感知、空间想象等多重因素影响.在虚拟环境中,用户同样依赖这种能力判断方向,利用虚拟设备获取场景信息.本研究主要讨论用户如何通过空间记忆、感知与想象等能力在虚拟场景中判断方位.研究定义了用户的方向感度量包括准确率和效率 2 个方面,其中准确率是用户与目标朝向和位置的角度误差和距离误差,效率是用户判断方向的决策时间和到达目标的移动时间,通过 6 个实验,旨在探究视觉场景差异对用户方向感的影响.实验结果显示:①视觉信息是虚拟现实(VR)中用户判断方向的重要依据;②在场景结构相似的前提下,较小空间和较多物品的设置能够提升用户的方向感;③在视觉范围不变的前提下,场景风格的变化对用户方向感的影响较小.另外,用户方位判断的准确率还受到决策时间和移动时间的影响,其中移动时间的影响更为显著,而决策时间则影响相对较小.本研究的发现有助于VR场景构建、度量用户方向感、以及优化场景布局和提高用户导航能力.

    虚拟现实方向感角度距离时间空间认知