期刊,电子学报 2024年卷10期_国家学术搜索

期刊信息/Journal information

电子学报

中国电子学会

主办单位：中国电子学会

主　　编：王守觉

出版周期：月刊

国际刊号：0372-2112

电子邮箱：new@ejournal.org.cn;wanghui@ejournal.net.cn

电　　话：010-68279116，68285082

邮政编码：100036

地　　址：北京165信箱

电子学报/Journal Acta Electronica SinicaCSCD北大核心CSTPCDEI

查看更多>>1962年创刊，中国电子学会主办的高级学术月刊。刊登电子与信息及相关领域代表我国研究水平的最新科研成果和技术进展。本刊为中国自然科学核心期刊之一；科技部科技论文统计源期刊；中国科学引文数据库来源期刊。获2000年首届国家期刊奖以及2000年国家自然科学基金重点学术期刊专项基金资助。现被五个大型检索机构（Ei、Sci-Expanded、SA、苏联文摘杂志(рж)和日本科技文献速报）作为固定收录对象。

正式出版

收录年代

连续与离散变量协同分析的非平稳非高斯工业过程异常检测

蔡美玲罗迪肖敬日李婧妍...

3291-3300页

查看更多>>摘要：工业过程数据涵盖离散和连续变量,它们之间内在的统计分布特性是揭示系统运行状况的关键.然而,现有的监测模型多聚焦于高斯假设下的连续过程变量,忽略了离散变量、连续变量的多模分布特性以及数据中的噪声、离群点对模型的影响,难以精准反映数据的真实分布特性,对非高斯、非平稳过程的异常检测效果欠佳.因此,本文提出一种鲁棒的工业过程异常检测方法——连续和离散变量协同分析的变分贝叶斯混合判别方法(Continuous and Discrete Variables-Concurrent Analysis-based Variational Bayesian Mixture Discriminant,CDVCA-VBMD).通过构建基于变分贝叶斯推断的面向连续变量的混合学生分布模型与面向离散多变量的混合多项分布模型,有效解决过程变量非高斯分布特性难以有效提取的问题,实现了过程变量复杂相关性的高效处理与分析;同时,在过程监测中引入了持续学习的理念,确保对非平稳时变工业过程异常的有效检测.以数值仿真系统和田纳西·伊斯曼过程为例,进行了大量验证性和对比性实验.结果表明,CDVCA-VBMD能准确估计非平稳工业过程多变量的混合多模分布特性,并对数据中的噪声和离群点具有较强的鲁棒性,从而实现工业异常的准确检测,为非高斯复杂工业过程的长期、鲁棒监测提供了有力支持.

关键词：

混合学生分布混合多项分布非平稳过程非高斯过程变分贝叶斯推断持续学习

原文链接:

维普
万方数据

面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法

杨赟辉程虎魏敬和刘国柱...

3301-3311页

查看更多>>摘要：基于Transformer的大语言模型(Large Language Models,LLM)和视觉Transformer(Vision Transformers,ViTs)分别在自然语言处理、机器视觉任务上实现了最为先进的性能.但是ViTs和LLM的常用激活函数GELU(Gauss-ian Error Linear Unit)、Swish在Transformer全量化推理中存在精度不足、计算效率低的问题,限制了它们在资源受限的边缘端设备上的部署和应用.本文提出了一种基于分段二次多项式拟合的激活函数高精度近似计算方法(Segmented Quadratic Polynomial Fitting,SQPF)及其量化推理过程,以实现端侧非线性激活函数的高性能部署.SQPF采用最小二乘法和粒子群优化方法求解非线性激活函数拟合优化问题,给出最优的二次多项式拟合系数和区间划分.得到的二次多项式拟合采用动态精度定点对称量化方法进行纯整数推理,推理过程仅包含移位操作和乘加运算.本文使用SQPF计算了GELU和Swish的二次多项式拟合Si-GELU和Si-Swish,并评估了量化推理精度.实验结果表明,在标准数据集ImageNet上,Si-GELU引起的ViTs(ViT、DeiT和Swin)模型分类任务准确率衰减仅为0.09%,是其他同类方法的27.3%;在主流的大语言模型评测数据集MMLU上,Si-Swish引起的子类别精度衰减不超过0.77%,大类别精度衰减不超过0.23%.极小的精度损失表明SQPF计算得到的最优分段二次多项式拟合可以直接替换Transformer模型中全精度浮点激活函数,不必进行参数微调或者重训练.

关键词：

Transformer全量化推理GELU函数Swish函数分段二次多项式拟合

原文链接:

维普
万方数据

基于因果干预的无偏面部动作单元识别

邵志文陈必宽祝汉城周勇...

3312-3321页

查看更多>>摘要：面部动作单元(Action Unit,AU)识别是计算机视觉与情感计算领域的热点课题.AU识别属于多标签二分类任务,目前面临着标签不均衡等挑战.现有的主流算法利用AU之间的关联,通过调整采样率和AU的权重来进行标签重均衡化.然而,这些方法仅仅使模型预测时从偏向出现频率高的标签转为偏向出现频率低的标签,并未解决偏置问题.根据出现频率的高低可将AU划分为头类和尾类,公平对待每一类是实现AU无偏识别的关键.本文引入因果推理理论,提出基于因果干预的无偏化方法(Causal Intervention for Unbiased facial action unit recognition,CIU),以解决多AU间不均衡的问题.通过调整不平衡域和平衡但不可见域上的经验风险实现模型的无偏性.大量实验结果表明,本方法在基准数据集BP4D、DISFA上超越已有的方法,其中在DISFA上超越当前最先进方法1.1%,且可以学习到无偏的特征表示.

关键词：

因果推理无偏性面部动作单元识别多标签二分类标签不均衡经验风险

原文链接:

维普
万方数据

基于优先填补策略的Spark数据均衡分区方法

何玉林吴东彤Philippe Fournier-Viger黄哲学...

3322-3335页

查看更多>>摘要：Spark作为基于内存计算的分布式大数据处理框架,运行速度快且通用性强.在任务计算过程中,Spark的默认分区器HashPartitioner在处理倾斜数据时,容易产生各个分区数据量不平衡的情况,导致资源利用率低且运行效率差.现存的Spark均衡分区改进方法,例如多阶段分区、迁移分区和采样分区等,大多存在尺度把控难、通信开销成本高、对采样过度依赖等缺陷.为改善上述问题,本文提出了一种基于优先填补策略的分区方法,同时考虑了样本数据和非样本数据的分配,以便实现对全部数据的均衡分区.该方法在对数据采样并根据样本信息估算出每个键的权值后,将键按照权值大小降序排列,依次将键在满足分区容忍度的条件下分配到前面的分区中,为未被采样的键预留后面的分区空间,以获得针对样本数据的分区方案.Spark根据分区方案对样本中出现的键对应的数据进行分区,没有出现的键对应的数据则直接映射到可分配的最后一个分区中.实验结果表明,新分区方法能够有效实现Spark数据的均衡分区,在美国运输统计局发布的真实航空数据集上,基于该方法设计的优先填补分区器的总运行时间比Hash-Partitioner平均缩短了15.3%,比现有的均衡数据分区器和哈希键值重分配分区器分别平均缩短了38.7%和30.2%.

关键词：

均衡分区优先填补策略数据倾斜Spark算子大数据

原文链接:

维普
万方数据

基于关系感知和标签消歧的细粒度面部表情识别算法

刘雅芝许喆铭郎丛妍王涛...

3336-3346页

查看更多>>摘要：细粒度表情识别任务因其包含更丰富真实的人类情感而备受关注.现有面部表情识别算法通过提取局部关键区域等方式学习更优的图像表征.然而,这些方法忽略了图像数据集内在的结构关系,且没有充分利用标签间的语义关联度以及图像和标签间的相关性,导致所学特征带来的性能提升有限.其次,现有细粒度表情识别方法并未有效利用和挖掘粗细粒度的层级关系,因而限制了模型的识别性能.此外,现有细粒度表情识别算法忽略了由于标注主观性和情感复杂性导致的标签歧义性问题,极大影响了模型的识别性能.针对上述问题,本文提出一种基于关系感知和标签消歧的细粒度面部表情识别算法(fine-grained facial expression recognition algorithm based on Relationship-Awareness and Label Disambiguation,RALD).该算法通过构建层级感知的图像特征增强网络,充分挖掘图像之间、层级标签之间以及图像和标签之间的依赖关系,以获得更具辨别性的图像特征.针对标签歧义性问题,算法设计了基于近邻样本的标签分布学习模块,通过整合邻域信息进行标签消歧,进一步提升模型识别性能.在细粒度表情识别数据集FG-Emotions上算法的准确度达到97.34%,在粗粒度表情识别数据集RAF-DB上比现有主流表情分类方法提高了0.80%～4.55%.

关键词：

细粒度面部表情识别注意力机制关系感知特征优化标签分布学习

原文链接:

维普
万方数据

语义增强的零样本甲骨文字符识别

刘宗昊彭文杰代港黄双萍...

3347-3358页

查看更多>>摘要：甲骨文识别对于了解中国历史和传承中华文化都有重要的价值.目前,人工识别甲骨文需要具备丰富的专家经验并耗费大量的时间,而自动识别甲骨文的方法绝大部分受制于闭集假设,在甲骨文这种陆续发现新字符的现实场景下适用范围受限.为此,有研究者提出零样本甲骨文字符识别,其从视觉匹配的角度出发,将字模图像作为字符类别参考,通过拓片图像与字模图像的相似度匹配实现拓片图像的字符识别,然而其忽略了甲骨文拓片图像样本类内方差大的难点,仍存在因字形多变而容易匹配错误的不足.本文提出了一种两阶段的语义增强零样本甲骨文字符识别方法.第一阶段为域无关的字符语义学习阶段,通过提示学习从甲骨文拓片和字模图像中提取字符语义,解决甲骨文字符缺乏语义的问题.为应对拓片与字模之间的域差异,我们分别设置可学习的域提示信息和字符类别提示信息,通过解耦两者的语义实现更准确的特征提取.第二阶段为语义增强的字符图像视觉匹配阶段,模型通过两个分支分别提取类内共享特征和类间差异特征.第一个分支使用对比学习,将同一字符类别的不同字形视觉特征对齐到字符语义,引导模型关注类内共享特征;第二个分支使用损失函数N-Pair,增强模型对不同字符类别间差异特征的学习.在测试阶段,模型无须语义特征,通过训练中学到的类内相似性和类间差异性特征,实现更准确的拓片与字模匹配,提升零样本识别性能.我们在拓片数据集OBC306和字模数据集SOC5519上进行实验验证,实验结果表明,本文提出的方法在零样本甲骨文识别准确率比基准方法性能提升超过25%.

关键词：

甲骨文字识别零样本识别视觉匹配语义增强视觉-语言模型对比学习

原文链接:

维普
万方数据

可重构智能表面辅助多用户NOMA网络鲁棒资源分配

胡林刘锡炎齐倩陈前斌...

3359-3367页

查看更多>>摘要：在不完美信道状态信息(Channel State Information,CSI)和不完美串行干扰消除(Successive Interference Cancellation,SIC)的场景下,研究了可重构智能表面(Reconfigurable Intelligent Surface,RIS)辅助多用户非正交多址接入(Non-Orthogonal Multiple Access,NOMA)网络的鲁棒资源分配问题.在考虑两类用户(信息用户和能量用户)服务质量(Quality of Service,QoS)和信息用户SIC约束下,建立了基站发射功率最小化的优化问题.该问题是一个多变量耦合的非凸优化问题.为了求解该问题,本文使用松弛变量、线性近似、S-程序、符号定性法转化该问题的非凸约束.然后将优化问题分解为两个子问题,最后使用交替优化方法迭代求解两个子问题,直到发送功率收敛.仿真结果表明:该文算法具有较好的收敛性,实现了资源的鲁棒分配,同时有效地降低基站发射功率.

关键词：

可重构智能表面非正交多址接入不完美信道状态信息不完美串行干扰消除传输功率优化功率最小化

原文链接:

维普
万方数据

基于跨模态引导和对齐的多模态预训练方法

才华易亚希付强冉越...

3368-3381页

查看更多>>摘要：现有的视觉语言多模态预训练方法仅在图像和文本的全局语义上进行特征对齐,对模态间细粒度特征交互的探索不足.针对这一问题,本文提出了一种基于跨模态引导和对齐的多模态预训练方法.该方法在模态特征提取阶段,采用基于视觉序列压缩的双流特征提取网络,在视觉编码器中联合图像和文本信息逐层引导视觉序列压缩,缓解与文本无关的冗余视觉信息对模态间细粒度交互的干扰;在模态特征对齐阶段,对图像和文本特征进行细粒度关系推理,实现视觉标记与文本标记的局部特征对齐,增强对模态间细粒度对齐关系的理解.实验结果表明,本文方法能够更好地对齐视觉文本的细粒度特征,在图文检索任务中,微调后的图像检索和文本检索的平均召回率分别达到了86.4%和94.88%,且零样本图文检索的整体指标相较于经典图文检索算法CLIP(Contrastive Language-Image Pre-train-ing)提升了5.36%,在视觉问答等分类任务中,准确率也优于目前主流多模态预训练方法.

关键词：

多模态预训练跨模态引导视觉序列压缩双流特征提取细粒度关系推理局部特征对齐

原文链接:

维普
万方数据

RWK-GNN:基于特征增强与子核分解的非平衡图欺诈检测算法

于浩淼刘炜孟流畅陈开睿...

3382-3391页

查看更多>>摘要：金融欺诈对经济和社会稳定造成了严重的威胁,因此开发有效的欺诈检测算法对于保护金融系统的完整性至关重要.目前已有多种基于图学习的欺诈检测算法应用于实际场景当中,这些方法或针对图的结构信息开展分类,或通过图卷积神经网络学习节点的嵌入式表示进行欺诈检测工作,关注角度相对单一,无法完备地在非平衡多关系图上开展欺诈检测分析.针对以上问题,本论文提出了一种结合随机游走下的特征增强与子核分解的图神经网络欺诈检测算法(Random Walk feature enhancement and Kcore subkernel decomposition Graph Neural Network,RWK-GNN),该算法能够高效地挖掘出多关系不平衡图中节点层级与全局网络层级的拓扑信息,并通过子核分解算法优化图结构特征在社区演进角度上的传播与聚合,最终完成欺诈检测与识别.为验证RWK-GNN算法性能,本文使用了图神经网络欺诈检测任务常用的公开数据集进行模型训练与测试.实验结果表明,在同一评价指标下,该方法较相关机器学习算法与图神经网络算法有着较大提升,与CARE-GNN算法相比,该方法的AUC值提升了17%;与PC-GNN算法相比,该方法的AUC值提升了8%;与SIGN算法相比,该方法的AUC值提升了7%.

关键词：

深度学习图表示学习图神经网络类不平衡节点分类金融欺诈检测

原文链接:

维普
万方数据

基于安全欠采样的不均衡多标签数据集成学习方法

孙中彬刁宇轩马苏洋

3392-3408页

查看更多>>摘要：多标签分类任务广泛存在于现实生活中,然而其经常存在不均衡数据问题,严重影响了分类性能.目前解决该问题的主流技术为重采样方法,主要分为过采样和欠采样,过采样通过生成与少数类标签相关的样本,欠采样则是通过删除与多数类标签相关的样本.然而,这些方法都专注于解决一种不均衡问题,即标签内不均衡或标签间不均衡,导致在解决一种不均衡的同时可能引入另一种不均衡.针对该问题,本文提出一种基于安全欠采样的不均衡多标签数据集成学习方法ESUS(Ensemble learning method based on Safe Under-Sampling).首先通过标签划分将多标签不均衡数据集划分成单标签数据集和标签对数据集,针对单标签数据集,提出一种安全欠采样方法解决标签内不均衡问题,并利用采样后的均衡数据集构建二分类模型.对于标签对数据集,进行数据剪枝后利用集成学习解决标签间不均衡问题,在保持分类性能的同时降低时空复杂度.最后将单标签数据集模型和标签对数据集模型集成为最终的分类模型.在六个多标签不均衡数据集上的实验结果表明:和七种对比方法相比,ESUS方法在四个评价指标上更稳定有效.

关键词：

多标签分类不均衡数据标签划分安全欠采样数据剪枝集成学习

原文链接:

维普
万方数据