计算机研究与发展2022,Vol.59Issue(4) :936-949.DOI:10.7544/issn1000-1239.20200879

CS-Softmax:一种基于余弦相似性的Softmax损失函数

CS-Softmax:A Cosine Similarity-Based Softmax Loss Function

张强 杨吉斌 张雄伟 曹铁勇 郑昌艳
计算机研究与发展2022,Vol.59Issue(4) :936-949.DOI:10.7544/issn1000-1239.20200879

CS-Softmax:一种基于余弦相似性的Softmax损失函数

CS-Softmax:A Cosine Similarity-Based Softmax Loss Function

张强 1杨吉斌 2张雄伟 2曹铁勇 2郑昌艳3
扫码查看

作者信息

  • 1. 陆军工程大学研究生院 南京 210007
  • 2. 陆军工程大学指挥控制工程学院 南京 210007
  • 3. 火箭军士官学校 山东青州 262500
  • 折叠

摘要

卷积神经网络分类框架广泛使用了基于Softmax函数的交叉熵损失(Softmax损失函数),在很多领域中都取得了良好的性能.但是由于Softmax损失函数并不鼓励增大类内紧凑性和类间分离性,在一些多分类问题中,卷积神经网络学习到的判别性嵌入表示的性能难以进一步提高.为了增强嵌入表示的判别性,提出 了一种基于余弦相似性的 Softmax(cosine similarity-based Softmax,CS-Softmax)损失函数.CS-Softmax损失函数在不改变神经网络结构的条件下,分别计算嵌入表示与分类全连接层权重的正相似性和负相似性,以实现同类紧凑和异类分离的训练目标.理论分析表明:边距因子、尺度因子、权重更新因子等参数的引入,可以调节各类别决策边距的大小,增大类内紧凑性、类间分离性,增强学习到的嵌入表示的判别性.在典型的音频、图像数据集上的仿真实验结果表明:CS-Softmax损失函数在不增加计算复杂度的同时,可以有效提升多分类任务性能,在MNIST,CIFAR10,CIFAR100图像分类任务中分别取得了 99.81%,95.46%,76.46%的分类精度.

关键词

模式分类/卷积神经网络/损失函数/Softmax/余弦相似性

引用本文复制引用

基金项目

国家自然科学基金(62071484)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量8
参考文献量4
段落导航相关论文