计算机研究与发展2023,Vol.60Issue(9) :1973-1987.DOI:10.7544/issn1000-1239.202330421

基于高预测性的稀疏矩阵向量乘法并行计算优化

Optimization of Parallel Computation on Sparse Matrix-Vector Multiplication with High Predictability

夏天 付格林 曲劭儒 罗中沛 任鹏举
计算机研究与发展2023,Vol.60Issue(9) :1973-1987.DOI:10.7544/issn1000-1239.202330421

基于高预测性的稀疏矩阵向量乘法并行计算优化

Optimization of Parallel Computation on Sparse Matrix-Vector Multiplication with High Predictability

夏天 1付格林 2曲劭儒 2罗中沛 2任鹏举1
扫码查看

作者信息

  • 1. 人机混合增强智能全国重点实验室(西安交通大学) 西安 710049;视觉信息与应用国家工程研究中心(西安交通大学) 西安 710049;西安交通大学人工智能与机器人研究所 西安 710049
  • 2. 西安交通大学人工智能与机器人研究所 西安 710049
  • 折叠

摘要

稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一.在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分析收敛等计算要求.受限于SpMV本身的高度随机性和稀疏性所导致的数据局部性极差、缓存效率极低、计算模式非常不规则等问题,导致其计算负载成为当前高性能处理器的优化难点和研究热点.基于现代高性能超标量乱序处理器的架构特征,深入研究SpMV的各类性能瓶颈,并且提出从提升可预测性和降低程序复杂度的角度进行全面的性能优化.其核心思想是:通过构建串行访问的数据结构,提升数据访问的规律性和局部性,大幅度优化数据预取效率和缓存利用效率;通过构建规则的分支跳转条件,提升程序的分支预测准确率,有效提升程序执行效率;通过灵活运用SIMD指令集,有效提升计算资源利用率.通过对以上特性的优化,该方法可以显著缓解性能瓶颈,大幅度提升处理器资源、缓存资源和访存带宽的利用率,并且获得与主流商用计算库MKL相比平均 2.6倍的加速比,相比于现有最先进算法获得平均1.3倍的加速比.

关键词

矩阵向量乘法/稀疏矩阵计算/矩阵格式/分支预测/数据预取

Key words

matrix-vector multiplication/sparse matrix computation/matrix format/branch prediction/data prefetching

引用本文复制引用

基金项目

国家重点研发计划项目(2022YFB4500500)

陕西省重点研发计划项目(2022ZDLGY01-08)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量1
段落导航相关论文