首页|稀疏矩阵向量乘的访存分析和优化

稀疏矩阵向量乘的访存分析和优化

扫码查看
稀疏矩阵向量乘(SpMV)是科学计算中最重要的核心算法之一。理论分析和实际测试结果都表明,SpMV属于访存密集型应用。由于目前主流编译器尚不能充分利用现代处理器的访存特性,SpMV对带宽利用率仅为10%。本文通过探索现代处理器的访存特征,使用单指令流多数据流(SIMD)对SpMV进行流水线访存优化。实验表明与标准SpMV相比,优化后的SpMV在Intel Nehalem和SandyBridge架构上流水线性能分别有63%和89%的提升,在AMD Opteron 6168和Opteron 8374 HE上分别有30%和36%的提升。SpMV在实际矩阵进行的性能测试中,Intel Nehalem和SandyBridge架构上均有10%的性能提高。

张秀霞、陈明宇、李佳佳、谭光明

展开 >

中国科学院计算技术研究所,北京100190

稀疏矩阵向量乘 流水线 科学计算 访存特性 处理器 单指令流多数据流 性能测试

中国计算机学会

2011年全国高性能计算学术年会(HPC china2011)

2011-10-26

济南

2011年全国高性能计算学术年会(HPC china2011)论文集

1-4

2011