计算机科学2021,Vol.48Issue(12) :29-35.DOI:10.11896/jsjkx.201200135

基于SIMD的三角函数高性能实现与优化

High Performance Implementation and Optimization of Trigonometric Functions Based on SIMD

姚建宇 张祎维 张广婷 贾海鹏
计算机科学2021,Vol.48Issue(12) :29-35.DOI:10.11896/jsjkx.201200135

基于SIMD的三角函数高性能实现与优化

High Performance Implementation and Optimization of Trigonometric Functions Based on SIMD

姚建宇 1张祎维 2张广婷 3贾海鹏3
扫码查看

作者信息

  • 1. 中国科学院计算技术研究所计算机体系结构国家重点实验室 北京 100190;中国科学院大学计算机与控制学院 北京 100049
  • 2. 清华大学计算机科学与技术系 北京 100084
  • 3. 中国科学院计算技术研究所计算机体系结构国家重点实验室 北京 100190
  • 折叠

摘要

作为基本的数学运算,三角函数的高性能实现对构建处理器的基础软件生态具有重要意义,特别是当前处理器都采用了SIMD架构,基于SIMD实现高性能三角函数具有重要的研究意义和应用价值.对此,文中采用数值分析的方法,对5个常用的三角函数sin,cos,tan,atan,atan2进行了高性能的实现与优化.首先通过分析浮点数IEEE754标准,设计了高效的三角函数算法;然后通过多项式逼近算法中的泰勒公式、帕德近似及雷米兹算法提升了算法精度;最后利用指令流水线与SIMD优化进一步提升了算法性能.实验结果表明,在满足精度的前提下,所实现的三角函数,相较于libm算法库和ARM_M算法库,在ARM V8计算平台上都获得了较大的性能提升,其中相比libm算法库有1.77~6.26倍的时间性能提升,相比ARM_M算法库有1.34~1.5倍的时间性能提升.

关键词

三角函数/SIMD/高性能/数值分析/ARM/V8架构

引用本文复制引用

基金项目

国家重点研发计划(2017YFB0202502)

国家重点研发计划(2018YFC0809306)

国家重点研发计划(2017YFB0202105)

国家重点研发计划(2016YFB0200803)

国家重点研发计划(2017YFB0202302)

国家自然科学基金(61972376)

北京自然科学基金(L182053)

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量3
参考文献量2
段落导航相关论文