计算机研究与发展2022,Vol.59Issue(6) :1192-1201.DOI:10.7544/issn1000-1239.20200989

基于数据分布一致性的处理器硬件性能计数器复用估计方法

A Data Distribution-Consistency-Based Estimation Method for Multiplexing Processor Hardware Performance Counters

林新华 王杰 王一超 左思成
计算机研究与发展2022,Vol.59Issue(6) :1192-1201.DOI:10.7544/issn1000-1239.20200989

基于数据分布一致性的处理器硬件性能计数器复用估计方法

A Data Distribution-Consistency-Based Estimation Method for Multiplexing Processor Hardware Performance Counters

林新华 1王杰 1王一超 1左思成1
扫码查看

作者信息

  • 1. 上海交通大学高性能计算中心 上海 200240
  • 折叠

摘要

同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov 正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了 OLE算法,并在主 流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了 10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了 18.8%和17.7%.

关键词

处理器硬件性能计数器/复用技术/性能分析/高性能计算/估计方法

引用本文复制引用

基金项目

国家自然科学基金(62072300)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量3
参考文献量2
段落导航相关论文