Winograd convolutionlow precisionpartial kernel fusionaccelerating convolutionGPU memory hierarchyTensor Core
童敢、黄立波、吕雅帅
国防科技大学计算机学院,湖南长沙 410073
华为技术有限公司,北京 100031
Winograd卷积 低精度 部分计算核融合 卷积加速 GPU内存层级 Tensor Core
国家自然科学基金
61872374
2024
10.12263/DZXB.20211641