首页|基于并行计算的HEVC编码优化加速技术

基于并行计算的HEVC编码优化加速技术

扫码查看
随着4G和互联网技术的快速发展,人们对视频的需求越来越高,高清、超高清分辨率的视频给网络存储和传输带来了很大挑战,主流的视频编码标准H.264/AVC已经无法满足要求。在此背景下,JCT-VC于2013年1月正式推出了新一代视频编码标准HEVC(High Efficiency Video Coding)。通过一系列新技术的引入,使得HEVC在同等主观质量下相较于H.264/AVC压缩效率提高一倍,但是运算复杂度也大幅提高,给它的应用带来了困难,因此对HEVC进行并行加速就成为一个迫切问题。GPU拥有大量的并行处理单元,运算能力强大,同时NVIDIA推出的CUDA(Compute Unified Device Architecture)编程模型使得GPU并行编程变得更加简单。本文通过深入挖掘 HEVC各模块的并行加速潜能,利用CUDA对HEVC进行并行加速。 本文将对HEVC中最耗时的运动估计和亚像素插值模块进行CUDA并行加速。在运动估计的CUDA加速算法中,我们通过挖掘时域上的运动信息来预测当前CTU(Coding Tree Unit)中所有预测块的搜索起始点和搜索范围,在保证编码效率的同时有效地降低了运算复杂度。在运动估计和亚像素插值的CUDA实现中,充分地利用了矢量运算、寄存器、分支避免、线程块划分等CUDA优化技术,使得程序性能大幅提升。本文针对 x265编码器的多线程并行特性,设计了基于动态任务调度的CPU+GPU并行计算框架。利用时域的运动信息来预测编码区域的复杂度,根据内容复杂度动态地划分计算任务,更好地实现了负载均衡。实验表明,本文框架的并行加速效果明显。

肖建华

展开 >

视频编码 HEVC编码 并行计算 CUDA优化 编码效率

硕士

电子与通信工程

宋利

2016

上海交通大学

中文

TN