基于并行计算的HEVC编码优化加速技术

扫码查看

原文链接

NETL

中文摘要：随着4G和互联网技术的快速发展，人们对视频的需求越来越高，高清、超高清分辨率的视频给网络存储和传输带来了很大挑战，主流的视频编码标准H.264/AVC已经无法满足要求。在此背景下，JCT-VC于2013年1月正式推出了新一代视频编码标准HEVC（High Efficiency Video Coding）。通过一系列新技术的引入，使得HEVC在同等主观质量下相较于H.264/AVC压缩效率提高一倍，但是运算复杂度也大幅提高，给它的应用带来了困难，因此对HEVC进行并行加速就成为一个迫切问题。GPU拥有大量的并行处理单元，运算能力强大，同时NVIDIA推出的CUDA（Compute Unified Device Architecture）编程模型使得GPU并行编程变得更加简单。本文通过深入挖掘 HEVC各模块的并行加速潜能，利用CUDA对HEVC进行并行加速。本文将对HEVC中最耗时的运动估计和亚像素插值模块进行CUDA并行加速。在运动估计的CUDA加速算法中，我们通过挖掘时域上的运动信息来预测当前CTU（Coding Tree Unit）中所有预测块的搜索起始点和搜索范围，在保证编码效率的同时有效地降低了运算复杂度。在运动估计和亚像素插值的CUDA实现中，充分地利用了矢量运算、寄存器、分支避免、线程块划分等CUDA优化技术，使得程序性能大幅提升。本文针对 x265编码器的多线程并行特性，设计了基于动态任务调度的CPU+GPU并行计算框架。利用时域的运动信息来预测编码区域的复杂度，根据内容复杂度动态地划分计算任务，更好地实现了负载均衡。实验表明，本文框架的并行加速效果明显。

作者：

肖建华

展开 >

关键词：

视频编码 HEVC编码并行计算 CUDA优化编码效率

授予学位：

硕士

学科专业：

电子与通信工程

导师：

宋利

学位年度：

2016

学位授予单位：

上海交通大学

语种：

中文

中图分类号：