技术新讯 > 电子通信装置的制造及其应用技术 > 一种基于人类视觉感兴趣区域的视频压缩优化方法与流程  >  正文

一种基于人类视觉感兴趣区域的视频压缩优化方法与流程

  • 国知局
  • 2024-11-21 12:02:02

本发明属于视频处理领域,具体涉及种基于人类视觉感兴趣区域的视频压缩优化方法。

背景技术:

1、h265编码算法在视频处理领域被大量使用。在h265的编码过程中,会对编码进行分层同时还会对编码单元进行代价值的递归计算,若实现较好的编码,则需要较多的时间用于算法的计算。因此在正常情况下h265在视频压缩处理中有一些弊端:编码耗时较长,无法进行实时的编码等。由于h265在编码上时间消耗过大,因此在实时的视频会议、视频直播等场景h265的编码能力无法得到使用。

技术实现思路

1、针对上述问题,本发明的目的在于提供一种基于人类视觉感兴趣区域的视频压缩优化方法,利用人眼视觉感兴趣区域的判定,将其应用于h265的视频压缩过程中,从而提升了h265在视频压缩时的处理速度。

2、实现本发明目的的具体技术方案为:

3、一种基于人类视觉感兴趣区域的视频压缩优化方法,包括以下步骤:

4、步骤1、对视频中的图像进行分割,将其划分为多个子块;

5、步骤2、提取图像的纹理特征;

6、步骤3、提取图像的位置特征;

7、步骤4、确定图像的运动特征以及静态特征;

8、步骤5、基于步骤4的结果确定图像的关注度系数;

9、步骤6、基于图像的关注度系数,判断其是否为人类视觉感兴趣区域;

10、步骤7、利用h265压缩算法对视频图像进行压缩,其中,对于视觉感兴趣区域,采用预先定义的h265四叉树划分算法来压缩图像,对于非视觉感兴趣区域块,在h265压缩算法过程中提前截止其编码过程,最终完成视频图像压缩。

11、相比于现有技术,本发明的有益效果在于:

12、本发明通过对人类视觉系统在位置特征、纹理特征和运动特征三个方面修正h265编码器的四叉树划分方式;通过对非感兴趣区域编码的截止和保留视觉感兴趣区域块细节的方法,实现了对视频的快速编码,同时保证用户无法感到明显的失真;

13、通过对h265的四叉树划分过程进行了修正,改进的编码器在检测到待编码块为视觉感兴趣区域块时,保持编码树单元的深度不变。而对于非视觉感兴趣区域块,我们将编码树单元的深度设置为0,即对当前块的四叉树划分进行提前截止。这样不仅减少了非视觉感兴趣区域块的编码时间,也大大缩短了整个h265的压缩过程。

14、下面结合具体实施方式对本发明做进一步的说明。

技术特征:

1.一种基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,所述步骤1中的对视频中的图像进行分割,具体为:

3.根据权利要求2所述的基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,所述步骤2中的提取图像的纹理特征,具体为:

4.根据权利要求2所述的基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,所述步骤3中的提取图像的位置特征,具体为:

5.根据权利要求2所述的基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,所述步骤4的提取图像的运动特征,具体为:

6.根据权利要求5所述的基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,所述步骤5中的确定图像的关注度系数w,具体为:

7.根据权利要求6所述的基于人类视觉感兴趣区域的视频压缩优化方法,其特征在于,所述步骤6中根据关注度系数阈值wthr判断每个子块是否为人类视觉感兴趣区域;

8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述方法的步骤。

9.一种计算机可存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法的步骤。

技术总结本发明公开了一种基于人类视觉感兴趣区域的视频压缩优化方法,首先,对视频中的图像进行分割,将其划分为多个子块;之后分别提取图像的纹理特征、位置特征,确定图像的运动特征以及静态特征,从而确定图像的关注度系数;基于图像的关注度系数,判断其是否为人类视觉感兴趣区域,最后利用H265压缩算法对视频图像进行压缩,其中,对于视觉感兴趣区域,采用预先定义的H265四叉树划分算法来压缩图像,对于非视觉感兴趣区域块,在H265压缩算法过程中提前截止其编码过程,最终完成视频图像压缩。本发明方案由于采用了多种视觉感兴趣区域因子来计算关注系数,以处理视频中的运动部分和静态部分,在编码时间上平均能够节省约30%左右,同时具有更强的鲁棒性,能够应对各种情况下的视频编码需求。技术研发人员:刘珂,陈明秀,刘尊龙,毛喜旺,洪一帆,程家明,向东受保护的技术使用者:杭州智元研究院有限公司技术研发日:技术公布日:2024/11/18

本文地址:https://www.jishuxx.com/zhuanli/20241120/333965.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。