一种分布式高集成综合协作传输管理系统的制作方法
- 国知局
- 2024-06-21 11:56:27
本技术涉及语音信号传输,具体涉及一种分布式高集成综合协作传输管理系统。
背景技术:
1、远程会议的协作传输管理系统,能够满足不同地点的用户通过视频和音频进行即时沟通。它通过对不同地理位置的音频数据进行实时采集,通过编码、传输、解码的形式将所有数据同步集成到会议控制终端上进行协作调整,控制多个会议的情况,使所有分布式的会议子系统能够同步的进行音频视频沟通。在进行沟通时需要快速处理分布式会议现场采集到的音频数据,快速地进行低失真压缩,以保证不同会议子系统的低延迟,提高会议参会体验。
2、传统的语音信号多采用vq-lgb算法进行语音压缩,其在使用了lgb优化算法对语音的矢量划分进行迭代时,在通过对矢量点进行平移计算质心时,只考虑了数据数量统计特征,没有考虑数据信息统计特征,可能会导致压缩后的数据重要人声信息部分的数据压缩不够细致,影响会议音频中人声的质量,不利于协作传输管理系统的语音交流,降低了协作传输管理系统的传输效率。
技术实现思路
1、为了解决上述技术问题,本技术的目的在于提供一种分布式高集成综合协作传输管理系统,所采用的技术方案具体如下:
2、本技术提出了一种分布式高集成综合协作传输管理系统,所述系统包括:
3、数据采集模块,采集远程会议的协作传输管理系统中各采样频率对应的语音信号强度值,组成音频强度向量;
4、会议音频数据综合处理模块,对音频强度向量进行处理,获得人声信息量质心,处理过程包括:
5、(1)对音频强度向量进行分解,获得各次分解的细节信号和近似信号;根据各次分解的细节信号和近似信号,获得各级近似信号的变化趋势信号和各级细节信号的变化趋势信号;
6、(2)根据各级近似信号与各级细节信号的变化趋势信号之间的差异,获得会议音频小波信息权重;
7、(3)根据相邻的采样频率在音频强度向量中对应的语音信号强度值的分布情况,获取各采样频率对应的离散标签值;将相同的离散标签值作为同一种类,获得各类离散标签值;
8、(4)根据各类离散标签值包含的所有采样频率对应的语音信号强度值和细节信号,获得信息量以及人声信息量;结合信息量、人声信息量和会议音频小波信息权重计算各采样频率的语音信息权重;
9、(5)获得音频强度向量中的各矢量点及各矢量点所属的数据区间,结合语音信息权重计算各数据区间的人声信息量质心;
10、会议音频数据传输管理模块,根据所有数据区间的人声信息量质心,对音频强度向量进行压缩,获得压缩后的会议音频强度向量。
11、进一步,所述根据各次分解的细节信号和近似信号,获得各级近似信号的变化趋势信号和各级细节信号的变化趋势信号,包括:
12、分别将各次分解的细节信号和近似信号,记为各级细节信号和各级近似信号;其中,将音频强度向量记为第0级近似信号;
13、将各级近似信号在各采样频率处的一阶导数组成的序列,记为各级近似信号的变化趋势信号;将各级细节信号在各采样频率处的一阶导数组成的序列,记为各级细节信号的变化趋势信号。
14、进一步,所述根据各级近似信号与各级细节信号的变化趋势信号之间的差异,获得会议音频小波信息权重,表达式为:
15、
16、式中,是第m次分解的会议音频小波信息权重;分别是第0、m-1、m级近似信号的第n个元素;是采样频率的数量;是第m级近似信号的变化趋势信号中的第n个元素;是第m级细节信号的变化趋势信号中的第n个元素。
17、进一步,所述根据相邻的采样频率在音频强度向量中对应的语音信号强度值的分布情况,获取各采样频率对应的离散标签值,包括:
18、将任一采样频率记为待分析频率,计算音频强度向量中待分析频率之前的预设数量个采样频率对应的语音信号强度值的均值,记为左侧信号均值;计算音频强度向量中待分析频率之后的预设数量个采样频率对应的语音信号强度值的均值,记为右侧信号均值;若左侧信号均值大于或等于右侧信号均值,记待分析频率的第一离散标签值为1;反之,记待分析频率的第一离散标签值为2;
19、对音频强度向量,采用均匀量化方法进行离散化处理,获得各采样频率对应的语音信号强度值的量化级别;
20、将各采样频率的第一离散标签值与各采样频率对应的语音信号强度值的量化级别的乘积,记为各采样频率对应的离散标签值。
21、进一步,所述根据各类离散标签值包含的所有采样频率对应的语音信号强度值和细节信号,获得信息量以及人声信息量,包括:
22、将各类离散标签值包含的所有采样频率对应的语音信号强度值的信息熵,记为各类离散标签值的信息量;
23、对于各级细节信号,将各类离散标签值包含的所有采样频率在细节信号中对应元素的信息熵,记为各类离散标签值在细节信号中的人声信息量。
24、进一步,所述结合信息量、人声信息量和会议音频小波信息权重计算各采样频率的语音信息权重,表达式为:
25、
26、式中,是第n个采样频率的语音信息权重,是第n个采样频率的离散标签值的信息量,、分别是第n个采样频率的左侧信号均值和右侧信号均值,是分解的次数,是第m级细节信号中的第n个元素,是第m次分解的会议音频小波信息权重,是第n个采样频率的离散标签值在第m级细节信号的人声信息量。
27、进一步,所述获得音频强度向量中的各矢量点及各矢量点所属的数据区间,结合语音信息权重计算各数据区间的人声信息量质心,包括:
28、将音频强度向量输入lgb算法,输出音频强度向量中的各矢量点及各矢量点所属的数据区间;对于音频强度向量中位于各矢量点所属的数据区间内的第k个元素,将音频强度向量中所有元素与第k个元素之间的欧氏距离按照从小到大的顺序排列,获得第k个元素的邻近元素距离序列;计算所述邻近元素距离序列中的前预设数量个数据的均值和标准差,分别记为第k个元素的局部数据密度和局部数据分布混乱度;
29、结合k个元素的局部数据密度、局部数据分布混乱度和语音信息权重,确定第k个元素的人声加权权重;
30、结合人声加权权重和音频强度向量,确定音频强度向量中各矢量点所属的数据区间的人声信息量质心。
31、进一步,所述人声加权权重的确定包括:
32、计算所述第k个元素的局部数据密度与局部数据分布混乱度的比值;将所述比值与所述第k个元素的语音信息权重的乘积作为第k个元素的人声加权权重。
33、进一步,所述人声信息量质心,包括:
34、计算各矢量点所属的数据区间内所有元素的人声加权权重的和值;获取第k个元素的人声加权权重与所述和值的比值,记为第一比值;计算第k个元素在音频强度向量中对应的信号强度值与第一比值的乘积;将各矢量点所属的数据区间内所有元素的所述乘积的和值,作为各矢量点所属的数据区间的人声信息量质心。
35、进一步,所述根据所有数据区间的人声信息量质心,对音频强度向量进行压缩,获得压缩后的会议音频强度向量,包括:将所有数据区间的人声信息量质心作为vq-lgb算法中的质心,对音频强度向量采用vq-lgb算法进行压缩,获得压缩后的会议音频强度向量。
36、本技术具有如下有益效果:
37、本技术通过分析音频数据中对于解读会议语音信息较为重要的信号的波动和分布特征,首先,对会议采集的音频数据进行小波分解,然后对不同分解次数下的频率和音频的振幅构建特征值计算会议音频小波信息权重,反映包含会议语音信息的情况,更为清晰的量化各次的细节分量包含的会议人声信息量大小;进一步通过对音频信号及其小波分解信号计算其变化趋势,并结合信号的强度值和会议音频小波信息权重,计算语音信息权重,表征出音频信号中不同采样频率包含人声信息及清晰程度,精细化的标记出不同采样频率对识别人声语音信号的重要程度;为了进一步对lgb算法中的矢量点质心计算进行改进,通过矢量点所属数据区间的数据分布情况以及语音信息权重,计算出人声加权信息量质心,通过人声加权信息量质心改进vq-lgb算法对音频数据进行压缩,能够得到更好的音频数据矢量化结果,其中包含了更多的人声相关信息,使最终数据压缩后质量更好;使用压缩后的音频数据进行传输,提高了协作传输管理系统的传输效率。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24611.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表