技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音中继通话质量评估方法及装置与流程 > 正文

语音中继通话质量评估方法及装置与流程

国知局
2024-06-21 11:52:15

本技术涉及通话，具体而言，涉及一种语音中继通话质量评估方法及装置。

背景技术：

1、语音中继是一种在通信系统中实现语音信号传输的技术，它可以将语音信号从一个网络或设备转换到另一个网络或设备，以实现不同类型的语音通话，如ims(ipmultimedia subsystem，终端客户)固定电话、volte(voice over long-term evolution，长期演进语音承载)移动电话、其他voip(voice over internet protocol，基于ip的语音传输)网络电话等。语音中继的传输质量直接影响到用户的通话体验和满意度，因此对语音中继的质量检测具有重要的意义。仅通过设备硬件进行告警监控的手段是不足以发现语音通话中的质量问题的，现有设备监控系统可以对语音中继的传输中断、传输误码高等底层告警进行实时监控。在实际运维中经常出现网络无告警，但是客服中心却会接到大量客户投诉通话存在断断续续，杂音大，说话声音小等通话质量差的问题，因此需要采用专门的手段对语音传输质量进行评估。

2、目前，针对语音传输质量的评估方法主要有两种：主观检测如mos(mean opinionscore，平均意见得分)评价，客观检测如stoi(short-time objective intelligibility，短时客观清晰度)，现有的主观和客观检测方法都是针对单个语音通话信道或设备上的语音信号进行质量评估，而对于跨越多个网络或设备的语音中继传输质量的检测则较少涉及。此外，单独检测评价传输中继中一路通话质量是不能准确反映整条语音中继线路的语音信号传输质量的，比如，通话中任何一方所处嘈杂环境中，通话都会被评价为通话杂音大。

3、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本技术实施例提供了一种语音中继通话质量评估方法及装置，以至少解决相关技术中针对语音中继场景缺乏可靠的通话质量检测评估方案的技术问题。

2、根据本技术实施例的一个方面，提供了一种语音中继通话质量评估方法，包括：流式采集目标语音中继线路上的多组语音通话数据；对于每组语音通话数据，对语音通话数据进行预处理操作，得到语音通话数据对应的目标对数梅尔语谱图；利用预训练的语音活动检测模型对语音通话数据进行分析，得到语音通话数据中包含人声的目标语音片段；利用预训练的语音质量评分模型对目标对数梅尔语谱图进行评分得到第一评分，并利用短时客观清晰度指标对目标语音片段进行评分得到第二评分，依据第一评分和第二评分进行加权计算得到语音通话数据的综合评分；依据目标周期内目标语音中继线路上的多组语音通话数据对应的多个综合评分确定目标语音中继线路的通话质量。

3、可选地，流式采集目标语音中继线路上的多组语音通话数据，包括：基于预设采样频率从目标设备处流式采集目标语音中继线路上的每段通话的语音通话数据，得到多组语音通话数据，其中，目标设备包括以下至少之一：移动核心网的呼叫会话控制功能代理设备和固网的会话边界控制器设备。

4、可选地，对语音通话数据进行预处理操作，得到语音通话数据对应的对数梅尔语谱图，包括：基于预设长度的时间窗对语音通话数据进行无帧间重叠的分帧处理，得到多帧语音通话数据；分别对每帧语音通话数据进行预加重处理、加汉明窗处理和短时傅里叶变换处理，得到多个频域特征数据，并将多个频域特征数据融合得到频谱图；利用第一梅尔滤波器组在第一频率范围内对频谱图进行滤波处理，并对滤波结果进行对数运算平滑处理，得到第一对数梅尔语谱图，其中，第一频率范围为人类听觉频率范围；利用第二梅尔滤波器组在第二频率范围内对频谱图进行滤波处理，并对滤波结果进行对数运算平滑处理，得到第二对数梅尔语谱图，其中，第二频率范围为人声频率范围；将第一对数梅尔语谱图和第二对数梅尔语谱图拼接得到目标对数梅尔语谱图。

5、可选地，利用预训练的语音活动检测模型对语音通话数据进行分析，得到语音通话数据中包含人声的目标语音片段，包括：基于每帧语音通话数据对应的时序，每次从多帧语音通话数据中依序且不重复地提取第一预设数量帧语音通话数据组成第一语音片段，将第一语音片段输入语音活动检测模型进行分析，得到语音活动检测模型输出的预测结果，其中，预测结果用于反映第一语音片段中是否包含人声；将预测结果为包含人声的多个第一语音片段进行拼接，得到第二语音片段；若第二语音片段的时长不小于预设时长，提取第二语音片段中预设时长的连续语音片段作为目标语音片段；若第二语音片段的时长小于预设时长，标记语音通话数据异常。

6、可选地，语音质量评分模型的训练过程包括：构建初始评分模型，其中，初始评分模型为包括有通道注意力和多层特征聚合的卷积神经网络模型，且卷积神经网络模型的输出层为sigmoid输出函数；获取训练数据，其中，训练数据中包括：多组具备平均意见评分的公开语音数据和多组无评分的私有语音数据；对于每组私有语音数据，获取多个目标对象对私有语音数据的主观评分，并依据多个主观评分计算私有语音数据的平均评分；对各个训练数据的平均意见评分或平均评分进行归一化处理，并将归一化处理后的评分作为各个训练数据的样本标签；利用训练数据和样本标签对初始评分模型进行迭代训练，得到语音质量评分模型，其中，训练过程采用huber损失函数进行模型参数调整。

7、可选地，利用短时客观清晰度指标对目标语音片段进行评分得到第二评分，包括：利用短时客观清晰度指标对目标语音片段和预设的参考语音进行比较，得到目标语音片段的第二评分。

8、可选地，依据目标周期内目标语音中继线路上的多组语音通话数据对应的多个综合评分确定目标语音中继线路的通话质量，包括：周期性评估目标语音中继线路的通话质量，其中，在每个评估时刻，确定当前周期内目标语音中继线路上的语音通话数据的总数量，并确定综合评分低于预设评分阈值的语音通话数据的第一数量和被标记异常的语音通话数据的第二数量，确定第一数量与第二数量的和值与总数量的比值；若比值不大于预设比例阈值，确定目标语音中继线路的通话质量合格；若比值大于预设比例阈值，确定目标语音中继线路的通话质量不合格，并发出告警信息，其中，告警信息用于提示目标语音中继线路存在异常需要检修。

9、根据本技术实施例的另一方面，还提供了一种语音中继通话质量评估装置，包括：采集模块，用于流式采集目标语音中继线路上的多组语音通话数据；评分模块，用于对于每组语音通话数据，对语音通话数据进行预处理操作，得到语音通话数据对应的目标对数梅尔语谱图；利用预训练的语音活动检测模型对语音通话数据进行分析，得到语音通话数据中包含人声的目标语音片段；利用预训练的语音质量评分模型对目标对数梅尔语谱图进行评分得到第一评分，并利用短时客观清晰度指标对目标语音片段进行评分得到第二评分，依据第一评分和第二评分进行加权计算得到语音通话数据的综合评分；确定模块，用于依据目标周期内目标语音中继线路上的多组语音通话数据对应的多个综合评分确定目标语音中继线路的通话质量。

10、根据本技术实施例的另一方面，还提供了一种非易失性存储介质，该非易失性存储介质包括存储的计算机程序，其中，非易失性存储介质所在设备通过运行该计算机程序执行上述的语音中继通话质量评估方法。

11、根据本技术实施例的另一方面，还提供了一种电子设备，该电子设备包括：存储器和处理器，其中，存储器中存储有计算机程序，处理器被配置为通过计算机程序执行上述的语音中继通话质量评估方法。

12、在本技术实施例中，流式采集目标语音中继线路上的多组语音通话数据；对于每组语音通话数据，对语音通话数据进行预处理操作，得到语音通话数据对应的目标对数梅尔语谱图；利用预训练的语音活动检测模型对语音通话数据进行分析，得到语音通话数据中包含人声的目标语音片段；利用预训练的语音质量评分模型对目标对数梅尔语谱图进行评分得到第一评分，并利用短时客观清晰度指标对目标语音片段进行评分得到第二评分，依据第一评分和第二评分进行加权计算得到语音通话数据的综合评分；依据目标周期内目标语音中继线路上的多组语音通话数据对应的多个综合评分确定目标语音中继线路的通话质量。其中，预训练的语音活动检测模型可以同时对多帧语音特征进行检测，可以提高语音片段截取效率和并发能力，同时降低模型的硬件算力要求；利用综合评分进行语音质量评估，可以提升评价指标反映语音通话质量的真实程度，提高语音质量评估的准确性和可信度，有效解决了相关技术中针对语音中继场景缺乏可靠的通话质量检测评估方案的技术问题。