技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种呼叫中心的语音数据处理系统及方法与流程 > 正文

一种呼叫中心的语音数据处理系统及方法与流程

国知局
2024-06-21 10:41:58

本发明涉及语音数据处理，特别涉及一种呼叫中心的语音数据处理系统及方法。

背景技术：

1、呼叫中心是企业以语音通话的服务方式提供客户服务、技术支持、销售和市场营销等服务为职能的部门，是企业开拓市场、维系客户的重要部门。随着云计算和大数据技术的发展，呼叫中心正在利用各种新兴技术改进服务。可以利用语音识别技术可以将长时间的电话对话转换为文本格式，降低信息记录的难度，提高工作效率，同时利用文本分析技术可以帮助呼叫中心分析客户反馈，找出服务中的不足，并进行持续的改进。然而，呼叫中心也面临一些挑战。大量通话记录的数据存储和分析是一个难点。每个电话交互都会产生大量的语音数据，需要占用大量的存储空间，目前有利用语音识别技术将通话语音数据转换为文本数据进行存储以节省存储空间的方案，但这种方案至少存在两个方面的缺陷，一方面，将语音数据转换为文本数据后只能保留通话内容信息而丢失了大量的其它有用信息，例如通话过程中话务员的语气、语调、语速、声纹、口音、情绪等信息以及通话质量等信息，这些信息的丢失不利于后续对服务质量进行评估、服务事故进行回溯等，从而难以据此提升服务质量。另一方面，目前语音识别技术虽然越来越强大，但由于很多因素如通话质量、口音、语速等的影响导致识别错误率一直居高不下，特别是对于呼叫中心而言，大量话务员可能来自于不同地区甚至不同国家，即使经过较为严格的语言能力培训，但其不同的语言风格、口音、语速、语调等的不同仍然不可避免地对语音识别造成影响，因此通过语音识别技术将语音数据转换为文本进行存储并不可行。

技术实现思路

1、本发明正是基于上述问题，提出了一种呼叫中心的语音数据处理系统及方法，能够节省大量的语音数据存储空间。

2、有鉴于此，本发明的第一方面提出了一种呼叫中心的语音数据处理系统，包括用于实时监测话务员通话语音数据的语音数据监测模块、用于与数据库连接以对所述数据库进行读写操作的数据库操作模块以及用于对所述通话语音数据进行处理的语音数据处理模块，所述数据库操作模块包用于对语义短语语音库中的语义短语的语音数据进行读写操作的第一语音库操作子模块以及用于对词语语音库中的词语语音数据进行读写操作的第二语音库操作子模块，所述语音数据处理被配置为：

3、获取通话语音数据，所述通话语音数据包括在通话过程中录制的所述呼叫中心的话务员的通话内容的语音数据；

4、生成对应所述通话语音数据的语音单元序列，所述语音单元序列中的语音单元包括语义短语以及除所述语义短语外的其它词语；

5、将所述语音单元序列中的每个语音单元与数据库中存储的语音单元进行匹配，所述数据库包括语义短语语音库和词语语音库，所述语义短语语音库中存储有语义短语的语音数据，所述词语语音库中存储有除所述语义短语外的其它词语的语音数据；

6、获取与所述语音单元序列中的每个语音单元相匹配的语音单元在数据库中的语音单元编码，所述语音单元编码为由字母、数字、汉字以及特殊符号中的一种或多种构成的文本编码；

7、按照语音单元在所述语音单元序列中的顺序构建语音单元编码序列；

8、获取所述通话语音数据对应的话务员的身份标识；

9、基于所述身份标识和所述语音单元编码序列存储所述通话语音数据。

10、本发明的第二方面提出了一种呼叫中心的语音数据处理方法，包括：

11、获取通话语音数据，所述通话语音数据包括在通话过程中录制的所述呼叫中心的话务员的通话内容的语音数据；

12、生成对应所述通话语音数据的语音单元序列，所述语音单元序列中的语音单元包括语义短语以及除所述语义短语外的其它词语；

13、将所述语音单元序列中的每个语音单元与数据库中存储的语音单元进行匹配，所述数据库包括语义短语语音库和词语语音库，所述语义短语语音库中存储有语义短语的语音数据，所述词语语音库中存储有除所述语义短语外的其它词语的语音数据；

14、获取与所述语音单元序列中的每个语音单元相匹配的语音单元在数据库中的语音单元编码，所述语音单元编码为由字母、数字、汉字以及特殊符号中的一种或多种构成的文本编码；

15、按照语音单元在所述语音单元序列中的顺序构建语音单元编码序列；

16、获取所述通话语音数据对应的话务员的身份标识；

17、基于所述身份标识和所述语音单元编码序列存储所述通话语音数据。

18、进一步的，在上述的呼叫中心的语音数据处理方法中，生成对应所述通话语音数据的语音单元序列的步骤具体包括：

19、对所述通话语音数据执行语音识别以转换为通话文本数据；

20、对所述通话文本数据进行分词并执行词性标注；

21、识别所述通话文本数据中的语义短语文本；

22、将所述通话文本数据除所述语义短语文本外的每一个词语确定为词语文本；

23、按照所述语义短语文本和所述词语文本将所述通话语音数据分割成多个语音单元，所述语音单元包括语义短语语音单元和词语语音单元，所述语义短语语音单元与所述语义短语文本相对应，所述词语语音单元与所述词语文本相对应；

24、根据所述语义短语文本和所述词语文本在所述通话文本数据中的顺序对所述语音单元进行排列以生成所述语音单元序列。

25、进一步的，在上述的呼叫中心的语音数据处理方法中，识别所述通话文本数据中的语义短语文本的步骤具体包括：

26、在进行分词和词性标注后的所述通话文本数据中识别动宾关系、主谓关系以及修饰结构的第一目标短语，所述修饰结构的第一目标短语包括名词或代词被定语、后置定语、副词、量词或介词修饰的短语；

27、将所述第一目标短语输入语义短语识别函数以判断所述第一目标短语是否为语义短语；

28、判断所述通话文本数据中是否存在相邻的语义短语；

29、将相邻的语义短语合并为新的语义短语。

30、进一步的，在上述的呼叫中心的语音数据处理方法中，将所述第一目标短语输入语义短语识别函数以判断所述第一目标短语是否为语义短语的步骤具体包括：

31、获取所述第一目标短语中的词语数量；

32、当所述第一目标短语中的词语数量等于1时，确定所述第一目标不是语义短语；

33、当所述第一目标短语中的词语数量等于1时，判断所述第一目标短语是否符合语义短语的词性构成；

34、当所述第一目标短语不符合语义短语的词性构成时，确定第一所述目标不是语义短语；

35、当所述第一目标短语符合语义短语的词性构成时，对所述第一目标短语执行词序测试以及独立成分测试；

36、当所述第一目标短语没有通过词序测试或者独立成分测试时，确定所述第一目标不是语义短语；

37、否则，将所述第一目标短语确定为语义短语。

38、进一步的，在上述的呼叫中心的语音数据处理方法中，对所述第一目标短语执行词序测试的步骤具体包括：

39、移除或者替换所述第一目标短语中的一个词语，或者调换所述第一目标词语中的词语的顺序后生成第二目标短语；

40、将所述第一目标短语和所述第二目标短语输入预先训练好的第一语义变化识别模型中判断所述第二目标短语相对于所述第一目标短语的语义是否发生变化；

41、当所述第二目标短语相对于所述第一目标短语的语义发生变化时，确定所述第一目标短语没有通过词序测试；

42、否则确定所述第一目标短语通过词序测试。

43、进一步的，在上述的呼叫中心的语音数据处理方法中，将所述语音单元序列中的每个语音单元与数据库中存储的语音单元进行匹配的步骤具体包括：

44、从所述语音单元序列中获取第一语音单元svui，其中i∈[1,ns]，ns为所述语音单元序列中的语音单元的数量；

45、确定所述第一语音单元svui对应的第一文本stui；

46、基于所述第一文本stui从数据库中获取所述话务员的第二语音单元dvuj，其中j∈[1,nd]，nd为数据库中存储的所述话务员对应所述第一文本stui的语音单元的数量；

47、计算所述取第一语音单元svui与所述第二语音单元dvuj之间的相似度sij；

48、当所述取第一语音单元svui与所述第二语音单元dvuj之间的相似度sij大于预设的相似度阈值时，则将所述第二语音单元dvuj确定为与所述第一语音单元svui相匹配的语音单元。

49、进一步的，在上述的呼叫中心的语音数据处理方法中，计算所述取第一语音单元svui与所述第二语音单元dvuj之间的相似度sij的步骤具体包括：

50、在所述第一语音单元svui中确定第一起始位置匹配点st1和第一终止位置匹配点st2，所述第一起始位置匹配点st1为所述第一语音单元svui中的第一个字的发音起始时间点，所述第一终止位置匹配点为st2所述第一语音单元svui中最后一个字的发音结束时间点；

51、在所述第二语音单元dvuj中确定第二起始位置匹配点dt1和第二终止位置匹配点dt2，所述第二起始位置匹配点dt1为所述第二语音单元dvuj中的第一个字的发音起始时间点，所述第二终止位置匹配点dt2为所述第二语音单元dvuj中最后一个字的发音结束时间点；

52、截取所述第一语音单元svui中位于所述第一起始位置匹配点st1和所述第一终止位置匹配点st2之间的第一语音片段，以及截取所述第二语音单元dvuj中位于所述第二起始位置匹配点dt1和所述第二终止位置匹配点dt2之间的第二语音片段；

53、将所述第一语音片段和所述第二语音片段分别平均分割为nslice个第一语音子片段svck和第二语音子片段dvck，其中k∈[1,nslice]，nslice为预设的语音切片数量；

54、从1到nslice遍历k值以计算每个第一语音子片段svck和第二语音子片段dvck之间的归一化距离dk；

55、计算所述相似度：

56、

57、进一步的，在上述的呼叫中心的语音数据处理方法中，从1到nslice遍历k值以计算每个第一语音子片段svck和第二语音子片段dvck之间的归一化距离dk的步骤具体包括：

58、构建第k个第一语音子片段svck的第一梅尔频率倒谱向量mfcc1和第二语音子片段dvck的第二梅尔频率倒谱向量mfcc2；

59、计算所述第一梅尔频率倒谱向量mfcc1和第二梅尔频率倒谱向量mfcc2的欧氏距离d_mfcck；

60、将所述欧氏距离d_mfcck映射到[0,1]范围内得到归一化距离：

61、

62、进一步的，在上述的呼叫中心的语音数据处理方法中，在截取所述第一语音单元中位于所述第一起始位置匹配点和所述第一终止位置匹配点之间的第一语音片段，以及截取所述第二语音单元中位于所述第二起始位置匹配点和所述第二终止位置匹配点之间的第二语音片段的步骤之前，还包括：

63、计算所述第一终止位置匹配点st1和第一终止位置匹配点st2之间的第一差值：

64、δt1＝st2-st1；

65、计算所述第二终止位置匹配点dt1和第二终止位置匹配点dt2之间的第二差值：

66、δt2＝dt2-dt1；

67、计算所述第一差值δt1与所述第二差值δt2之间的第三差值：

68、δt3＝|δt2-δt1|；

69、当所述第三差值δt3大于预设的语速差阈值时，确定所述第二语音单元dvuj确定为与所述第一语音单元svui不匹配。

70、本发明提出了一种呼叫中心的语音数据处理系统及方法，通过生成话务员的通话语音数据的包括语义短语以及除所述语义短语外的其它词语等语音单元的语音单元序列，将所述语音单元序列中的每个语音单元与数据库中存储的语音单元进行匹配，获取与所述语音单元序列中的每个语音单元相匹配的语音单元在数据库中的语音单元编码，按照语音单元在所述语音单元序列中的顺序构建语音单元编码序列，获取所述通话语音数据对应的话务员的身份标识，基于所述身份标识和所述语音单元编码序列存储所述通话语音数据，能够节省大量的语音数据存储空间。