技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于AI语音交互的在线客服平台的制作方法 > 正文

一种基于AI语音交互的在线客服平台的制作方法

国知局
2024-06-21 11:58:14

本发明涉及客服，尤其涉及一种基于ai语音交互的在线客服平台。

背景技术：

1、随着互联网技术的迅猛发展和人工智能的广泛应用，基于ai语音交互的在线客服平台应运而生。这种平台利用云计算、大数据、人工智能等新一代数字化技术，为用户提供智能化、个性化的服务，提高客户服务效率，降低企业运营成本。语音交互技术已经逐渐渗透到各个行业中，其中包括电力行业。在电力领域，基于ai语音交互的在线客服平台正在成为一种新兴的服务模式，它将为用户提供更加便捷、高效的服务体验。

2、现有的基于ai语音交互的在线客服平台通过以下技术实现，包括：现有智能客服系统主要采用自然语言理解技术、知识管理技术、自动问答系统、智能推理技术等。语音识别技术可以帮助系统准确地理解用户语音指令；自然语言处理技术可以理解用户意图，实现灵活的对话交互；知识管理技术可以帮助系统快速检索和提供相关答案；自动问答系统和智能推理技术可以实现快速、准确的问题解答。

3、例如公开号为：cn112148846a的专利申请公开的一种结合rpa和ai的回复语音确定方法、装置、设备及存储介质，包括：确定与用户的问询语音数据对应的问询文本，并确定与问询语音数据对应的情感类型；确定与问询文本对应的回复文本；确定与情感类型对应的音色信息；根据回复文本和音色信息生成与问询文本对应的回复语音。

4、例如公开号为：cn114860742a的专利申请公开的一种基于人工智能的ai客服交互方法、装置、电子设备及存储介质，包括：调取语音沟通文本以构建初始问答数据集；依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集；基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集；将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板，并根据ai客服与客户的交互结果获取客户意向分类集；基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程。

5、但本技术在实现本技术实施例中发明技术方案的过程中，发现上述技术至少存在如下技术问题：

6、现有技术中，由于电力问题语音识别包含了大量的信息，具有复杂性，而ai系统需要在不同的噪音环境下，准确识别并理解用户的语音指令，因此语音识别仍存在困难，存在难以有效提高ai语音交互的准确性的问题。

技术实现思路

1、本技术实施例通过提供一种基于ai语音交互的在线客服平台，解决了现有技术中，存在难以有效提高ai语音交互的准确性的问题，实现了提高在线客服平台中ai语音交互的准确性的目的。

2、本技术实施例提供了一种基于ai语音交互的在线客服平台，包括：电力问题语音数据获取模块，用于获取电力问题语音数据；电力问题语音识别理解分类模型构建模块，用于对电力问题语音数据依次进行降噪、电力问题语音文本数据库构建、声学模型训练、语言模型训练和文本分类，构建电力问题语音识别理解分类模型；ai自动交互模块，用于根据电力问题语音识别理解分类模型和ai语音交互分类检索库自动选择交互的答复；功能测试模块，用于对ai自动交互模块进行整体功能测试，根据功能测试的结果得到语音交互准确系数，并据此重新调整电力问题语音识别理解分类模型的参数设置。

3、进一步的，所述对电力问题语音数据依次进行降噪的具体过程为：利用预定义静音检测技术识别并去除电力问题语音数据中静默期间的无意义信号数据，利用预定义增强有效信号技术识别并增强电力问题语音数据中人声的语音信号数据，得到电力问题有效语音数据；频谱分析：对电力问题有效语音数据进行快速傅立叶变换，得到其频谱特征，从频谱中提取倒谱系数，作为声道特征；构建背景噪声训练集：采集无语音时的各种背景噪声数据，所述背景噪声数据类型包括：加性噪声数据、乘性噪声数据、稳态噪声数据、非稳态噪声数据，将背景噪声数据分隔成等长音频长度的若干的背景噪声分段数据集，按不同的背景噪声数据类型和不同信噪比配置将若干的背景噪声分段数据集随机组合成若干个背景噪声训练集；利用预定义自适应滤波算法调整降噪滤波器参数，初始化降噪滤波器，使用降噪滤波器先经过背景噪声训练集训练，训练后的降噪滤波器对电力问题有效语音数据进行降噪处理，得到电力问题降噪语音数据集。

4、进一步的，所述电力问题语音文本数据库构建的具体过程为：数据收集：收集在线客服平台既往历史中所有与电力问题相关的语音样本；数据预处理：对收集到的语音数据进行预处理；文本转录：将预处理后的语音数据通过预定义语音识别技术转换成文本格式；文本解析和标注：对转录得到的文本进行解析，使用人工标注分析的方式提取出与电力问题相关的关键信息，得到若干的标注文件；构建数据库：将标注好的文本数据按预定义电力问题分类类别存储到电力问题语音文本数据库中，通过设置对应的目录索引建立若干的标注文件与若干的预定义电力问题分类类别对应的搜索方式，使其一一对应；持续更新：电力问题语音文本数据库将会定期更新。

5、进一步的，所述声学模型训练的具体过程为：将电力问题降噪语音数据集经过梅尔频率倒谱系数的特征提取，即为对电力问题降噪语音数据集进行分析，提取每一帧的梅尔频率倒谱系数特征，并进行归一化处理，得到电力问题降噪语音特征数据集；构建纯净声学验证集：将标准电力问题纯净声学数据集分隔成等长音频的若干的标准电力问题纯净声学数据段，若干的标准电力问题纯净声学数据段合并记为纯净声学验证集；构建带疑问语音训练集：将电力问题降噪语音特征数据集中带疑问的电力问题语音数据采集组合成带疑问语音数据集，按完整语句分隔成若干音频长度的若干的电力问题带疑问语音数据段，按不同的若干的电力问题带疑问语音数据段类型分类成若干个带疑问语音数据训练集；构建神经网络声学模型：采用多层隐藏层的全连接神经网络结构，神经网络的输入层和输出层均为若干个神经元，对应着电力问题降噪语音特征数据集中一帧语音中进行若干个点的预定义语音数据处理所得到的对数功率谱的值；初始化神经网络声学模型：使用预定义初始化方式对神经网络降噪模型进行初始化设置，设置初始化的神经网络降噪模型的预定义模型参数，所述预定义模型参数包括：神经网络中不同层级之间的连接权重和若干神经元上的偏置初始激活值；模型估计纯净声学信号：将若干个带疑问语音数据训练集传入初始化神经网络声学模型，神经网络声学模型输出第一次的纯净声学信号数据；设定迭代参数开始训练：设置学习率为预定义学习率，每次迭代从样本中取的个数设为若干，迭代轮数为若干次，将第一次的纯净声学信号数据与纯净声学验证集对比，分析实际值与估计值的差距，差距小于预设值，则训练结束，否则，根据梯度下降算法更新预定义模型参数并继续训练；神经网络声学模型训练结束：神经网络声学模型训练结束，利用神经网络声学模型使得电力问题降噪语音特征数据集转化为对应的电力问题降噪拼音数据集。

6、进一步的，所述语言模型训练的具体过程为：构建与电力问题语音文本数据库对照的电力问题主体词汇库；初始化集束搜索的语言模型；对语言模型进行模型训练，构建电力问题主体词汇和音素之间的映射关系和先验概率，将输入的电力问题降噪拼音数据集与电力问题主体词汇库中电力问题主体词汇对比分析电力问题主体词汇匹配概率，依据集束搜索算法通过电力问题主体词汇匹配概率在电力问题主体词汇库中进行主体词汇匹配得出在电力问题语音文本数据库中对应的电力问题语音文本信息数据；即使用语言模型通过将电力问题降噪拼音数据集转化成对应的电力问题主体词汇库中与电力问题语音文本数据库匹配的电力问题语音文本信息数据。

7、进一步的，所述文本分类的具体过程为：采用基于自然语言处理原理的预定义文本分类器；将电力问题语音文本信息数据通过数据清洗及分词之后，转化成预定义文本分类器的对应文本格式，得到电力问题语音文本格式数据；对电力问题语音文本格式数据进行文本分类器对应的模型训练，文本分类器包括若干的分类标注，得到电力问题语音识别理解分类模型。

8、进一步的，所述根据电力问题语音识别理解分类模型和ai语音交互分类检索库自动选择交互的答复的具体过程为：使用电力问题语音识别理解分类模型将在线客服平台获取的电力问题语音数据进行语音识别理解并分类，得到包括若干的分类标注的电力问题语音数据，按不同的分类标注将电力问题语音数据分割成若干的电力问题语音数据段，记为电力问题语音数据分类段，将电力问题语音数据分类段与ai语音交互分类检索库中分类类别匹配，得到ai语音交互分类检索库中预定义ai语音交互分类类别对应预设回复，通过预定义检索算法，检索预定义ai语音交互分类类别对应预设回复与电力问题语音数据精确匹配的预设回复，并使用语音合成技术将选定的预设回复转换回语音数据输出。

9、进一步的，所述根据功能测试的结果得到语音交互准确系数的具体过程为：对ai自动交互模块连续若干时长的连续的整体功能测试，重复多次测试，得到语音识别准确系数和文本分类准确系数，分析得到语音交互准确系数；将语音交互准确系数与预定义语音交互准确系数对比，若两者差值大于预定义语音交互差值，则继续将语音识别准确系数和文本分类准确系数分别与对应的预定义值对比，若两者差值大于预定义差值阈值，则重新调整声学模型训练和语言模型训练中的参数设置。

10、进一步的，所述语音识别准确系数的具体计算过程为：对声学模型在模拟的不同噪声水平、不同说话人以及不同场景下的语音环境中进行测试，对声学模型正确识别的纯净声学验证集中语音样本占总样本的比例统计得到声学模型质量修正系数，对声学模型正确识别的带疑问语音训练集中电力问题带疑问语音数据段的样本占总样本的比例统计得到声学模型召回率数据，对声学模型召回率多次实测得到声学模型平均召回率数据；对电力问题降噪拼音数据集的信噪比进行评估得到声学模型信噪比数据，通过对声学模型响应时间多次实测得到声学模型平均响应时间数据；

11、式中，χ表示语音识别准确系数，a表示声学模型质量修正系数，将对声学模型响应时间召回率依次编号，a0＝1,2,...,a，a0表示对声学模型召回率实测次数的编号，a表示对声学模型召回率实测次数的编号总数，表示第a0个声学模型召回率数据，c表示声学模型信噪比数据，cy表示声学模型预定义标准信噪比数据，将对声学模型响应时间实测次数依次编号，j0＝1,2,...,j，j0表示对声学模型响应时间实测次数的编号，j表示对声学模型响应时间实测次数的编号总数，表示第j0个声学模型平均响应时间数据，ε1、ε2、ε3和ε4表示声学模型质量修正系数、声学模型召回率数据、声学模型信噪比数据和声学模型平均响应时间数据对应语音识别准确系数的权重因子，e表示自然常数。

12、进一步的，所述文本分类准确系数的具体计算过程为：对语言模型在模拟的不同噪声水平、不同说话人以及不同场景下的语音环境中进行测试，对语言模型正确识别的电力问题降噪拼音数据集中词汇样本占总样本的比例统计得到语言模型准确率数据，对语言模型正确识别的电力问题降噪拼音数据集中包含电力问题的样本占总样本的比例统计得到语言模型召回率数据，通过实测得到语言模型搜索最优解所用时间数据；

13、式中，将对语言模型的实测次数依次编号，d0＝1,2,...,d，d0表示对语言模型的实测次数的编号，d表示对语言模型的实测次数的编号总数，γ表示文本分类准确系数，表示第d0个语言模型准确率数据，表示第d0个语言模型召回率数据，h表示语言模型搜索最优解所用时间数据，η1、η2和η3分别表示语言模型准确率数据、语言模型召回率数据和语言模型搜索最优解所用时间数据对应文本分类准确系数的权重因子，β表示文本分类质量修正系数。

14、本技术实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

15、1、通过对电力问题语音数据依次进行降噪、电力问题语音文本数据库构建、声学模型训练、语言模型训练和文本分类，构建电力问题语音识别理解分类模型，从而根据电力问题语音识别理解分类模型和ai语音交互分类检索库自动选择交互的答复，对ai自动交互模块进行整体功能测试，根据功能测试的结果得到语音交互准确系数再次调整优化，进而有效提高在线客服平台中ai语音交互的准确性，解决了现有技术中，存在难以有效提高ai语音交互的准确性的问题。

16、2、通过对电力问题语音数据进行对电力问题语音数据依次进行降噪、电力问题语音文本数据库构建、声学模型训练、语言模型训练和文本分类，构建得到电力问题语音识别理解分类模型，实现了自动化语音识别和语义理解文本分类，从而相比于传统的人工客服，尤其在用电高峰或出现停电等客户诉求集中时刻，减轻了客服人员的工作量，也降低了对于客服人员的需求量，节省了相应的人力成本，进而实现了有效提高ai语音交互的经济性。

17、3、通过电力问题语音文本数据库构建、声学模型训练、语言模型训练和文本分类，改善了传统的人工客服无法有效挖掘电力问题隐藏信息的弊端，从而使语音交互更具有针对性，大大提升语音交互的覆盖范围及效率，及时发现客户的不满需求，有效提升客户服务的精益化管理水平，消除了投诉隐患，进而实现了有效提高ai语音交互在线客服平台管理的科学性。