技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于方言的业务辅助处理方法、装置及电子设备与流程 > 正文

基于方言的业务辅助处理方法、装置及电子设备与流程

国知局
2024-06-21 11:33:11

本申请涉及人工智能领域，具体而言，涉及一种基于方言的业务辅助处理方法、装置及电子设备。

背景技术：

1、方言是部分地区历史和文化的重要载体，然而随着交际方式和语言环境的改变，大部分人对方言的了解不足，导致员工为使用方言的本地人办理业务时较为困难。通过技术手段帮助员工合理正确的使用方言，不仅能为只会使用方言的客群提供服务，还能迅速拉近员工与当地客户的距离。在金融机构的网点办理业务时，嘈杂的环境声音以及客户普通话、方言、负面情绪用语混杂的语音情况无疑也加大了方言识别的困难。

2、针对相关技术中由于方言难以理解导致业务处理效率低的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请的主要目的在于提供一种基于方言的业务辅助处理方法、装置、存储介质及电子设备，以解决相关技术中由于方言难以理解导致业务处理效率低的问题。

2、为了实现上述目的，根据本申请的一个方面，提供了一种基于方言的业务辅助处理方法。该方法包括：获取目标客户的方言语音，并从方言语音中提取目标语音特征；确定方言语音中出现预设用语的次数，得到目标次数，并判断目标次数是否小于次数阈值，其中，预设用语为表征目标客户的负面情绪的用语；在目标次数小于次数阈值的情况下，将目标语音特征输入目标模型，得到语义信息，其中，目标模型由多组第一训练样本训练得到，每组第一训练样本包括历史语音特征和历史语义信息；通过语义信息确定目标客户需要办理的业务类型，调用业务类型对应的应用程序对目标客户提供服务。

3、可选地，从方言语音中提取目标语音特征包括：将方言语音输入预设降噪模型，得到方言语音的复比掩码，其中，预设降噪模型由多组第二训练样本训练得到，每组第二训练样本包括样本语音和样本掩码；对方言语音进行短时傅里叶变换处理，得到方言语音的频谱数据；通过逐元乘法计算频谱数据与复比掩码的积，得到掩码后的频谱数据；对掩码后的频谱数据进行短时傅里叶逆变换处理，得到降噪后的目标语音；从目标语音中提取出梅尔倒谱系数特征，得到目标语音特征。

4、可选地，预设降噪模型由以下方式得到：获取多个样本掩码和每个样本掩码对应的样本语音，将样本掩码与样本掩码对应的样本语音组合，得到多组第二训练样本；确定初始降噪模型的第一模型参数和预设损失函数，并将多组第二训练样本输入初始降噪模型进行训练，得到损失值；通过更新第一模型参数对初始降噪模型进行多次训练，得到多次训练后的一组损失值；将一组损失值中最小损失值对应的第一模型参数确定为目标参数，并将设置了目标参数的初始降噪模型确定为预设降噪模型。

5、可选地，确定方言语音中出现预设用语的次数，得到目标次数包括：确定预设语料库中的多条预设用语的预设语音，将方言语音和每条预设语音进行对比；在方言语音中存在与预设语音相同的部分语音的情况下，确定方言语音中存在预设用语，统计预设语音在方言语音中出现的次数，得到目标次数；在方言语音中不存在与预设语音相同的部分语音的情况下，确定目标次数为零。

6、可选地，目标模型由以下方式得到：确定需要服务的客户的n种方言，获取每种方言的历史语音特征和历史语义信息，其中，n为正整数；将每个历史语音特征和历史语音特征对应的历史语义信息确定为一组第一训练样本，得到多组第一训练样本；确定n个初始神经网络模型的第二模型参数，通过初始神经网络模型的隐藏层的参数共享机制确定平均损失函数；将每种方言对应的第一训练样本输入一个初始神经网络模型进行训练，得到n个初始神经网络模型的平均损失值；通过更新第二模型参数对n个初始神经网络模型进行多次训练，确定每次训练后的一组第二模型参数，得到多组第二模型参数，其中，一组第二模型参数中的每个初始神经网络模型对应一个第二模型参数；确定每组第二模型参数对应的平均损失值，得到一组平均损失值；将一组平均损失值中最小平均损失值对应的一组第二模型参数确定为目标参数组，将每个初始神经网络模型的参数设置为目标参数组中第二模型参数，得到n个子目标模型，将n个子目标模型进行组合，得到目标模型。

7、可选地，在得到语义信息之后，该方法还包括：确定方言语音的标准语义信息，通过语义信息与标准语义信息的对比结果确定目标模型的翻译准确率；在翻译准确率小于准确率阈值的情况下，将方言语音和标准语义信息确定为新增训练样本；将新增训练样本和多组第一训练样本进行组合，得到更新后的多组第一训练样本；基于更新后的多组第一训练样本训练目标模型，得到更新后的目标模型。

8、可选地，在判断目标次数是否小于次数阈值之后，该方法还包括：在目标次数大于等于次数阈值的情况下，发出提示信息，其中，提示信息用于提示目标业务员对目标客户提供服务，目标业务员为掌握方言语音对应的方言的业务员。

9、为了实现上述目的，根据本申请的另一方面，提供了一种基于方言的业务辅助处理装置。该装置包括：获取单元，用于获取目标客户的方言语音，并从方言语音中提取目标语音特征；第一确定单元，用于确定方言语音中出现预设用语的次数，得到目标次数，并判断目标次数是否小于次数阈值，其中，预设用语为表征目标客户的负面情绪的用语；输入单元，用于在目标次数小于次数阈值的情况下，将目标语音特征输入目标模型，得到语义信息，其中，目标模型由多组第一训练样本训练得到，每组第一训练样本包括历史语音特征和历史语义信息；第二确定单元，用于通过语义信息确定目标客户需要办理的业务类型，调用业务类型对应的应用程序对目标客户提供服务。

10、通过本申请，采用以下步骤：获取目标客户的方言语音，并从方言语音中提取目标语音特征；确定方言语音中出现预设用语的次数，得到目标次数，并判断目标次数是否小于次数阈值，其中，预设用语为表征目标客户的负面情绪的用语；在目标次数小于次数阈值的情况下，将目标语音特征输入目标模型，得到语义信息，其中，目标模型由多组第一训练样本训练得到，每组第一训练样本包括历史语音特征和历史语义信息；通过语义信息确定目标客户需要办理的业务类型，调用业务类型对应的应用程序对目标客户提供服务，解决了相关技术中由于方言难以理解导致业务处理效率低的问题。通过对方言语音提取目标语音特征，并通过目标语音特征和目标模型获取语义信息，基于语义信息处理业务，进而达到了避免目标客户的方言理解困难，提高业务处理效率的效果。

技术特征：

1.一种基于方言的业务辅助处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，从所述方言语音中提取目标语音特征包括：

3.根据权利要求2所述的方法，其特征在于，所述预设降噪模型由以下方式得到：

4.根据权利要求1所述的方法，其特征在于，确定所述方言语音中出现预设用语的次数，得到目标次数包括：

5.根据权利要求1所述的方法，其特征在于，所述目标模型由以下方式得到：

6.根据权利要求1所述的方法，其特征在于，在得到语义信息之后，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，在判断所述目标次数是否小于次数阈值之后，所述方法还包括：

8.一种基于方言的业务辅助处理装置，其特征在于，包括：

9.一种非易失性存储介质，其特征在于，所述非易失性存储介质包括存储的程序，其中，所述程序运行时控制所述非易失性存储介质所在的设备执行权利要求1至7中任意一项所述的基于方言的业务辅助处理方法。

10.一种电子设备，其特征在于，包括一个或多个处理器和存储器，所述存储器用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至7中任意一项所述的基于方言的业务辅助处理方法。

技术总结本申请公开了一种基于方言的业务辅助处理方法、装置及电子设备。涉及人工智能领域，该方法包括：获取目标客户的方言语音，从方言语音中提取目标语音特征；确定方言语音中出现预设用语的次数，得到目标次数，判断目标次数是否小于次数阈值，其中，预设用语为表征目标客户的负面情绪的用语；在目标次数小于次数阈值的情况下，将目标语音特征输入目标模型，得到语义信息，其中，目标模型由多组第一训练样本训练得到，每组第一训练样本包括历史语音特征和历史语义信息；通过语义信息确定目标客户需要办理的业务类型，调用业务类型对应的应用程序对目标客户提供服务。通过本申请，解决了相关技术中由于方言难以理解导致业务处理效率低的问题。技术研发人员：李敏受保护的技术使用者：中国工商银行股份有限公司技术研发日：技术公布日：2024/3/11