技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于语音交互的需求响应方法、系统、设备和介质与流程 > 正文

一种基于语音交互的需求响应方法、系统、设备和介质与流程

国知局
2024-06-21 11:48:24

本发明属于人工智能，尤其是涉及一种基于语音交互的需求响应方法、系统、设备和介质。

背景技术：

1、传统的人机交互使用键盘、键区、点击技术和触摸屏显示器等组合，因此在日常生活或办公中，用户通过移动终端或个人终端完成某项需求时，往往要通过繁琐的输入流程实现，用户需要在终端应用中浏览大量的选项，手动输入和获取信息，这一繁琐的需求响应流程十分不便和耗时，同时不能充分了解及记录用户的选择偏好，仅仅提供相对标准化的推荐和选择，用户体验较差。同时，这种操作模式严格限制了用户使用场景，在某些情境下，比如忙碌或用户为视障人士时，用户可能难以方便地使用传统应用，因为这需要手动操作终端界面，传统方式通常依赖于键盘的输入，这大大提高了使用门槛。

2、大型语言模型(large language model，llm)是一种基于大量语料预训练的人工智能模型，可以执行各种nlp任务，包括机器翻译、情感分类等。将大型语言模型接入惠普金融类、便民生活类等终端应用，可以进一步拓宽应用的用户体验，提升产品竞争力。在将大型语言模型接入终端应用过程中，主要会遇到以下技术问题：

3、1.接口适配困难：大型语言模型通常使用特定的编程语言和框架进行开发和训练，与终端应用使用的编程语言和框架往往并不不同。因此，在将大型语言模型接入终端应用时，需要进行接口适配和协议转换，以确保大型语言模型能够与终端应用进行无缝对接。这个过程涉及复杂的编码和调试工作，需要专业的技术人员执行。

4、2.数据集成难题：在将大型语言模型接入终端应用的过程中，需要将大量的数据从不同的数据源进行整合和处理。然而，由于数据源的多样性，数据格式不一致以及数据质量参差不齐等问题使数据集成复杂而耗时。此外，数据安全和隐私保护也是一个重要的问题，大型语言模型通常需要访问和处理大量的敏感数据，如个人身份信息、财务数据和医疗记录等，如果不采取有效的安全和隐私保护措施，可能会导致数据泄露、恶意攻击和合规风险等问题，需要采取相应的措施来确保数据的安全性和合规性。因此，为解决上述问题，需要设计一种基于语音交互的需求响应方法，通过语音交互实现用户的需求。

技术实现思路

1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于语音交互的需求响应方法、系统、设备和介质，通过语音交互实现用户的需求。

2、本发明的目的可以通过以下技术方案来实现：

3、一种基于语音交互的需求响应方法，包括以下步骤：

4、s1、获取语音输入，通过语音识别模型将语音输入转换为文本；

5、s2、对转换文本进行关键词提取，将提取的关键词在数据库中进行匹配，识别用户意图；

6、s3、根据用户意图，调用相应终端应用的api接口。

7、进一步地，所述语音识别模型为隐马尔可夫模型、神经网络模型或高斯混合模型。

8、进一步地，数据库中的数据基于人机交互训练进行更新。

9、进一步地，数据库中的数据基于用户偏好进行更新。

10、进一步地，所述用户偏好利用nlp技术进行识别。

11、进一步地，所述nlp技术包括情感分析、用户画像构建、主题建模中的一种或多种。

12、进一步地，步骤s3中，通过dots实现接口调用。

13、本发明还提供一种基于语音交互的需求响应系统，包括语音识别模块、语义分析模块和语义执行模块，

14、所述语音识别模块用于获取语音输入，通过语音识别模型将语音输入转换为文本；

15、所述语义分析模块用于对转换文本进行关键词提取，将提取的关键词在数据库中进行匹配，识别用户意图；

16、所述语义执行模块用于根据用户意图，调用相应终端应用的api接口。

17、本发明还提供一种电子设备，包括存储器、处理器，以及存储于所述存储器中的程序，所述处理器执行所述程序时实现上述方法。

18、本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述方法。

19、与现有技术相比，本发明具有以下有益效果：

20、1、本发明获取语音输入，通过语音识别模型将语音输入转换为文本；然后对转换文本进行关键词提取，将提取的关键词在数据库中进行匹配，识别用户意图；最后根据用户意图，调用相应终端应用的api接口，通过简单而直观的语音指令，使用户能够轻松表达和实现的需求，避免复杂的词汇或多余的步骤。

21、2、本发明利用nlp技术识别用户的偏好，从而提供更加个性化的推荐和服务；本发明能够理解上下文，以便用户在一次对话中可以连贯地提出多个需求，而不必反复说明。

22、3、本发明能够无缝集成第三方平台的api，使用户在同一个平台上完成大多数日常需求，无需切换多个应用或平台，从语音输入需求到最终完成需求，所有步骤都在同一界面内完成。

技术特征：

1.一种基于语音交互的需求响应方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于语音交互的需求响应方法，其特征在于，所述语音识别模型为隐马尔可夫模型、神经网络模型或高斯混合模型。

3.根据权利要求1所述的一种基于语音交互的需求响应方法，其特征在于，数据库中的数据基于人机交互训练进行更新。

4.根据权利要求1所述的一种基于语音交互的需求响应方法，其特征在于，数据库中的数据基于用户偏好进行更新。

5.根据权利要求4所述的一种基于语音交互的需求响应方法，其特征在于，所述用户偏好利用nlp技术进行识别。

6.根据权利要求5所述的一种基于语音交互的需求响应方法，其特征在于，所述nlp技术包括情感分析、用户画像构建、主题建模中的一种或多种。

7.根据权利要求1所述的一种基于语音交互的需求响应方法，其特征在于，步骤s3中，通过dots实现接口调用。

8.一种基于语音交互的需求响应系统，其特征在于，包括语音识别模块(1)、语义分析模块(2)和语义执行模块(3)，

9.一种电子设备，包括存储器、处理器，以及存储于所述存储器中的程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

技术总结本发明涉及一种基于语音交互的需求响应方法、系统、设备和介质，包括以下步骤：S1、获取语音输入，通过语音识别模型将语音输入转换为文本；S2、对转换文本进行关键词提取，将提取的关键词在数据库中进行匹配，识别用户意图；S3、根据用户意图，调用相应终端应用的API接口。与现有技术相比，本发明可以通过语音交互实现用户的需求，简化用户操作、实现高效的智能交互。技术研发人员：张玲丽,蒋宇飞,徐凯,梁俊斌受保护的技术使用者：上海地面通信息网络股份有限公司技术研发日：技术公布日：2024/5/6