技术新讯 > 电子通信装置的制造及其应用技术 > 基于大模型的AI话务机系统的制作方法 > 正文

基于大模型的AI话务机系统的制作方法

国知局
2024-09-11 14:41:43

本发明涉及语音客服，具体公开了一种基于大模型的ai话务机系统。

背景技术：

1、随着深度学习等人工智能技术的发展，语音识别和自然语言处理技术已经取得了显著的进步。这些技术使得机器能够更准确地理解和响应人类的语言，为ai话务机的发展奠定了基础。

2、ai话务机正逐渐渗透到各个领域，为用户提供更加便捷和高效的服务体验，其中包括客户服务、零售业、旅游业、金融业、教育培训、健康医疗、汽车领域和公共服务等行业。

3、用户对ai话务机的实时响应要求越来越高，需要在用户提出请求后立即作出反应，这对数据处理和响应速度提出了更高的要求。同时，为了提供更加智能和个性化的服务，ai话务机需要处理复杂的深度学习模型和算法，这对计算能力和效率提出了挑战。另外，ai话务机通常部署在边缘设备上，这些设备的资源有限，包括计算能力、存储空间等，如何在有限的资源下实现高效的ai模型部署也是一个挑战。

4、ai话务机的开发和部署需要综合考虑人工智能、边缘计算以及硬件平台的性能等多方面因素。

技术实现思路

1、本项目旨在利用深度学习和边缘设备的进步，开发一种基于大模型的ai话务机系统，以提高语音识别和自然语言处理技术的准确性和效率。该系统旨在满足用户对实时响应和个性化服务的需求，提供更加便捷和高效的服务体验。同时，通过边缘计算架构和优化的硬件平台，解决ai话务机在数据处理、计算能力和资源限制方面的挑战，实现在有限资源下的高效部署和运行。通过综合考虑人工智能、边缘计算和硬件平台等多方面因素，推动ai话务机技术在各个领域的应用和发展，提升用户体验和服务质量。

2、为实现上述目的，本发明提供如下技术方案：一种基于大语言模型的招投标文件信息抽取方法，该方法包括以下步骤：

3、步骤1：用户绑定设备

4、每个设备都对应唯一的二维码，用户通过扫描二维码并配置wifi即可实现设备的绑定。

5、步骤2：用户创建对话配置

6、用户可以配置多个对话流，并随意将其与设备关联，每个对话流都包含一段完整的对话。系统接收用户的语音输入后，对其进行分析和识别，包括将语音转换为文本、文本匹配以及文本合成为语音，最终给出对应用户输入的回答。

7、步骤3：设备端接收对话配置并获取语音

8、每个对话配置完成后，系统会提取保存的文本并转换为语音，供设备端使用，设备接收到对话配置后，就会获取对应的语音。

9、步骤4：用户创建呼出配置

10、多个对话配置可作为呼出配置的选项，用户可以自定义多个呼出配置，并将其推送到设备端，实现个性化配置。

11、步骤5：设备端接收呼出配置并创建定时任务

12、设备端接收到呼出配置后，首先将数据存储到数据库中，并根据呼出配置中的呼出时间字段创建定时任务。

13、步骤6：设备端呼出电话

14、设备端先初始化usb串口，然后在预先设定的时间呼出电话给客户。

15、步骤7：设备端与客户进行问答

16、设备端首先播放开始节点的欢迎语音，然后逐个播放问题节点的语音，并收集客户的语音回答。每当客户回答完一个问题后，设备端会将客户回答的语音内容存储在本地，并将路径写入数据库。这个过程会持续直到最后一个问题节点。

17、步骤8：设备端向云端请求相关性分析

18、设备端通过语音识别技术将用户的语音回答转换为文本，并结合预设的提示词生成一个查询请求。云端服务利用先进的glm等大模型对用户的文本回答进行相关性分析，评估其与预设问题之间的关联度。这不仅涉及对用户回答内容的理解，还包括对整个对话上下文的考量，以确保返回的相关性评分准确反映用户意图。云端服务的响应随后被设备端接收，用于指导后续的对话流程，实现更加智能化和个性化的用户体验。

19、步骤9：设备端向云端请求结果反馈

20、设备端在完成与客户的通话记录收集后，将这些数据上传至云端服务。云端服务接收到数据，利用先进的分析工具对通话内容进行深入分析，构建出针对性的提示词，并以此向大模型发起查询请求。大模型处理这些提示词后，生成并返回包含评价和建议的结果反馈。设备端接收到这些反馈信息，用于进一步优化销售策略和提升客户服务体验。

21、本发明和现有技术相比，具有以下优点：

22、(1)本发明的配置wifi是基于移动端硬件接口对当前wifi连接和硬件设备的一个关联。

23、(2)本发明的对话流是基于流程图的形式来展示问题和回答以及它们之间的关系。

24、(3)本发明为了提高服务效率，对话配置的文本在进行语音合成后将在服务端进行获取保存。

25、(4)本发明在用户自定义呼出配置后自动推送到设备端，自助服务模式不仅提高了客户满意度，也显著降低了企业的运营成本。

26、(5)本发明使用nvidia jetson orin nano作为边缘设备，显著提升ai话务机的响应速度。

技术特征：

1.一种ai话务机系统的对话配置方法具有以下特征：每个设备都对应唯一的二维码，用户通过扫描二维码并配置wifi即可实现设备的绑定；用户可以配置多个对话流，并随意将其与设备关联，每个对话流都包含一段完整的对话。系统接收用户的语音输入后，对其进行分析和识别，包括将语音转换为文本、文本匹配以及文本合成为语音，最终给出对应用户输入的回答；每个对话配置完成后，系统会提取保存的文本并转换为语音，供设备端使用；多个对话配置可作为呼出配置的选项，用户可以自定义多个呼出配置，并将其推送到设备端，实现个性化配置。

2.根据权利要求1所述方法，其特征在于，所述配置wifi是基于移动端硬件接口对当前wifi连接和硬件设备的一个关联。

3.根据权利要求1所述方法，其特征在于，所述对话流是基于流程图的形式来展示问题和回答以及它们之间的关系。

4.根据权利要求1所述方法，其特征在于，选取与对话配置相应的对话文本转化为语音向用户输出应答，包括将所述语音关联到设备。

5.根据权利要求1所述方法，其特征在于，还包括对设备的选定，呼出号码的配置以及重复次数的设置，关联对话配置后存储在呼出历史数据库。

6.一个ai话务机系统的边缘设备具有一下特征：设备可以接收云端推送的数据，并把数据持久化到数据库，然后根据数据创建定时任务，在设定的时间呼出电话，在问答过程结束后，设备向云端请求问题和回答的相关性分析，最后再向云端请求问答流程的结果反馈。

7.根据权利要求6所述的方法，其特征在于，所述设备端接收数据包括设备端接收对话配置，并向云端请求对话配置中结点文本的语音，然后接收呼出配置，并根据呼出配置中的呼出时间字段创建定时任务。

8.根据权利要求6所述的方法，其特征在于，所述设备端呼出电话包括设备端初始化usb串口后，呼出电话给客户。

9.根据权利要求6所述的方法，其特征在于，所述设备端与客户进行问答包括设备端播放开始结点文本转成的语音，之后逐个问题播放，用户逐个回答，直到结束任务结点。

10.根据权利要求6所述的方法，其特征在于，所述设备端进行语音识别包括将语音流式地输入到语音识别模型，然后输出文本。

11.根据权利要求6所述的方法，其特征在于，所述语音识别模型包括从paraformer、whisper等预训练模型中选择适用于语音识别的模型，并采用全量微调实现粤语、英语和中文的混合识别。

12.根据权利要求1所述的方法，其特征在于，所述设备端与客户的通话记录会及时保存于云端数据库，云侧服务对对话内容进行识别和分析。

13.根据权利要求1所述的方法，其特征在于，所述云侧服务通过精心设计提示词请求glm大模型，获取客户回答内容与问题的相关性分析后反馈给设备端进行处理。

14.根据权利要求1所述的方法，其特征在于，所述设备端在与用户问答结束时向云侧服务请求结果反馈，云侧服务基于完整通话记录构造特定提示词，请求大模型获取对整个通话记录的评价性反馈并抽取特定json结构用于数据存档。

技术总结本发明涉及语音客服技术领域，具体公开了一种基于大模型的AI话务机系统。本方法包括：用户通过小程序扫描二维码绑定设备，创建对话配置并推送到设备端；设备端根据对话配置获取对话结点文本的语音；用户创建呼出配置并推送到设备端；设备端接收呼出配置后，在设定的时间呼出电话给客户，逐个播放问题并收集客户回答的语音；设备端将客户语音内容识别成文字，直到问答结束；在结束结点后，设备端向云端请求问题和回答的相关性分析，并将结果语音播放给客户。最后，设备端向云端请求整个问答流程的结果反馈，并将结果语音播放给客户。本发明可以应用在营销话术培训、营销复盘和智能语音客服等多个领域。技术研发人员：龙育诚,张镇鑫,徐健杭,任晓军,肖福安,吴柏霖,刘学志,张叶馨受保护的技术使用者：广州数志科技有限公司技术研发日：技术公布日：2024/9/9