屏幕的语音控制方法、装置、电子设备和存储介质与流程
- 国知局
- 2024-06-21 11:50:56
本技术属于人工智能,特别涉及一种屏幕的语音控制方法、装置、电子设备和存储介质。
背景技术:
1、随着智能设备的日益发展,用户可以通过人工智能对各种各样的设备进行自动化控制,其中智能大屏作为一种具有双向、智能、人机互动功能的新家庭电视大屏,包括智能电视和双向有线电视等等。在内容呈现上智能大屏提供了优质服务与丰富的交互形式,在广告上智能大屏拥有了数字化属性。
2、相关技术中通常会采用大语言模型来基于用户输入来对大屏幕进行控制,大语言模型是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。大语言模型的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。因此采用大语言模型需要智能设备具有较高的处理能力,这就提高了采用大语言模型对屏幕进行控制的设备门槛,而且由于计算量较大,用户采用大语言模型对屏幕进行控制时,往往需要等待较长的响应时间,降低了屏幕智能化控制的效率。
技术实现思路
1、本技术提供了一种屏幕的语音控制方法、装置、电子设备和存储介质。
2、本技术一些实施例提供一种屏幕的语音控制方法,所述方法包括:
3、接收用户对于屏幕输入的语音信息;
4、利用语音识别模型将所述语音信息转换为文本信息;
5、将所述文本信息输入至大语言模型,以将所述文本信息中包含的目标问题信息转换为短编码指令;
6、在指令表中查询与所述短编码指令相对应的目标控制指令,所述指令表包括不同控制指令与短编码指令之间的指令对;
7、基于所述目标控制指令对所述屏幕进行控制。
8、可选地,在所述将所述文本信息输入至大语言模型,以将所述文本信息中包含的目标问题信息转换为短编码指令之后,所述方法还包括:
9、在所述指令表中不存在所述目标问题信息对应的短编码指令时,获取所述大语言模型对于所述文本信息输出的目标问题信息;
10、获取问题表中各个问题信息与所述目标问题信息之间的相似度,所述问题表包括不同问题信息与控制指令之间的关联关系;
11、将符合相似度要求的问题信息对应的控制指令作为目标控制指令。
12、可选地,所述将符合相似度要求的问题信息对应的控制指令作为目标控制指令,包括:
13、筛选出多个所述相似度符合相似度要求的候选问题信息;
14、将所述候选问题信息进行显示;
15、响应于用户对于所述候选问题信息的选取操作,将所述选取操作所指示的候选问题信息对应的控制指令,作为目标控制指令。
16、可选地,所述筛选出多个所述相似度符合相似度要求的候选问题信息,包括:
17、从所述问题表中筛选出相似度最大的符合目标数量的候选问题信息。
18、可选地,所述大语言模型通过以下步骤得到:
19、利用所述指令表中的短编码控制指令对样本数据进行标注,得到样本数据集;
20、利用所述样本数据集对待训练的大语言模型进行训练;
21、对训练后的大语言模型中的模型参数进行微调,以使得模型参数降低到目标参数数量,以及模型损失值降低达到目标损失值。
22、可选地,在所述基于所述控制指令对所述屏幕进行控制之后,所述方法还包括:
23、将所述目标控制指令的执行结果输入至语音合成模型,得到对于所述语音信息的答复信息,输出所述答复信息。
24、可选地,在所述利用语音识别模型将所述语音信息转换为文本信息之后,所述方法还包括:
25、对所述文本信息中符合停用词要求的字符进行剔除。
26、本技术一些实施例提供一种屏幕的语音控制装置,所述装置包括:
27、输入模块,用于接收用户对于屏幕输入的语音信息;
28、语音模块,用于利用语音识别模型将所述语音信息转换为文本信息;
29、将所述文本信息输入至大语言模型,以将所述文本信息中包含的目标问题信息转换为短编码指令;
30、在指令表中查询与所述短编码指令相对应的目标控制指令,所述指令表包括不同控制指令与短编码指令之间的指令对;
31、控制模块,用于基于所述目标控制指令对所述屏幕进行控制。
32、可选地,所述语音模块,还用于:
33、在所述指令表中不存在所述目标问题信息对应的短编码指令时,获取所述大语言模型对于所述文本信息输出的目标问题信息;
34、获取问题表中各个问题信息与所述目标问题信息之间的相似度,所述问题表包括不同问题信息与控制指令之间的关联关系;
35、将符合相似度要求的问题信息对应的控制指令作为目标控制指令。
36、可选地,所述语音模块,还用于:
37、筛选出多个所述相似度符合相似度要求的候选问题信息;
38、将所述候选问题信息进行显示;
39、响应于用户对于所述候选问题信息的选取操作,将所述选取操作所指示的候选问题信息对应的控制指令,作为目标控制指令。
40、可选地,所述语音模块,还用于:
41、从所述问题表中筛选出相似度最大的符合目标数量的候选问题信息。
42、可选地,所述装置还模块,训练模块,用于:
43、利用所述指令表中的短编码控制指令对样本数据进行标注,得到样本数据集;
44、利用所述样本数据集对待训练的大语言模型进行训练;
45、对训练后的大语言模型中的模型参数进行微调,以使得模型参数降低到目标参数数量,以及模型损失值降低达到目标损失值。
46、可选地,所述语音模块,还用于:
47、将所述目标控制指令的执行结果输入至语音合成模型,得到对于所述语音信息的答复信息,输出所述答复信息。
48、可选地,所述语音模块,还用于:
49、对所述文本信息中符合停用词要求的字符进行剔除。
50、本技术一些实施例提供一种计算处理设备,包括:
51、存储器,其中存储有计算机可读代码;
52、一个或多个处理器,当所述计算机可读代码被所述一个或多个处理器执行时,所述计算处理设备执行如上述所述的屏幕的语音控制方法。
53、本技术一些实施例提供一种计算机程序,包括计算机可读代码,当所述计算机可读代码在计算处理设备上运行时,导致所述计算处理设备执行如上述的屏幕的语音控制方法。
54、本技术一些实施例提供一种非瞬态计算机可读介质,其中存储了如上述的屏幕的语音控制方法。
55、本技术一些实施例提供的屏幕的语音控制方法、装置、电子设备和存储介质,通过利用短编码指令来替换大语言模型对于输入问题信息的答复,然后利用大语言模型输出的短编码指令来查询对应的控制指令,以对屏幕进行控制,较少了大语言模型生成指令所需处理的数据量,不仅可以减少大语言模型处理数据所需消耗的处理资源,而且提高了利用大语言模型对屏幕进行控制的效率。
56、上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23954.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表