技术新讯 > 电子通信装置的制造及其应用技术 > 一种显示设备及媒资推荐方法与流程 > 正文

一种显示设备及媒资推荐方法与流程

国知局
2024-09-05 14:21:49

本技术涉及显示设备，尤其涉及一种显示设备及媒资推荐方法。

背景技术：

1、显示设备是能够呈现用户界面，并支持用户交互的智能设备。以智能电视为例，智能电视是基于internet应用技术，具备开放式操作系统与芯片，拥有开放式应用平台，可实现双向人机交互功能，集影音、娱乐、数据等多种功能于一体的电视产品，用于满足用户多样化和个性化需求。显示设备可以呈现不同的媒资推荐界面，媒资推荐界面可以包括多个媒资选项，以供用户进行选择和播放。

2、为了提高交互效率，显示设备还可以配置有语音交互功能，用户可以向显示设备输入语音交互指令来实现不同的功能。显示设备在接收到用户输入的语音指令后，可以对语音指令的文本进行分析，如语音文本提取、语义理解等，再根据对语音文本的分析结果来响应语音指令，执行对应的程序。例如，用户可以向显示设备输入“搜索一些电影”的语音指令，显示设备在接收到上述语音指令后，则获取并显示电影类型的媒资项目，从而实现基于语音方式的快捷交互。

3、但是，上述语音交互方式仅能通过语音指令中的文本来响应语音指令，局限性较高，如不同的用户输入相同文本的语音指令时，显示设备显示的媒资项目都是一致的。这样，显示设备在显示媒资项目后，用户可能需要再进行多次操作才可以查询到期望的媒资项目，导致显示设备的语音交互效率下降，影响用户体验。

技术实现思路

1、本技术提供一种显示设备及媒资推荐方法，以解决显示设备中语音交互效率低的问题。

2、第一方面，本技术一些实施例提供一种显示设备，包括显示器、检测器与控制器。其中，所述显示器被配置为显示用户界面，所述检测器被配置为采集用户输入的语音数据，所述控制器被配置为执行以下程序步骤：

3、响应于用户通过语音交互方式输入的媒资查询指令，解析所述媒资查询指令的目标语音数据；

4、提取所述目标语音数据的音频特征，所述音频特征包括第一特征和第二特征，所述第一特征为第一分类器的分类结果，所述第二特征为第二分类器的分类结果，所述第一分类器的归一化指数层与所述第二分类器的归一化指数层不同；

5、根据所述音频特征查询目标媒资类型；

6、获取所述目标媒资类型关联的目标媒资项目，以及控制所述显示器显示所述目标媒资项目。

7、本技术一些实施例中，所述控制器执行提取所述目标语音数据的音频特征，被配置为：按照第一类声纹特征对所述目标语音数据执行编码，以生成第一编码向量；通过所述第一分类器的归一化指数层预测所述目标语音数据的第一概率值组，所述第一分类器的归一化指数层包括第一节点和第二节点，所述第一概率值组包括所述第一节点的概率值和所述第二节点的概率值，所述第一概率值组中概率值的和值等于1；提取第一目标标签值，所述第一目标标签值为所述第一概率值组中最大概率值对应的标签值；查询所述第一目标标签值关联的第一分类结果；输出所述第一分类结果，以生成所述第一特征。

8、本技术一些实施例中，所述控制器执行输出所述第一分类结果前，还被配置为：获取预设真实标签的基础标签值；根据所述基础标签值和所述第一概率值组计算损失函数值，所述损失函数值根据交叉熵损失函数计算得出；根据所述损失函数值计算第一梯度；将所述第一梯度回传至所述第一分类器，以更新所述第一分类器的内部变量；所述内部变量包括权重、偏置、激活函数参数以及正则化参数中的至少一项。

9、本技术一些实施例中，所述控制器执行提取所述目标语音数据的音频特征，被配置为：按照第二类声纹特征对所述目标语音数据执行编码，以生成第二编码向量；通过所述第二分类器的归一化指数层预测所述目标语音数据的第二概率值组，所述第二分类器的归一化指数层包括第三节点、第四节点和第五节点，所述第二概率值组包括所述第三节点的概率值、所述第四节点的概率值以及所述第五节点的概率值，所述第二概率值组中概率值的和值等于1；提取第二目标标签值，所述第二目标标签值为所述第二概率值组中最大概率值对应的标签值；查询所述第二目标标签值关联的第二分类结果；输出所述第二分类结果，以生成所述第二特征。

10、本技术一些实施例中，所述控制器执行输出所述第二分类结果前，被配置为：获取预设真实标签的基础标签值；根据所述基础标签值和所述第二概率值组计算损失函数值，所述损失函数值根据交叉熵损失函数计算得出；根据所述损失函数值计算第二梯度；将所述第二梯度回传至所述第二分类器，以更新所述第二分类器的内部变量；所述内部变量包括权重、偏置、激活函数参数以及正则化参数中的至少一项。

11、本技术一些实施例中，所述控制器还被配置为：解析所述目标语音数据的声纹特征，所述声纹特征包括语调特征、语速特征和高音特征中至少一项；将所述声纹特征输入至所述第一分类器与所述第二分类器，以使所述第一分类器和所述第二分类器对所述目标语音数据执行编码。

12、本技术一些实施例中，所述控制器还被配置为：对所述目标语音数据执行预处理，以生成语音处理数据，所述预处理包括去噪声与前后端去静音中至少一项；将所述语音处理数据输入至所述第一分类器与所述第二分类器，以使所述第一分类器与所述第二分类器并行提取所述第一特征与所述第二特征。

13、本技术一些实施例中，所述第一分类器还包括第一卷积神经网络、第一循环神经网络和第一线性层；所述第二分类器还包括第二卷积神经网络、第二循环神经网络和第二线性层；所述第一卷积神经网络和所述第二卷积神经网络均包括残差结构。

14、本技术一些实施例中，所述控制器还被配置为：根据所述音频特征获取第一列表和第二列表，所述第一列表用于记录优先显示的媒资类型，所述第二列表用于记录禁止显示的媒资类型；按照第一列表查询第一媒资项目，所述第一媒资项目为所述第一列表所记录媒资类型对应的媒资项目；根据所述第二列表筛除所述第一媒资项目中的第二媒资项目，以获得所述目标媒资项目；所述第二媒资项目为所述第二列表所记录媒资类型对应的媒资项目，所述目标媒资项为所述第一媒资项目中除所述第二媒资项目外的媒资项目。

15、第二方面，本技术一些实施例还提供一种媒资推荐方法，可以应用于第一方面提供的显示设备，所述方法包括以下步骤：

16、响应于用户通过语音交互方式输入的媒资查询指令，解析所述媒资查询指令的目标语音数据；

17、提取所述目标语音数据的音频特征，所述音频特征包括第一特征和第二特征，所述第一特征为第一分类器的分类结果，所述第二特征为第二分类器的分类结果，所述第一分类器的归一化指数层与所述第二分类器的归一化指数层不同；

18、根据所述音频特征查询目标媒资类型；

19、获取所述目标媒资类型关联的目标媒资项目，以及控制显示器显示所述目标媒资项目。

20、由以上技术方案可知，本技术一些实施例提供的显示设备及媒资推荐方法，所述方法可以响应于用户通过语音交互方式输入的媒资查询指令，解析媒资查询指令的目标语音数据，并提取目标语音数据的音频特征。其中，音频特征包括第一特征和第二特征，第一特征为第一分类器的分类结果，第二特征为第二分类器的分类结果，第一分类器的归一化指数层与第二分类器的归一化指数层不同。再根据音频特征查询目标媒资类型，并获取目标媒资类型关联的目标媒资项目，以及控制显示器显示目标媒资项目。所述方法通过不同的分类器提取语音指令中不同维度的音频特征，再基于提取出的音频特征来显示媒资项目，使显示的媒资项目更贴近用户需求，从而提高显示设备的语音交互效率。