技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种确定用户处于聊天状态的方法及装置与流程 > 正文

一种确定用户处于聊天状态的方法及装置与流程

国知局
2024-06-21 11:55:31

本发明涉及语音交互领域，尤其涉及一种确定用户处于聊天状态的方法及装置。

背景技术：

1、当前，在不清楚用户数目的情况下，通过语义理解的方式来确定用户的数目以及判断用户是否处于聊天状态，一定程度上侵犯了用户的隐私。因此，需要一种非语义理解的方式来确定用户的数目和状态。

技术实现思路

1、本发明提供一种确定用户处于聊天状态的方法及装置，用以解决当前通过语义理解的方式确定用户的数目以及判断用户是否处于聊天状态侵犯用户隐私的问题。

2、第一方面，本发明实施例提供一种确定用户处于聊天状态的方法，包括：

3、获取n个声纹片段，根据所述n个声纹片段确定n个特征向量，所述n个声纹片段与所述n个特征向量一一对应，n为大于2的正整数；

4、根据所述n个特征向量中任意两个特征向量之间的距离确定k个第一特征向量组，以及每个第一特征向量组包括的特征向量，其中，每个第一特征向量组包括至少两个特征向量，k小于或等于n，k为大于等于2正整数；

5、在所述n个特征向量中存在至少一个特征向量属于至少两个第一特征向量组时，则确定所述n个声纹片段对应于至少两个用户，且所述至少两个用户处于聊天状态。

6、通过上述方法，可以在未知用户数目的情况下，通过计算用户声纹片段特征向量之间的距离将声纹片段的特征向量分别划分到多个第一特征向量组中，在至少两个第一特征向量组中存在相同的特征向量时，可以确定该特征向量对应的声纹片段属于至少两个用户，进而无需通过语义理解即可判断出至少两个用户处在聊天状态。解决了使用语义理解的方式判断用户的数目和使用语义理解的方式确定用户是否处在聊天状态侵犯用户隐私的问题。

7、可选地，所述n个特征向量中大于或等于第一预设比例的特征向量被划分至所述k个第一特征向量组。

8、可选地，根据所述n个特征向量中任意两个特征向量之间的距离确定所述k个第一特征向量组，包括：

9、计算所述n个特征向量中任意两个特征向量之间的距离，获得距离集合1，根据所述距离集合1中的最小距离确定特征向量组集合1，其中，所述特征向量组集合1包括至少一个特征向量组；

10、计算所述特征向量组集合1中的每个特征向量组与所述n个特征向量中未包括在该特征向量组的特征向量之间的距离，获得距离集合2，根据所述距离集合2中的最小距离确定特征向量组集合2，其中，所述特征向量组集合2包括至少一个特征向量组；

11、若特征向量组集合i中包括的非重复的特征向量的数量与n的比值大于或等于所述第一预设比例，则将所述特征向量组集合i包括的特征向量组作为所述k个第一特征向量组，其中，i为大于等于1的正整数。

12、可选地，根据所述n个特征向量中任意两个特征向量之间的距离确定所述k个第一特征向量组，包括：

13、计算所述n个特征向量中任意两个特征向量之间的距离，获得距离集合1，根据所述距离集合1中的最小距离确定特征向量组集合1，其中，所述特征向量组集合1包括至少一个特征向量组；

14、计算所述特征向量组集合1中的每个特征向量组与所述n个特征向量中未包括在该特征向量组的特征向量之间的距离，获得距离集合2，根据所述距离集合2中的最小距离确定特征向量组集合2，其中，所述特征向量组集合2包括至少一个特征向量组；

15、若特征向量组集合i中包括的非重复的特征向量的数量与n的比值大于或等于所述第一预设比例，则将所述特征向量组集合i包括的特征向量组作为所述k个第二特征向量组，其中，i为大于等于1的正整数；

16、将所述k带入聚类算法对所述特征向量组集合i包括的非重复的特征向量进行聚类，得到所述k个第一特征向量组。

17、通过上述方法，将第二特征向量组的数目k带入聚类算法进行聚类，得到k个第一特征向量组，从而可以采用k个第一特征向量组检验每个第二特征向量组包含的特征向量是否正确。

18、可选地，在确定所述n个特征向量中存在至少一个特征向量属于至少两个第一特征向量组之前，还包括：

19、根据所述k个第二特征向量组和所述k个第一特征向量组计算第一参数值，所述第一参数值用于指示所述k个第二特征向量组和所述k个第一特征向量组之间的相关程度；

20、确定所述第一参数值大于或等于预设阈值。

21、可选地，在所述第一参数值小于所述预设阈值时，根据所述n个特征向量中的任意两个特征向量之间的距离确定m个第三特征向量组，其中，所述m个第三特征向量组包括的非重复的特征向量的数量与n的比值大于或等于第二预设比例，且小于所述第一预设比例；所述第二预设比例小于所述第一预设比例，m小于或等于n，m为大于等于2正整数。

22、可选地，在确定所述n个声纹片段对应于至少两个用户，且所述至少两个用户处于聊天状态之前，包括：

23、确定所述n个声纹片段中所述至少两个用户对应的p个声纹片段，所述p个声纹片段的总时长大于或等于第一预设时长；

24、或者，确定所述n个声纹片段中所述至少两个用户对应的p个声纹片段，所述p与所述k个第一特征向量组包括的非重复的特征向量的数量的比值大于或等于预设比值；其中，p为正整数。

25、通过上述方法，可以提升确定n个声纹片段对应的至少两个用户处于聊天状态的准确度。

26、可选地，还包括：

27、在确定所述至少两个用户处于聊天状态时，若处于音频播放状态或视频播放状态，播放语音信息，所述语音信息用于询问是否降低正在播放的文件的音量或是否暂停正在播放的文件。

28、通过上述方法，在处于音频播放状态或视频播放状态且用户处于聊天状态时，终端设备可以主动询问是否降低正在播放的文件的音量或是否暂停正在播放的文件，可以提高终端设备的智能化程度，提升用户体验。

29、第二方面，本发明实施例提供一种确定用户处于聊天状态的装置，包括：

30、收发单元，用于获取n个声纹片段，根据所述n个声纹片段确定n个特征向量，所述n个声纹片段与所述n个特征向量一一对应，n为大于2的正整数；

31、处理单元，用于根据所述n个特征向量中任意两个特征向量之间的距离确定k个第一特征向量组，以及每个第一特征向量组包括的特征向量，其中，每个第一特征向量组包括至少两个特征向量，k小于或等于n，k为大于等于2正整数；

32、所述处理单元，用于在所述n个特征向量中存在至少一个特征向量属于至少两个第一特征向量组时，确定所述n个声纹片段对应于至少两个用户，且所述至少两个用户处于聊天状态。

33、可选地，所述n个特征向量中大于或等于第一预设比例的特征向量被划分至所述k个第一特征向量组。

34、可选地，所述处理单元，用于在根据所述n个特征向量中任意两个特征向量之间的距离确定所述k个第一特征向量组时，计算所述n个特征向量中任意两个特征向量之间的距离，获得距离集合1，根据所述距离集合1中的最小距离确定特征向量组集合1，其中，所述特征向量组集合1包括至少一个特征向量组；

35、计算所述特征向量组集合1中的每个特征向量组与所述n个特征向量中未包括在该特征向量组的特征向量之间的距离，获得距离集合2，根据所述距离集合2中的最小距离确定特征向量组集合2，其中，所述特征向量组集合2包括至少一个特征向量组；

36、若特征向量组集合i中包括的非重复的特征向量的数量与n的比值大于或等于所述第一预设比例，则将所述特征向量组集合i包括的特征向量组作为所述k个第一特征向量组，其中，i为大于等于1的正整数。

37、可选地，所述处理单元，用于在根据所述n个特征向量中任意两个特征向量之间的距离确定所述k个第一特征向量组时，计算所述n个特征向量中任意两个特征向量之间的距离，获得距离集合1，根据所述距离集合1中的最小距离确定特征向量组集合1，其中，所述特征向量组集合1包括至少一个特征向量组；

38、计算所述特征向量组集合1中的每个特征向量组与所述n个特征向量中未包括在该特征向量组的特征向量之间的距离，获得距离集合2，根据所述距离集合2中的最小距离确定特征向量组集合2，其中，所述特征向量组集合2包括至少一个特征向量组；

39、若特征向量组集合i中包括的非重复的特征向量的数量与n的比值大于或等于所述第一预设比例，则将所述特征向量组集合i包括的特征向量组作为所述k个第二特征向量组，其中，i为大于等于1的正整数；

40、将所述k带入聚类算法对所述特征向量组集合i包括的非重复的特征向量进行聚类，得到所述k个第一特征向量组。

41、可选地，所述处理单元，用于在确定所述n个特征向量中是否存在至少一个特征向量属于至少两个第一特征向量组之前，根据所述k个第二特征向量组和所述k个第一特征向量组计算第一参数值，所述第一参数值用于指示所述k个第二特征向量组和所述k个第一特征向量组之间的相关程度；确定所述第一参数值大于或等于预设阈值。

42、可选地，所述处理单元，用于在所述第一参数值小于所述预设阈值时，根据所述n个特征向量中的任意两个特征向量之间的距离确定m个第三特征向量组，其中，所述m个第三特征向量组包括的非重复的特征向量的数量与n的比值大于或等于第二预设比例，且小于所述第一预设比例；所述第二预设比例小于所述第一预设比例，m小于或等于n，m为大于等于2正整数。

43、可选地，所述处理单元，用于在确定所述n个声纹片段对应于至少两个用户，且所述至少两个用户处于聊天状态之前，确定所述n个声纹片段中所述至少两个用户对应的p个声纹片段，所述p个声纹片段的总时长大于或等于第一预设时长；或者，确定所述n个声纹片段中所述至少两个用户对应的p个声纹片段，所述p与所述k个第一特征向量组包括的非重复的特征向量的数量的比值大于或等于预设比值；其中，p为正整数。

44、可选地，所述处理单元，用于在确定所述至少两个用户处于聊天状态时，若处于音频播放状态或视频播放状态，播放语音信息，所述语音信息用于询问是否降低正在播放的文件的音量或是否暂停正在播放的文件。

45、第三方面，本技术还提供一种装置。该装置可以执行上述方法设计。该装置可以是能够执行上述方法对应的功能的芯片或电路，或者是包括该芯片或电路的设备。

46、在一种可能的实现方式中，该装置包括：存储器，用于存储计算机可执行程序代码；以及处理器，处理器与存储器耦合。其中存储器所存储的程序代码包括指令，当处理器执行所述指令时，使该装置或者安装有该装置的设备执行上述任意一种可能的设计中的方法。

47、其中，该装置还可以包括通信接口，该通信接口可以是收发器，或者，如果该装置为芯片或电路，则通信接口可以是该芯片的输入/输出接口，例如输入/输出管脚等。

48、在一种可能的设计中，该装置包括相应的功能单元，分别用于实现以上方法中的步骤。功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的单元。

49、第四方面，本技术提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序在装置上运行时，执行上述任意一种可能的设计中的方法。

50、另外，第三方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果，此处不再赘述。

标签：装置流程状态技术资料下载

本文地址：https://www.jishuxx.com/zhuanli/20240618/24499.html

上一篇
电子设备、终端设备及其控制方法与流程

下一篇
返回列表

一种确定用户处于聊天状态的方法及装置与流程

相关技术

最新技术

技术分类