技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种NAS设备的语音解锁方法、装置及系统与流程 > 正文

一种NAS设备的语音解锁方法、装置及系统与流程

国知局
2024-06-21 11:49:28

本发明涉及nas，尤其涉及一种nas设备的语音解锁方法、装置及系统。

背景技术：

1、nas(network attached storage，网络附加存储)，一种集中式存储设备，用户将其移动终端设备的存储资源存储到nas设备的存储介质中，然后通过互联网或局域网(lan)就能够随时随地的访问存储在nas设备中的存储资源，极大的方便了用户的生产生活。

2、在实际的nas设备应用中，为了保障用户存储在nas设备的存储资源的安全性，会将nas设备锁定，现有的nas设备解锁需要通过用户借助指定的访问设备进行手动解锁方可实现，然而，实践发现，用户手动解锁nas设备，本质上还是通过输入密钥的形式实现，但是这种通过人工手动输入密钥解锁nas设备的方式存在密钥遗忘、丢失、泄密的风险，此时，则存在nas设备中的存储资源被泄露的风险。

3、可见，提出一种提高nas设备解锁安全性的技术方案显得尤为重要。

技术实现思路

1、本发明所要解决的技术问题在于，提供一种nas设备的语音解锁方法、装置及系统，能够有利于提高nas设备解锁安全性。

2、为了解决上述技术问题，本发明第一方面公开了一种nas设备的语音解锁方法，所述方法包括：

3、根据获取到的用户的语音信息和预设目标识别模型，分析所述语音信息的目标特征信息，所述预设目标识别模型包括预设声纹识别模型，所述目标特征信息包括第一声纹信息；

4、判断预设声纹信息集合中是否存在与所述第一声纹信息相匹配的第二声纹信息，当判断出所述预设声纹信息集合中存在所述第二声纹信息时，则根据所述目标特征信息，生成目标控制参数，所述目标控制参数用于控制nas设备执行与所述目标控制参数相匹配的目标操作，所述目标操作包括解锁nas设备操作。

5、作为一种可选的实施方式，在本发明第一方面中，所述预设目标识别模型还包括预设关键词识别模型，所述目标特征信息还包括第一关键词信息，在所述判断预设声纹信息集合中是否存在与所述第一声纹信息相匹配的第二声纹信息之前，所述方法还包括：

6、根据所述第一关键词信息，计算目标唤醒值，所述目标唤醒值用于表示所述第一关键词信息与预存关键词集合中第二关键词信息的匹配度；

7、判断所述目标唤醒值是否大于等于预设唤醒阈值，当判断出所述目标唤醒值大于等于所述预设唤醒阈值时，则触发执行所述的判断预设声纹信息集合中是否存在与所述第一声纹信息相匹配的第二声纹信息的操作。

8、作为一种可选的实施方式，在本发明第一方面中，在所述根据所述目标特征信息，生成目标控制参数之前，所述方法还包括：

9、根据所述第一声纹信息和/或所述第二声纹信息，分析所述用户的目标管理权限；

10、根据所述第一关键词信息和预设语义分析模型，分析所述用户的目标执行权限；

11、判断所述目标管理权限和所述目标执行权限是否相匹配，当判断出所述目标管理权限和所述目标执行权限相匹配时，则触发执行所述的根据所述目标特征信息，生成目标控制参数的操作。

12、作为一种可选的实施方式，在本发明第一方面中，在所述根据获取到的用户的语音信息和预设目标识别模型，分析所述语音信息的目标特征信息之前，所述方法还包括：

13、获取环境图像信息和环境音频信息；

14、根据确定出的用户的身份信息和所述环境图像信息，确定所述环境图像信息中所述用户的用户图像信息；

15、根据所述用户图像信息和所述环境音频信息，分析所述用户的语音信息；

16、以及，所述根据所述用户图像信息和所述环境音频信息，分析所述用户的语音信息，包括：

17、根据所述用户图像信息，确定所述用户至少一个目标检测点；

18、根据所有所述目标检测点的动态活动轨迹，分析所述用户的活动意图信息；

19、根据所述活动意图信息，在所述环境音频信息中确定出至少一个目标检测音频信息，所述目标检测音频信息的音频意图信息与所述活动意图信息相匹配；

20、对于每个所述目标检测音频信息，将该目标检测音频信息输入到预设过滤模型中，得到目标人声音频信息，所述预设过滤模型的过滤阈值与所述目标检测音频信息相匹配；

21、根据所有所述目标人声音频信息，确定所述用户的语音信息。

22、作为一种可选的实施方式，在本发明第一方面中，所述预设关键词识别模型包括全局倒频谱均值和方差归一化层、线性层、骨干网络层和多个目标分类器；所述全局倒频谱均值和方差归一化层用于对输入的所述语音信息执行归一化处理，使得所述语音信息正态分布；所述线性层用于将所述语音信息的信息格式调整为所述预设关键词识别模型对应的目标格式；所述骨干网络层包括rnn模型、lstm模型、bi-lstm模型、tcn模型、ds-tcn模型、mdtc模型中的至少一种；多个所述目标分类器中每个所述目标分类器包括至少一个s形激活函数，所述s形激活函数用于预测至少一个关键词的后验概率；

23、以及，所述预设关键词识别模型还包括第一损失函数，所述第一损失函数为：

24、

25、其中，m用于表示第i个语音信息中关键词的最小持续时间帧，n用于表示第i个所述语音信息中所述最小持续时间帧的数量，pij用于表示预测第i个所述语音信息第j个所述最小持续时间帧的后验概率，yi用于表示第i个所述语音信息的所述后验概率对应的真实值，l用于表示所述后验概率与所述真实值之间的不一致程度，所述第一损失函数用于所述预设关键词识别模型的训练阶段。

26、作为一种可选的实施方式，在本发明第一方面中，所述预设声纹识别模型包括至少一个帧级层、池化层、至少一个段级变换层和第二损失函数；所述帧级层用于对输入的所述语音信息执行至少一种目标处理操作，并将所述语音信息转换为帧级信息，所述目标处理操作包括预加重、分帧加窗、傅里叶变换、梅尔滤波器组和对数操作、离散傅里叶逆变换中的至少一种；所述池化层用于对所述帧级信息执行聚合处理，得到段级信息；所述段级变换层用于分析所述段级信息对应的声纹标签；所述第二损失函数用于分析所述声纹标签与所述语音信息对应的真实值之间的不一致程度，所述第二损失函数用于所述预设声纹识别模型的训练阶段。

27、本发明第二方面公开了一种nas设备的语音解锁装置，所述装置包括：

28、第一分析模块，用于根据获取到的用户的语音信息和预设目标识别模型，分析所述语音信息的目标特征信息，所述预设目标识别模型包括预设声纹识别模型，所述目标特征信息包括第一声纹信息；

29、第一判断模块，用于判断预设声纹信息集合中是否存在与所述第一声纹信息相匹配的第二声纹信息；

30、生成模块，用于当所述第一判断模块判断出所述预设声纹信息集合中存在所述第二声纹信息时，则根据所述目标特征信息，生成目标控制参数，所述目标控制参数用于控制nas设备执行与所述目标控制参数相匹配的目标操作，所述目标操作包括解锁nas设备操作。

31、作为一种可选的实施方式，在本发明第二方面中，所述预设目标识别模型还包括预设关键词识别模型，所述目标特征信息还包括第一关键词信息，所述装置还包括：

32、计算模块，用于在所述第一判断模块判断预设声纹信息集合中是否存在与所述第一声纹信息相匹配的第二声纹信息之前，根据所述第一关键词信息，计算目标唤醒值，所述目标唤醒值用于表示所述第一关键词信息与预存关键词集合中第二关键词信息的匹配度；

33、第二判断模块，用于判断所述目标唤醒值是否大于等于预设唤醒阈值，当判断出所述目标唤醒值大于等于所述预设唤醒阈值时，则触发所述第一判断模块执行所述的判断预设声纹信息集合中是否存在与所述第一声纹信息相匹配的第二声纹信息的操作。

34、作为一种可选的实施方式，在本发明第二方面中，所述第一分析模块，还用于在所述生成模块根据所述目标特征信息，生成目标控制参数之前，根据所述第一声纹信息和/或所述第二声纹信息，分析所述用户的目标管理权限；

35、所述第一分析模块，还用于根据所述第一关键词信息和预设语义分析模型，分析所述用户的目标执行权限；

36、所述第一判断模块，还用于判断所述目标管理权限和所述目标执行权限是否相匹配，当判断出所述目标管理权限和所述目标执行权限相匹配时，则触发所述生成模块执行所述的根据所述目标特征信息，生成目标控制参数的操作。

37、作为一种可选的实施方式，在本发明第二方面中，所述装置还包括：

38、获取模块，用于在所述第一分析模块根据获取到的用户的语音信息和预设目标识别模型，分析所述语音信息的目标特征信息之前，获取环境图像信息和环境音频信息；

39、确定模块，用于根据确定出的用户的身份信息和所述环境图像信息，确定所述环境图像信息中所述用户的用户图像信息；

40、第二分析模块，用于根据所述用户图像信息和所述环境音频信息，分析所述用户的语音信息；

41、以及，所述第二分析模块根据所述用户图像信息和所述环境音频信息，分析所述用户的语音信息的具体方式包括：

42、根据所述用户图像信息，确定所述用户至少一个目标检测点；

43、根据所有所述目标检测点的动态活动轨迹，分析所述用户的活动意图信息；

44、根据所述活动意图信息，在所述环境音频信息中确定出至少一个目标检测音频信息，所述目标检测音频信息的音频意图信息与所述活动意图信息相匹配；

45、对于每个所述目标检测音频信息，将该目标检测音频信息输入到预设过滤模型中，得到目标人声音频信息，所述预设过滤模型的过滤阈值与所述目标检测音频信息相匹配；

46、根据所有所述目标人声音频信息，确定所述用户的语音信息。

47、作为一种可选的实施方式，在本发明第二方面中，所述预设关键词识别模型包括全局倒频谱均值和方差归一化层、线性层、骨干网络层和多个目标分类器；所述全局倒频谱均值和方差归一化层用于对输入的所述语音信息执行归一化处理，使得所述语音信息正态分布；所述线性层用于将所述语音信息的信息格式调整为所述预设关键词识别模型对应的目标格式；所述骨干网络层包括rnn模型、lstm模型、bi-lstm模型、tcn模型、ds-tcn模型、mdtc模型中的至少一种；多个所述目标分类器中每个所述目标分类器包括至少一个s形激活函数，所述s形激活函数用于预测至少一个关键词的后验概率；

48、以及，所述预设关键词识别模型还包括第一损失函数，所述第一损失函数为：

49、

50、其中，m用于表示第i个语音信息中关键词的最小持续时间帧，n用于表示第i个所述语音信息中所述最小持续时间帧的数量，pij用于表示预测第i个所述语音信息第j个所述最小持续时间帧的后验概率，yi用于表示第i个所述语音信息的所述后验概率对应的真实值，l用于表示所述后验概率与所述真实值之间的不一致程度，所述第一损失函数用于所述预设关键词识别模型的训练阶段。

51、作为一种可选的实施方式，在本发明第二方面中，所述预设声纹识别模型包括至少一个帧级层、池化层、至少一个段级变换层和第二损失函数；所述帧级层用于对输入的所述语音信息执行至少一种目标处理操作，并将所述语音信息转换为帧级信息，所述目标处理操作包括预加重、分帧加窗、傅里叶变换、梅尔滤波器组和对数操作、离散傅里叶逆变换中的至少一种；所述池化层用于对所述帧级信息执行聚合处理，得到段级信息；所述段级变换层用于分析所述段级信息对应的声纹标签；所述第二损失函数用于分析所述声纹标签与所述语音信息对应的真实值之间的不一致程度，所述第二损失函数用于所述预设声纹识别模型的训练阶段。

52、本发明第三方面公开了另一种nas设备的语音解锁装置，所述装置包括：

53、存储有可执行程序代码的存储器；

54、与所述存储器耦合的处理器；

55、所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面公开的nas设备的语音解锁方法。

56、本发明第四方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明第一方面公开的nas设备的语音解锁方法。

57、本发明第五方面公开了一种nas设备的语音解锁系统，所述nas设备的语音解锁系统至少包括如本发明实施例二公开的nas设备的语音解锁装置，以及与所述nas设备的语音解锁装置通信连接的nas设备，所述nas设备的语音解锁装置依据如本发明第一方面公开的nas设备的语音解锁方法对所述nas设备执行解锁操作。

58、与现有技术相比，本发明实施例具有以下有益效果：

59、本发明实施例中，根据获取到的用户的语音信息和预设目标识别模型，分析语音信息的目标特征信息，预设目标识别模型包括预设声纹识别模型，目标特征信息包括第一声纹信息；判断预设声纹信息集合中是否存在与第一声纹信息相匹配的第二声纹信息，当判断出预设声纹信息集合中存在第二声纹信息时，则根据目标特征信息，生成目标控制参数，目标控制参数用于控制nas设备执行与目标控制参数相匹配的目标操作，目标操作包括解锁nas设备操作。可见，实施本发明实施例能够根据获取到的用户的语音信息和预设声纹识别模型，分析语音信息的第一声纹信息，提高第一声纹信息的分析准确性，并在判断出预设声纹信息集合中存在与第一声纹信息相匹配的第二声纹信息时，根据第一声纹信息和/或第二声纹信息，生成目标控制参数，以控制nas设备执行相匹配的解锁nas设备操作，从而提高目标控制参数的生成准确性，即提高nas设备解锁的准确性，进而提高nas设备解锁安全性。