技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于语义识别的音频监控方法及系统 > 正文

一种基于语义识别的音频监控方法及系统

国知局
2024-06-21 11:52:22

本发明属于监控,尤其涉及一种基于语义识别的音频监控方法及系统。

背景技术：

1、随着时代的进步，人民安全意识逐渐增强，现有市场中，视频监控应用非常广泛，但有明显的局限性和缺陷：(1)可检测区域受限。由于光是直线传播的，视频监控只能监测到摄像头发出的射线直达的目标，因而视频监控只能监控一个有限区域，对于有遮挡物的目标，则无法监控，更无法监控相连通的转角区域。(2)可监测信息受限。有些目标状况是表现为声音而非图像，例如警报声、危重病人的夜间呻吟，婴儿的啼哭声、远处传来的打闹声，枪声、逃犯在监狱隐蔽处挖墙壁的声音，仅有摄像头的监控就是一场“无声电影”，提供的信息有限。(3)目标信息的提取受限。值班人员不可能一秒也不间断地24小时持续盯着屏幕，视线离开屏时存在丢失目标信息的可能性。(4)有些场合不能装摄像头，例如医院里的厕所里可能会有病人摔倒呼救的声音，独居老人在洗澡间里的呼救声音。随着平安城市项目建设的推进，仅有摄像头的监控越来越满足不了需求，音频监控系统应运而生，音频监控作为安防行业近年来迅速发展的一个分支，目前已展现出前所未有的勃勃生机。工作人员通过音频监控设备“听懂”周围环境，对危险事件和意外事件进行安全防范。

技术实现思路

1、本发明的目的在于提出一种基于语义识别的音频监控方法及系统，利用麦克风拾取场景音频信息，实现对场景中紧急事件的处理与决策，进一步提高监控场景中有用信息量。

2、一方面，为实现上述目的，本发明提供了一种基于语义识别的音频监控方法，具体包括以下步骤：

3、获取音频信息,对所述音频信息进行处理,获取文字信息；

4、获取标准事件的关键词，将所述文字信息与所述标准事件的关键词进行相似性比对，获取事件判定结果；

5、根据所述事件判定结果进行报警提醒，完成基于语义识别的音频监控。

6、可选的，获取所述音频信息包括：基于声音收集装置拾取环境中的声音，获取所述音频信息。

7、可选的，对所述音频信息进行处理,获取所述文字信息包括：

8、将所述音频信息转换为模拟电信号；

9、对所述模拟电信号进行降噪和增强处理，并将处理后的模拟电信号转换为数字信号；

10、基于所述数字信号，采用梅尔频率倒谱系数，获取所述数字信号的声学特征；

11、通过所述数字信号的声学特征，利用声学模型识别目标音素，并结合语言模型和语言词典，根据所述声学模型识别音素序列，以及考虑上下文信息，确定所述文字信息。

12、可选的，获取所述标准事件的关键词包括：

13、获取若干所述标准事件，对若干所述标准事件提取并保存关键词，获取基于文字形式的关键词；

14、对所述基于文字形式的关键词进行分类，获取所述标准事件的关键词。

15、可选的，将所述文字信息与所述标准事件的关键词进行相似性比对，获取所述事件判定结果包括：

16、将所述文字信息与所述标准事件的关键词进行相似性估计，获取相似度；

17、将所述相似度与阈值进行比对，所述阈值基于不同场景、不同时间的实际试验结果确定；

18、若所述相似度不高于所述阈值，则终端不工作；

19、若所述相似度高于所述阈值，则判定为标准事件，并基于所述标准事件，保存所述事件判定结果。

20、可选的，所述事件判定结果包括判定信息、事件类型、场景音频、时间、地点和监控编号。

21、可选的，根据所述事件判定结果进行报警提醒，完成基于语义识别的音频监控后还包括：将所述事件判定结果发送给工作人员，所述工作人员基于所述事件判定结果做出决策。

22、另一方面，为实现上述目的，本发明提供了一种基于语义识别的音频监控系统，包括采集模块、事件处理模块、事件判定模块和终端提示及显示模块，所述采集模块、所述事件处理模块、所述事件判定模块和所述终端提示及显示模块依次连接；

23、所述采集模块，用于采集所述音频信息；

24、所述事件处理模块，用于对所述音频信息进行处理并基于所述标准事件的关键词进行相似性估计；

25、所述事件判定模块，用于存储所述事件判定结果，并发送至所述终端提示及显示模块；

26、所述终端提示及显示模块，用于提醒工作人员以及查看所述事件判定结果。

27、可选的，所述事件判定模块包括存储器和发送器；

28、所述存储器用于存储所述事件判定结果；

29、所述发送器用于将所述事件判定结果发送至所述终端提示及显示模块。

30、可选的，所述终端提示及显示模块包括报警器和显示屏；

31、所述报警器用于提醒工作人员；

32、所述显示屏用于查看所述事件判定结果。

33、与现有技术相比，本发明具有以下优点及技术效果：

34、本发明能够解决视频监控存在的数据量大、监控视角内危险或紧急状况预警不及时、监控存在盲区及死角等问题，利用音频收集装置拾取相关应用场景音频信号，通过对获取的音频信息降噪及增强等一系列处理后，可经过简单的算法将音频信号转换成文字信息，将文字信息与标准事件的关键词进行相似性比对，获取事件判定结果，根据事件判定结果选择是否进行报警提醒本发明方案简单，易于实现，用户可根据需要自行修改事件类型和关键词。

技术特征：

1.一种基于语义识别的音频监控方法，其特征在于，具体包括以下步骤：

2.如权利要求1所述的基于语义识别的音频监控方法，其特征在于，获取所述音频信息包括：基于声音收集装置拾取环境中的声音，获取所述音频信息。

3.如权利要求1所述的基于语义识别的音频监控方法，其特征在于，对所述音频信息进行处理，获取所述文字信息包括：

4.如权利要求1所述的基于语义识别的音频监控方法，其特征在于，获取所述标准事件的关键词包括：

5.如权利要求1所述的基于语义识别的音频监控方法，其特征在于，将所述文字信息与所述标准事件的关键词进行相似性比对，获取所述事件判定结果包括：

6.如权利要求5所述的基于语义识别的音频监控方法，其特征在于，所述事件判定结果包括判定信息、事件类型、场景音频、时间、地点和监控编号。

7.如权利要求1所述的基于语义识别的音频监控方法，其特征在于，根据所述事件判定结果进行报警提醒，完成基于语义识别的音频监控后还包括：将所述事件判定结果发送给工作人员，所述工作人员基于所述事件判定结果做出决策。

8.一种基于语义识别的音频监控系统，应用如权利要求1-7任一项所述的方法，其特征在于，包括采集模块、事件处理模块、事件判定模块和终端提示及显示模块，所述采集模块、所述事件处理模块、所述事件判定模块和所述终端提示及显示模块依次连接；

9.如权利要求8所述的基于语义识别的音频监控系统，其特征在于，所述事件判定模块包括存储器和发送器；

10.如权利要求8所述的基于语义识别的音频监控系统，其特征在于，所述终端提示及显示模块包括报警器和显示屏；

技术总结本发明公开了一种基于语义识别的音频监控方法及系统，具体包括以下步骤：获取音频信息,对所述音频信息进行处理,获取文字信息；获取标准事件的关键词，将所述文字信息与所述标准事件的关键词进行相似性比对，获取事件判定结果；根据所述事件判定结果进行报警提醒，完成基于语义识别的音频监控。本发明利用麦克风拾取场景音频信息，可以实现对场景中紧急事件的处理与决策，进一步提高监控场景中有用信息量；本发明方案简单，易于实现，用户可根据需要自行修改事件类型和关键词。技术研发人员：谢奕尘,李振璧受保护的技术使用者：亳州学院技术研发日：技术公布日：2024/5/16