一种基于多路音源输入的广播终端的制作方法
- 国知局
- 2024-06-21 10:41:29
本发明涉及音频脱敏领域,尤其涉及一种基于多路音源输入的广播终端。
背景技术:
1、多路音源输入的广播终端可以同时接收和处理多个音源输入的音频信号,并将音频信号传输至音频接收端,适用于广播电台、录音室、会议室、音乐制作和音频处理等领域,但是,随着音频信号的多路汇集,需要对音频信号进行脱敏处理,以满足转播需求,相关技术被人们所重视。
2、中国专利公开号:cn111210808a,公开了一种移动式黑广播监测系统及其监测方法,监测系统包括移动监测端、与所述移动监测端交互的语音识别服务器和人工监听核查终端,所述移动监测端主要由数字接收机、与所述数字接收机连接的天线、与所述数字接收机连接的监测设备构成。在人工监听之前,采用语音识别技术对含有黑广播关键词的音频进行筛选,在保证监测准确性的同时,极大缩减了人工监听的工作量。
3、但是,现有技术中还存在以下问题,
4、现有技术中,未考虑对与敏感关键词拼音相同但声调不同的特征关键词进行精准的敏感关键词判断,音频脱敏准确性不高。
技术实现思路
1、为此,本发明提供一种基于多路音源输入的广播终端,用以克服现有技术中未考虑对与敏感关键词拼音相同但声调不同的特征关键词进行精准的敏感关键词判断,音频脱敏准确性不高的问题。
2、为实现上述目的,本发明提供一种基于多路音源输入的广播终端,包括:
3、数据接收模块,其分别与若干音频输出端连接,用以接收各所述音频输出端发出的音频数据;
4、样本存储模块,其存储有若干敏感关键词、包含有敏感关键词的若干样本语句以及各所述样本语句的句子结构;
5、数据分析模块,其分别与所述数据接收模块以及样本存储模块连接,用以接收所述数据接收模块的音频数据,并生成所述音频数据对应的文本数据后将所述文本数据与样本存储模块中的各敏感关键词进行对比,包括文本对比以及拼写信息对比,且,基于对比结果识别所述文本数据中的特征关键词,并划分特征关键词的类别;
6、播放模块,其与所述数据分析模块连接,包括筛选单元以及播放单元,
7、所述筛选单元用以确定第一类特征关键词对应音频段,将所述音频段进行消音处理后,将所述音频数据发送至播放单元;
8、且,所述筛选单元用以提取第二类特征关键词所在句子的句子结构与包含关联敏感关键词的若干样本语句的句子结构进行对比,并且,提取所述句子的非特征关键词,根据所述非特征关键词在各样本语句中的出现概率计算关联性参数,基于对比结果以及关联性参数判定是否对所述第二类特征关键词对应音频段进行消音处理,并将音频数据发送至播放单元;
9、所述播放单元用以将音频数据传输至音频播放端。
10、进一步地,所述数据分析模块将所述文本数据与样本存储模块中的各敏感关键词进行对比,基于对比结果识别所述文本数据中的特征关键词的过程包括,
11、所述数据分析模块进行文本对比,将所述文本数据分词处理后,将各分词与各所述敏感关键词进行对比;
12、且,所述数据分析模块进行拼写信息对比,将所述文本数据分词处理后将各分词的拼音字母与各所述敏感关键词的拼音字母进行对比;
13、若存在分词与任一敏感关键词相同或/和存在分词的拼音字母与任一敏感关键词的拼音字母相同,则将所述分词确定为特征关键词。
14、进一步地,所述数据分析模块划分特征关键词的类别的过程包括,
15、若满足预设对比条件,则所述数据分析模块判定所述特征关键词为第一类特征关键词;
16、若不满足预设对比条件,则所述数据分析模块判定所述特征关键词为第二类特征关键词;
17、所述预设对比条件为所述特征关键词与任一敏感关键词相同。
18、进一步地,所述筛选单元确定关联敏感关键词的过程包括,
19、所述筛选单元确定第二类特征关键词的拼音字母,将各所述敏感关键词的拼音字母与所述第二类特征关键词的拼音字母对比;
20、若存在敏感关键词的拼音字母与所述第二类特征关键词的拼音字母相同,则所述筛选单元确定所述敏感关键词为关联敏感关键词。
21、进一步地,所述筛选单元还用以提取第二类特征关键词所在句子的句子结构,并与各包含关联敏感关键词的若干样本语句的句子结构进行对比,判定第二类特征关键词是否为模糊敏感关键词,判定过程包括,
22、若所述第二类特征关键词所在句子的句子结构与任一所述样本语句的句子结构相同,则所述筛选单元判定所述第二类特征关键词为模糊敏感关键词。
23、进一步地,所述筛选单元根据所述非特征关键词在包含关联敏感关键词的样本语句中的出现概率计算关联性参数的过程包括,
24、所述筛选单元将所述非特征关键词进行分词处理,得到若干分词,并提取包含所述关联敏感关键词的样本语句,计算各所述分词在各所述样本语句中出现的概率,并根据公式(1)计算关联性参数,
25、
26、公式(1)中,e表示关联性参数,n表示包含所述关联敏感关键词的样本语句的数量,pi为第i个分词在各所述样本语句中出现的概率,i为大于0的整数。
27、进一步地,所述筛选单元基于对比结果以及关联性参数判定是否对所述第二类特征关键词对应音频段进行消音处理的过程包括,
28、所述筛选单元将所述关联性参数与预设的关联性参数阈值进行对比,
29、在预设消音条件下,所述筛选单元判定对所述第二类特征关键词对应音频段进行消音处理;
30、所述预设消音条件为,所述第二类特征关键词被判定为模糊敏感关键词且所述关联性参数大于所述关联性参数阈值。
31、进一步地,所述筛选单元对音频段进行消音处理的过程包括,
32、所述筛选单元内预设置有替换音频,所述筛选单元将所述替换音频替换所述音频段,以进行消音处理。
33、进一步地,所述筛选单元内设置有音频数据转换工具,用以将音频数据转换为文本数据。
34、进一步地,还包括存储模块,其与所述播放模块连接,用以存储播放单元传输的音频数据。
35、与现有技术相比,本发明通过数据分析模块将文本数据与样本存储模块中的各敏感关键词进行对比,基于对比结果识别文本数据中的特征关键词,并划分特征关键词的类别,筛选单元对于第一类特征关键词进行消音处理,提取第二类特征关键词所在句子的句子结构,进行句子结构对比并根据非特征关键词在各样本语句中的出现概率计算关联性参数,判定是否对第二类特征关键词对应音频段进行消音处理,本发明通过将与敏感关键词拼音相同但是音调不同的特征关键词结合所处句子的句子结构以及句子非特征关键词进行综合识别,减少由于声调不同对敏感关键词判定出错的情况,从而提升音频脱敏的准确性。
36、尤其,本发明通过数据分析模块将所述文本数据与样本存储模块中的各敏感关键词进行对比,其中,进行文本对比可以识别出确定的敏感关键词,通过拼写信息对比可以减少某些想要通过改变声调达到躲避敏感关键词对比的情况,对敏感关键词进行双重对比,从而提升对敏感关键词的精准识别;
37、尤其,本发明将特征关键词分为第一类特征关键词以及第二类特征关键词,其中第一类特征关键词确定为敏感关键词,其文本与敏感关键词完全一致,可直接对其进行消音处理,第二类特征关键词为疑似敏感关键词,其拼音字母与敏感关键词相同,需对其进行进一步判定,通过将特征关键词进行分类,可以简化第一类特征关键词判定过程,不需对确定的特征关键词进行多重判定,提升音频处理效率,同时,对疑似敏感关键词进行多重判定,可以提升对疑似敏感关键词判断的准确度,避免错判,漏判的情况;
38、尤其,本发明计算的关联性参数表征了非特征关键词与包含关联敏感关键词的样本语句的关联性,在实际情况中,通过用同音词替换敏感关键词规避脱敏时,剩余的未被替换部分与被替换的敏感关键词存在关联,在存储的样本语句中有体现,进而通过关联性参数表征上述情况,为后续是否进行消音处理提供数据支持,从而提升音频脱敏的准确性。
39、尤其,本发明通过将第二类特征关键词被判定为模糊敏感关键词且所述关联性参数大于所述关联性参数阈值的第二类特征关键词进行消音处理,对非特征关键词通过判断句子结构的相似度判断第二类特征关键词与敏感关键词的关联性,通过将非特征关键词进行分词处理,计算分词在各所述样本语句中出现的概率,计算关联性参数,从而提升对第二类特征关键词是否为敏感关键词判断的准确性,极大程度减少了由于声调改变而对敏感关键词进行漏判的情况。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21233.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。