音频播放方法、装置、音频播放设备以及电子设备与流程
- 国知局
- 2024-07-31 19:12:33
本技术涉及音频处理,尤其涉及一种音频播放方法、装置、音频播放设备以及电子设备。
背景技术:
1、当今互联网信息的爆炸式增长带来了大量的内容审查需求,其中,对音频内容进行审查以及对包含敏感内容的音频进行消音对于避免潜在的暴力、色情等敏感内容被肆意传播尤为重要。
2、相关技术中,内容平台提供音频内容审查功能,内容平台先对上传至该内容平台的音频进行分级,然后按照不同分级对应的审查规则,对音频的内容进行检测,对包含敏感内容的音频进行消音,向用户提供消音后的音频,用户对消音后的音频进行播放。
3、然而,上述方法中,通过内容平台对包含敏感内容的音频进行消音,对于信息快速增长的互联网环境来说,该方法难以对所有包含敏感内容的音频均进行消音,导致包含敏感内容的音频漏消音的概率较大,并且,对音频的审查需要耗费大量的人力成本和时间成本。
技术实现思路
1、本技术提供一种音频播放方法、装置、音频播放设备和电子设备,能够降低对包含敏感内容的音频漏消音的概率,降低音频审查所耗费的人力成本和时间成本。本技术的技术方案如下。
2、根据本技术实施例的第一方面,提供一种音频播放方法,该方法包括:
3、播放目标音频,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频片段的播放模式,该播放模式包括消音模式和正常播放模式;
4、基于下一音频片段的播放模式,对下一音频片段进行播放。
5、上述方法中,音频播放端在播放音频时,通过已播放的音频片段,预测下一音频片段的播放模式为消音模式还是正常播放模式,基于所预测的播放模式,对该下一音频片段进行播放,与通过内容平台对音频进行审核和消音相比,能够降低对包含敏感内容的音频漏消音的概率,并且,能够降低音频审核所耗费的人力成本和时间成本。
6、可选地,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频片段的播放模式,包括:
7、对已播放的音频片段进行语义检测,若检测到的语义包含预设敏感词的部分字符,则预测下一音频片段的播放模式为消音模式。
8、上述方法中,在检测到的语义包含预设敏感词的部分字符的情况下,判断下一音频片段的播放模式为消音模式,从而在预设敏感词未全部出现时即对其进行消音,能够在保证消音的正确性的情况下,保证不漏消音,能够提高对敏感内容进行消音的有效性。
9、可选地,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频片段的播放模式,包括:
10、确定下一音频片段之前的至少一个音频片段中预设敏感词的出现频率;
11、基于出现频率,确定下一音频片段中预设敏感词的出现概率;
12、若出现概率大于预设阈值,则预测下一音频片段的播放模式为消音模式。
13、上述方法中,基于预设敏感词在之前音频片段中的出现频率来预测下一音频片段的播放模式,从全局的角度进行分析,使得预测的结果更加贴合实际的场景和语境,并且,在预设敏感词出现之前就进行消音,能够保证消音的完整性和有效性。
14、可选地,不同的语言类型对应于不同的敏感词库,该方法还包括:
15、识别已播放的音频片段对应的语言类型,从所识别出的语言类型对应的敏感词库中确定预设敏感词。
16、上述方法中,通过为不同地点语言类型设置不同的敏感词库,能够保证对不同语言类型的音频中的敏感内容进行全面的检测,从而降低漏消音的概率。
17、可选地,不同的预设对象对应于不同的敏感词库,该方法还包括:
18、对已播放的音频片段进行音色识别,若所识别出的音色与任一预设对象的音色相匹配,则从预设对象对应的敏感词库中确定预设敏感词。
19、上述方法中,通过为不同的预设对象设置不同的敏感词库,使得敏感内容检测更加具有针对性和个性化。
20、可选地,该方法还包括:
21、对下一音频片段进行敏感词识别,若从下一音频片段中检测出敏感词库中不存在的敏感词,则基于所检测出的敏感词,对敏感词库进行更新。
22、上述方法中,通过对实际的下一音频片段进行敏感词识别,能够发现原来敏感词库中不存在的敏感词,从而对敏感词库进行更新,能够不断对敏感词库进行扩充,从而降低漏消音的概率;同时,能够发现原来敏感词库中存在而未检测出的敏感词,从而对预测方式进行不断优化,提高预测的准确率,从而降低漏消音的概率。
23、可选地,基于下一音频片段的播放模式,对下一音频片段进行播放,包括:
24、若播放模式为消音模式,则对下一音频片段进行消音播放;
25、若播放模式为正常播放模式,则对下一音频片段进行正常播放。
26、可选地,若播放模式为消音模式,则对下一音频片段进行消音播放,包括:
27、若播放模式为消音模式,则采用反声波消音、静音消音和覆盖消音中任一种方式对下一音频片段进行消音播放。
28、可选地,该方法还包括:
29、响应于对消音模式的开启、关闭或修改操作,向目标终端发送密码验证请求;
30、接收目标终端发送的验证通过消息,对消音模式进行开启、关闭或修改操作。
31、上述方法中,通过密码验证的方式限制对消音模式的开关和修改,能够保证由于消音模式的随意更改导致的消音失效,有利于提高在音频播放端进行消音的强制性和有效性。
32、根据本技术实施例的第二方面,提供一种音频播放装置,该装置包括:
33、播放模块,用于播放目标音频;
34、预测模块用于,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频片段的播放模式,该播放模式包括消音模式和正常播放模式;
35、播放模块,还用于基于下一音频片段的播放模式,对下一音频片段进行播放。
36、可选地,该预测模块用于:
37、对已播放的音频片段进行语义检测,若检测到的语义包含预设敏感词的部分字符,则预测下一音频片段的播放模式为消音模式。
38、可选地,该预测模块用于:
39、确定下一音频片段之前的至少一个音频片段中预设敏感词的出现频率;
40、基于出现频率,确定下一音频片段中出现预设,敏感词的出现概率;
41、若出现概率大于预设阈值,则预测下一音频片段的播放模式为消音模式。
42、可选地,不同的语言类型对应于不同的敏感词库,该装置还包括:
43、第一识别模块,用于识别已播放的音频片段对应的语言类型;
44、第一确定模块,用于从所识别出的语言类型对应的敏感词库中确定预设敏感词。
45、可选地,不同的预设对象对应于不同的敏感词库,该装置还包括:
46、第二识别模块,用于对已播放的音频片段进行音色识别;
47、第二确定模块,用于若所识别出的音色与任一预设对象的音色相匹配,则从预设对象对应的敏感词库中确定预设敏感词。
48、可选地,该装置还包括:
49、更新模块,用于对下一音频片段进行敏感词识别,若从下一音频片段中检测出敏感词库中不存在的敏感词,则基于所检测出的敏感词,对敏感词库进行更新。
50、可选地,该播放模块,包括:
51、消音播放单元,用于若播放模式为消音模式,则对下一音频片段进行消音播放;
52、正常播放单元,用于若播放模式为正常播放模式,则对下一音频片段进行正常播放。
53、可选地,该消音播放单元,用于:
54、若播放模式为消音模式,则采用反声波消音、静音消音和覆盖消音中任一种方式对下一音频片段进行消音播放。
55、可选地,该装置还包括:
56、请求模块,用于响应于对消音模式的开启、关闭或修改操作,向目标终端发送密码验证请求;
57、接收模块,用于接收目标终端发送的验证通过消音,对消音模式进行开启、关闭或修改操作。
58、根据本技术实施例的第三方面,提供了一种音频播放设备,该音频播放设备包括至少一个收音麦克风、至少一个扬声器、处理器和存储器;
59、该至少一个收音麦克风用于收集目标音频,该至少一个扬声器用于对目标音频进行播放;
60、该存储器用于存储至少一条指令,至少一条指令由处理器加载并执行以实现如上述第一方面或第一方面中任一可选方式提供的音频播放方法。
61、根据本技术实施例的第四方面,提供了一种电子设备,该电子设备配置有音频播放设备,音频播放设备用于执行以实现如上述第一方面或第一方面中任一可选方式提供的音频播放方法。
62、根据本技术实施例的第五方面,提供一种存储介质,该存储介质包括:当该存储介质中的指令由音频播放设备的处理器执行时,使得该音频播放设备能够实现如上述第一方面或第一方面中任一可选方式提供的音频播放方法。
63、根据本技术实施例的第六方面,提供一种计算机程序产品,包括一条或多条指令,该一条或多条指令由音频播放设备的处理器执行,使得该音频播放设备能够实现如上述第一方面或第一方面中任一可选方式提供的音频播放方法。
64、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
本文地址:https://www.jishuxx.com/zhuanli/20240731/181860.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表