一种现代语音采录、分析及展示系统
- 国知局
- 2024-06-21 11:30:29
本发明涉及语音分析领域,具体而言,涉及一种现代语音采录、分析及展示系统。
背景技术:
1、传统语言语音的采录分析,采用的方法是纸笔记录的方法,后来一般是采用录音笔或者mp3录音,录音时长较长,过后复听不方便,且要在一段几小时的录音中定位到某个词条也不方便,后来开始采用计算机软件进行语音数据采集,也是用录音的形式,再对采集的每个调查项目的语音进行拆分分析,但是现行的计算机软件全部为单机版、且都无法准确地对语音数据进行拆分和分析,而通过对汉语语音的分析,可以探索和研究汉语的音系、音变规律、声韵调系统等语音学特征,这对于了解汉语的语音结构、语音演变以及与其他语言的比较研究都非常有价值。但是现有的产品经常出现诸如语音音素拆分不准确,拆分错误等等,并且在教学和科研活动分析研究的辅助功能上也非常有限。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本发明实施例提供了一种现代语音采录、分析及展示系统,通过采录单元对音频或视频形式的多种现代语音数据进行采集录入,通过分析单元创建的语音拆解规则将采录获得的现代语音数据拆分成声、韵、调,并与系统数据库存储的语音数据、汉语中古音数据进行多层面比较分析、输出分析结果;通过展示单元将语音数据调查分析结果在地图上按地理信息进行展示,提高现代语音采录、分析及展示的效率,为教学和科研活动分析研究提供有力支持。
2、根据本发明实施例的一个方面,提供了一种现代语音采录、分析及展示系统,其包括:
3、采录单元,用于对多种现代语音数据进行采集录入;
4、分析单元,用于将采集录入的现代语音数据通过拆分声、韵、调,进行多层面比较分析,并输出分析结果;
5、展示单元,用于将现代语音数据调查分析结果在地图上按地理信息进行展示。
6、作为一种可选的实施方式,所述现代语音采录、分析及展示系统还包括:
7、存储单元,用于存储包括但不限于采录的现代语音数据、语音拆解规则及语音基础数据表。
8、作为一种可选的实施方式,所述分析单元包括:
9、预处理子单元,用于对采集录入的现代语音数据进行预处理,所述预处理包括去除噪音、均衡化音频质量、提取声学特征及对语音数据进行国际音标的识别与标记;
10、创建子单元,用于创建语音拆解规则,所述语音拆解规则包括声母拆解规则、韵母拆解规则及声调拆解规则;
11、拆解子单元,用于根据创建的语音拆解规则对预处理后的语音数据进行解析拆解,得到语音数据的声母、韵母及声调;
12、比较子单元,用于将拆解后的语音数据与包括但不限于系统内存储的语音数据、汉语中古音数据进行多层面对比分析,并输出分析结果。
13、作为一种可选的实施方式,所述创建子单元创建的声调拆解规则为:
14、i=(?<shengyun>([^0-9|①|②|③|④|⑤|⑥|⑦|⑧|⑨|
15、⑩])*)(?<intonation>([0-9|①|②|③|④|⑤|⑥|⑦|⑧|⑨|
16、⑩])*).matcher(p).group("intonation")
17、其中,i为声调,数字0—9、①、②、③、④、⑤、⑥、⑦、⑧、⑨、⑩为不同格式的声调,shengyun为对声母+韵母组合的命名,intocation为对声调的命名,p为预处理后的现代语音数据,matcher(p)为输入语音数据,group("intonation")为输出声调。
18、所述声母拆解规则包括第一声母拆解规则、第二声母拆解规则及第三声母拆解规则,其中:
19、第一声母拆解规则:
20、
21、其中,c为声母,null为对零声母的命名,0、分别为零声母的符号,vowel为对韵母的命名,p1为声母+韵母的组合;
22、第二声母拆解规则:
23、c1=(?<consonant>(国际音标辅音)*)(?<vowel>(.)*).matcher(p1).group("consonant");
24、其中,c1为待定声母,consonant为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,vowel为对韵母的命名,p1为声母+韵母的组合;
25、第三声母拆解规则:
26、c=(?<consonant>(国际音标辅音)*)(?<vowel>(声化韵)+)
27、.matcher(c1).group("consonant");
28、其中,c为声母,consonant为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,vowel为对韵母的命名,声化韵为声化韵表中全部的辅音,c1为待定声母;
29、所述韵母拆解规则包括第一韵母拆解规则、第二韵母拆解规则及第三韵母拆解规则,其中:
30、第一韵母拆解规则:
31、
32、其中,v为韵母,null为对零声母的命名,0、分别为零声母的符号,vowel为对韵母的命名,p1为声母+韵母的组合;
33、第二韵母拆解规则:
34、v1=(?<consonant>(国际音标辅音)*)(?<vowel>(.)*).matcher(p1).group("vowel");
35、其中,v1为待定韵母,consonant为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,vowel为对韵母的命名,p1为声母+韵母的组合;
36、第三韵母拆解规则为:
37、v=(?<consonant>(国际音标辅音)*)(?<vowel>(声化韵)+)
38、.matcher(c1).group("vowel");
39、其中,v为韵母,consonant为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,vowel为对韵母的命名,声化韵为声化韵表中全部的辅音,c1为待定声母。
40、作为一种可选的实施方式,所述语音基础数据表包括但不限于字表、词表、语法表、语篇表、同音字表、语系划分表、中古声母表、中古韵母表、国际音标元音表、国际音标辅音表及声化韵表。
41、作为一种可选的实施方式,所述采录单元采录的现代语音数据包括录音数据及录像数据,所述录音数据及录像数据添加有被采录者的基本信息及被采录语言的描述性元数据。
42、作为一种可选的实施方式,所述将拆解后语音数据与数据库存储的语音数据、汉语中古音数据进行多层面的对比分析包括:将拆解后语音数据与数据库存储的不同语言、方言语音数据的对比分析;将拆解后的单点采录音语音数据与数据库存储的中古音的对比分析;将拆解后的多点采录音语音数据与数据库存储的中古音的对比分析;将拆解后的多点采录音语音数据之间进行的对比分析。
43、作为一种可选的实施方式,所述展示单元中语音数据调查分析结果在地图上按地理信息进行的展示,包括但不限于语音数据采录点在地图上按地理信息进行的展示;某个音出现的多个不同地点在地图上按地理信息进行的展示;语言存在、共存及所在具体地理位置情况在地图上按地理信息进行的展示;现代语音研究者自定义的内容在地图上按地理信息进行的展示;还包括在地图中设置颜色与固定语言搭配的标志,标志上设置数字表示地理位置上语言种类的个数,并以说的最多的语言的颜色来显示标志的颜色,鼠标置于地图中的标志数字上时能够显示具体语言种类的名称。
44、作为一种可选的实施方式,对语音数据进行国际音标的识别与标记,包括人工的识别与标记及根据语音数据从系统语音基础数据表中检索、导入音标进行标记后,人工进行检验确认。
45、作为一种可选的实施方式,所述现代语音采录、分析及展示系统还包括管理单元,用于系统数据的安全与隐私保护,确保语音数据和信息的安全性和隐私保护,包括数据加密、访问控制及权限管理。
46、本发明的有益效果:
47、1、本发明的采录单元可以同时录制音频和视频,可远程多用户同时使用音视频材料;采录可导入图片以作调查参考;采录条目可以录制项目实施者的说明语音,突破远程调查掌控的地域限制;
48、2、本发明的分析单元对国际音标的标注人性化,可分声、韵、调进行标注,可以从系统中挑选接近的调查点进行预匹配,再进行音标校对;可多用户标注,项目负责人可择优保留和远程修改、审定;可允许多用户作为共同研究者查看和修改调查结果;进而进行多层面比较和研究,最终输出分析比较的结果;
49、3、本发明的存储单元,存储提供专业内多种语言基础知识数据的查询表,这些可查询的基础数据表的创建有利于研究人员、学者或跨文化交流者更好地了解目标文化的语言使用规范、习惯用语、礼貌用语等,通过查询语言知识基础数据,本发明系统能够为社会科学研究提供重要支持。同时也有助于语言教育,教师可以查询语言习惯、常见错误、语法规则等数据,用于教学准备和教学材料的开发。学生也可以通过查询相关数据来扩展词汇量、提高语法水平和增加语言表达的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21939.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。