一种水利水电工程野外地质勘察用的语音识别方法及系统与流程
- 国知局
- 2024-06-21 10:40:21
本发明属于语音识别,尤其涉及一种水利水电工程野外地质勘察用的语音识别方法及系统。
背景技术:
1、目前,在地质勘探外业工作中,经常需要使用数字编录平台进行大量的文字输入,但是由于现场环境不稳定、工程师手持工具等原因,在手机或平板上打字往往效率不高且容易出错。近年来,随着语言识别技术的快速发展,语言识别技术已经应用于多个领域,但是在地质勘探中,经常需要使用到大量的专业词汇,传统的语言识别系统由于缺乏地质勘探的专业词汇,因此导致信息录入的准确性比较低,很难满足具体的工作需要。为此,开发一种水利水电工程野外地质勘察用的语音识别方法及系统,具有重要的意义。
技术实现思路
1、针对现有技术的缺陷,本发明提供一种基于光伏组件发电特性的火灾早期探测预警方法及系统,通过规范或词典训练地质专业词库、基于开源平台预训练、测试野外地质勘察的语音识别模型,最后对语音识别结果进行后处理纠正。专门适合于水利工程专业语言表述和词汇,能基于地质数字平台完成智能化语音输入,针对水利工程地质专业词汇、专业表述多,记录中会存在特殊符号,简化了外业编录流程,提高了输入的效率以及准确性。
2、本发明所采用的具体技术方案为:
3、本专利的第一发明目的是提供一种水利水电工程野外地质勘察用的语音识别方法,包括:
4、s1、采集水利水电工程野外地质勘察用的语音资料,并补充普通话,得到数据集,将数据集划分为训练集与测试集;
5、s2、选择卷积神经网络模型作为语音识别预训练模型,并利用语音识别预训练模型的特征提取模型获取特征,训练野外地质勘察的语音识别模型;
6、s3、测试野外地质勘察的语音识别模型;
7、s4、对语音识别结果进行后处理纠正。
8、本专利的第二发明目的是提供一种水利水电工程野外地质勘察用的语音识别系统,包括:
9、数据集构建模块:采集水利水电工程野外地质勘察用的语音资料,并补充普通话,得到数据集,将数据集划分为训练集与测试集;
10、模型构建模块:选择卷积神经网络模型作为语音识别预训练模型,并利用语音识别预训练模型的特征提取模型获取特征,训练野外地质勘察的语音识别模型;
11、模型测试模块:测试野外地质勘察的语音识别模型;
12、纠正模块:对语音识别结果进行后处理纠正。
13、本专利的第三发明目的是提供一种实现上述水利水电工程野外地质勘察用的语音识别方法的计算机程序。
14、本专利的第四发明目的是提供一种实现上述水利水电工程野外地质勘察用的语音识别方法的信息数据处理终端。
15、本专利的第五发明目的是提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述的水利水电工程野外地质勘察用的语音识别方法。
16、本发明的优点及积极效果为:
17、通过采用上述技术方案,本发明具有如下的技术效果:
18、本发明以水利工程野外录入工作为背景,自主制作地质相关语音库和词库,提供一种用于水利水电工程野外地质勘察的语音识别方法。野外录入过程中噪声较大,水利工程地质专业词汇、专业表述多,记录中会存在特殊符号,根据相关规范或词典,将岩石名称、结构构造等有关岩性描述、地质描述之类的专业词汇整理成地质勘察语料库,应用“热词”标注方式,将专业词汇列表添加为识别热词,以提高识别准确率。采用百度语音开源的paddlespeech项目作为基本语音识别平台,并利用该平台提供的自定义“微调”接口,基于建立的地质勘察语料库对预训练语音识别模型进行专业性再训练。本发明所提出的方法能基于地质数字平台完成智能化语音输入,简化了外业编录流程,提高了输入的效率以及准确性。
技术特征:1.一种水利水电工程野外地质勘察用的语音识别方法,其特征在于,包括:
2.根据权利要求1所述水利水电工程野外地质勘察用的语音识别方法,其特征在于,所述s1包括:
3.根据权利要求1所述水利水电工程野外地质勘察用的语音识别方法,其特征在于,所述s2包括:
4.根据权利要求1所述水利水电工程野外地质勘察用的语音识别方法,其特征在于,所述s3包括:
5.根据权利要求1所述水利水电工程野外地质勘察用的语音识别方法,其特征在于,所述s3包括:
6.一种水利水电工程野外地质勘察用的语音识别系统,其特征在于,包括:
7.根据权利要求6所述水利水电工程野外地质勘察用的语音识别系统,其特征在于,所述数据集构建模块包括:
8.根据权利要求6所述水利水电工程野外地质勘察用的语音识别系统,其特征在于,所述模型构建模块包括:
9.根据权利要求6所述水利水电工程野外地质勘察用的语音识别系统,其特征在于,所述模型测试模块包括:
10.根据权利要求6所述水利水电工程野外地质勘察用的语音识别系统,其特征在于,所述纠正模块包括:
技术总结本发明公开了一种水利水电工程野外地质勘察用的语音识别方法及系统,属于语音识别技术领域,包括:S1、采集水利水电工程野外地质勘察用的语音资料,并补充普通话,得到数据集,将数据集划分为训练集与测试集;S2、选择卷积神经网络模型作为语音识别预训练模型,并利用语音识别预训练模型的特征提取模型获取特征,训练野外地质勘察的语音识别模型;S3、测试野外地质勘察的语音识别模型;S4、对语音识别结果进行后处理纠正。本发明专门适合于水利工程专业语言表述和词汇,能基于地质数字平台完成智能化语音输入,针对水利工程地质专业词汇、专业表述多,记录中会存在特殊符号,简化了外业编录流程,提高了输入的效率以及准确性。技术研发人员:高义军,李明超,朱维娜,陈创威,赵文超,陈莹波,王国岗,韩帅,王春晓,赵芳萍受保护的技术使用者:中水北方勘测设计研究有限责任公司技术研发日:技术公布日:2024/1/22本文地址:https://www.jishuxx.com/zhuanli/20240618/21090.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表