一种用于手术室记录的智能生成方法和装置与流程
- 国知局
- 2024-06-21 11:29:33
本发明涉及语音识别领域,具体涉及一种用于手术室记录的智能生成方法和装置。
背景技术:
1、手术记录是医院手术室中非常重要的工作之一,记录手术过程中的各种信息,包括手术操作、用药情况、病人状况等。传统的手术记录方式主要是由医护人员手动记录,存在记录不全、记录不准确等问题。由于手术记录中专有词汇较多,且在手术过程中,医护人员之间的对话较简短,不是一个完整的句子,这就导致现有的语音识别系统在语音识别时,出现超出语料库、识别的语音与原义不符的等问题。
技术实现思路
1、针对上述技术问题,本发明提供一种用于手术室记录的智能生成方法和装置,包括:
2、预先采集手术室内相关人员的语音信号;
3、根据所述语音信号的声纹特征,区分所述手术室内相关人员的语音信号;
4、构建基于声学模型hmm-gmm的深度定制语音识别模型,在所述深度定制语音识别模型中增加医疗专有语料;
5、基于所述深度定制语音识别模型,识别当前手术室内待识别的语音信号的声纹特征,并将所述声纹特征与预先采集的手术室内相关人员的语音信号的声纹特征进行对比,将当前手术室内的人员进行区分;
6、基于所述深度定制语音识别模型,识别所述当前手术室内的人员语音信号中的通用语料和医疗专有语料,并根据上下文和语法规则,进行语言分割和语义识别,自动生成手术记录。
7、进一步的,在获取手术室内人员的语音信号的步骤之前,还包括:
8、采集手术室内的声音信号,对所述手术室内的声音信号进行预处理,包括:去除所述声音信号中的噪声,包括但不限于去除手术器械产生的噪声,获取手术室内人员的语音信号;
9、通过预加重提高所述语音信号中的高频成分,提高信噪比;
10、区分语音和非语音的区域;
11、增强语音信号中音量和语速。
12、进一步的,还包括:对所述基于声学模型hmm-gmm的深度定制语音识别模型,进行训练和测试。
13、进一步的,所述基于声学模型hmm-gmm的深度定制语音识别模型,支持多种语言和方言的声音识别。
14、进一步的,基于所述深度定制语音识别模型,将当前手术室内待识别的语音信号的声纹特征与预先采集的手术室内相关人员的语音信号的声纹特征进行对比,将当前手术室内的人员进行区分,包括:
15、所述深度定制语音识别模型,将所述语音信号,经过分帧、傅里叶变换和离散余弦变换处理,得到所述声音信号的声纹特征;
16、根据所述语音信号的声纹特征,将当前手术室内的人员的语音进行分离;
17、将当前手术室内待识别的语音信号的声纹特征与预先采集的手术室内相关人员的语音信号的声纹特征进行对比,将对比结果中声纹特征相同的确定为同一人员。
18、进一步的,根据上下文和语法规则,进行语言分割和语义识别,自动生成手术记录,包括:
19、根据上下文和语法规则,将所述当前手术室内待识别的声纹信号对应的手术记录进行断句,并根据上下文对所述手术记录进行校正和填充,自动生成手术记录。
20、本发明同时提供一种用于手术室记录的智能生成装置,包括:
21、声音信号采集单元,用于预先采集手术室内相关人员的声纹信号;
22、人员区分单元,用于根据所述语音信号的声纹特征,区分所述手术室内相关人员的语音信号;
23、模型构建单元,用于构建基于声学模型hmm-gmm的深度定制语音识别模型,在所述深度定制语音识别模型中增加医疗专有语料;
24、声音信号对比单元,用于基于所述深度定制语音识别模型,将当前手术室内待识别的语音信号的声纹特征与预先采集的手术室内相关人员的语音信号的声纹特征进行对比,将当前手术室内的人员进行区分;
25、手术记录生成单元,用于基于所述深度定制语音识别模型,识别所述当前手术室内的人员语音信号中的通用语料和医疗专有语料,并根据上下文和语法规则,进行语言分割和语义识别,自动生成手术记录。
26、进一步的,还包括:
27、预处理单元,用于采集手术室内的声音信号,对所述手术室内的声音信号进行预处理,包括:去除所述声音信号中的噪声,包括但不限于去除手术器械产生的噪声,获取手术室内人员的语音信号;
28、通过预加重提高所述语音信号中的高频成分,提高信噪比;
29、区分语音和非语音的区域;
30、增强语音信号中音量和语速。
31、进一步的,还包括:
32、训练和测试单元,用于对所述基于声学模型hmm-gmm的深度定制语音识别模型,进行训练和测试。
33、进一步的,所述基于声学模型hmm-gmm的深度定制语音识别模型,支持多种语言和方言的声音识别。
34、通过本发明提供的一种手术记录的智能生成方法和装置,将语音转写技术和声纹分离技术结合起来,可以实现更加准确的高效的手术记录,解决现有技术在语音识别时,出现超出语料库、识别的语音与原义不符的等问题,提高了手术记录生成的效率。
技术特征:1.一种用于手术室记录的智能生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在获取手术室内人员的语音信号的步骤之前,还包括:
3.根据权利要求1所述的方法,其特征在于,还包括:对所述基于声学模型hmm-gmm的深度定制语音识别模型,进行训练和测试。
4.根据权利要求1所述的方法,其特征在于,所述基于声学模型hmm-gmm的深度定制语音识别模型,支持多种语言和方言的语音识别。
5.根据权利要求1所述的方法,其特征在于,基于所述深度定制语音识别模型,识别当前手术室内待识别的语音信号的声纹特征,并将所述声纹特征与预先采集的手术室内相关人员的语音信号的声纹特征进行对比,将当前手术室内的人员进行区分,包括:
6.根据权利要求1所述的方法,其特征在于,根据上下文和语法规则,进行语言分割和语义识别,自动生成手术记录,包括:
7.一种用于手术室记录的智能生成装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,还包括:
9.根据权利要求7所述的装置,其特征在于,还包括:
10.根据权利要求7所述的装置,其特征在于,所述基于声学模型hmm-gmm的深度定制语音识别模型,支持多种语言和方言的声音识别。
技术总结本发明提供一种用于手术室记录的智能生成方法和装置,包括:预先采集手术室内相关人员的语音信号;根据所述语音信号的声纹特征,区分所述手术室内相关人员的语音信号;构建基于声学模型HMM‑GMM的深度定制语音识别模型,在所述深度定制语音识别模型中增加医疗专有语料;基于所述深度定制语音识别模型,将当前手术室内待识别的语音信号的声纹特征与预先采集的手术室内相关人员的语音信号的声纹特征进行对比,将当前手术室内的人员进行区分;基于所述深度定制语音识别模型,识别所述当前手术室内的人员语音信号中的通用语料和医疗专有语料,并根据上下文和语法规则,进行语言分割和语义识别,自动生成手术记录,提高了手术记录生成的效率。技术研发人员:何宬呈,国威,张军受保护的技术使用者:华迪计算机集团有限公司技术研发日:技术公布日:2024/2/21本文地址:https://www.jishuxx.com/zhuanli/20240618/21817.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。