技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于语音识别的健康素养调查质量控制方法及系统与流程  >  正文

一种基于语音识别的健康素养调查质量控制方法及系统与流程

  • 国知局
  • 2024-06-21 11:40:48

本发明涉及音频处理,具体涉及一种基于语音识别的健康素养调查质量控制方法及系统。

背景技术:

1、为客观掌握居民健康素养水平,即达到了解居民健康素养水平和变化趋势、提升各级健康教育专业人员能力和水平的目标,以及为各级政府和卫生健康行政部门进行健康决策提供科学依据、为各级健康教育专业机构开展精准化干预工作提供循证数据,每年各地区均会对15-70周岁的常驻人口开展健康素养监测。调查员采用全国统一使用的《全国居民健康素养监测调查问卷》,以入户调查方式了解监测对象的健康素养水平,主要内容包括基本健康知识和理念、健康生活方式与行为、基本技能三个方面。

2、通常情况下,调查员入户调查是利用平板电脑调查工具,问卷在平板电脑上呈现;健康素养问卷由调查对象自填完成,调查员需在旁指导其认真答题,必要时可进行题目解释,如在调查对象不能独立完成填写,则采用面对面询问方式调查,由调查员记录调查对象的答案,并且全程录音监测。为了保证健康素养问卷填写的真实性,需要对健康素养调查进行质控,质控手段包括定人定期专责后台记录调查数据完成情况、现场督查、听录音和电话回访等;其中,听录音是质控的核心手段,主要是通过听录音进行调查对象录音的合格性检验;当下,听录音过程完全是人工方式实现,需要耗费大量时间成本和精力。因此,急需开发一种能够根据语音内容自动进行不合格因素的判断识别及分析的方法,处理速度和效率显著提升;另外,能通过处理更多数据进一步提升健康素养监测数据的准确性。

技术实现思路

1、本发明目的在于提供一种基于语音识别的健康素养调查质量控制方法及系统,通过对录音文件中的人声匹配和答题要点提取识别,校验录音文件是否合格,实现对健康素养调查过程中的影响调查准确度因素的自动判断识别,提高对调查过程合格性判断的效率。

2、为达成上述目的,本发明提出如下技术方案:

3、第一方面,本发明提出一种基于语音识别的健康素养调查质量控制方法,该方法包括:

4、对任一录音文件进行预处理,确定所述语音文件中的多个语音对象;其中,所述语音对象包括调查者和受测者;

5、根据所述录音文件的时间进程,划分并确定各语音对象的单人语音片段及片段间的对应关系;

6、根据各所述语音对象的单人语音片段及片段间的对应关系,自动语音识别受测者答复任一问题的所述单人语音片段中的答题要点;

7、根据所述答题要点,判断所述录音文件中是否存在不合格因素,并当所述录音文件存在任一不合格因素时记录所述录音文件不合格;其中,所述不合格因素包括时间不合格、诱导提示答题、跳题或代答题;

8、选择合格的所述录音文件进行健康素养调查结果的分析。

9、进一步的,所述对任一录音文件进行预处理,确定所述语音文件中的多个语音对象的过程为:

10、获取调查者和受测者的声音样本,并分别对所述声音样本的语音信号进行预处理;

11、对预处理后的声音样本进行分帧,并对分帧处理后的原始分帧信号做连续性处理;

12、将连续性处理后的声音信号经过快速傅里叶变换得到频谱能量分布,再经mel滤波器滤波并进行对数运算及离散余弦变换后,获得梅尔倒谱系数;

13、以所述梅尔倒谱系数作为声纹特征确定所述语音文件中的语音对象。

14、进一步的,还包括:根据所述调查者和受测者的声纹特征,判断所述录音文件中是否存在第三人的声音信息;

15、当所述录音文件中存在第三人的声音信息,则划分并确定第三人的多个单人语音片段;

16、根据所述第三人的单人语音片段及其在所述录音文件中的时间信息,识别所述单人语音片段与所述时间信息相关的设定时间周期内各问题的相关性;

17、当所述单人语音片段与所述时间周期内任一问题的相关性超过设定相关系数,则判定所述录音文件存在诱导提示答题或代答题。

18、进一步的,根据所述答题要点,判断所述录音文件中存在跳题的过程为:

19、根据健康素养调查问卷的内容、所述录音文件的时间进程及所述调查者的单人语音片段,顺序确定所述受测者回复所述健康素养调查问卷中各问题的单人语音片段的答题要点;

20、将所述健康素养调查问卷中各问题的模板回复要点与所述受测者回复各问题的答题要点进行对比分析,确定所述受测者的答复要点是否符合未答复问题或跳过问题;

21、当所述受测者的答复要点符合未答复问题或跳过问题,则根据所述录音文件,统计所述受测者未答复问题或跳过问题的总次数;

22、当统计的总次数超过所述健康素养调查问卷预设的跳题数量阈值,则判定所述录音文件中存在跳题。

23、进一步的,根据所述答题要点,判断所述录音文件中存在诱导提示答题的过程为:

24、根据健康素养调查问卷的内容、所述录音文件的时间进程及所述调查者的单人语音片段,顺序确定所述受测者回复所述健康素养调查问卷中各问题的单人语音片段的答题要点;

25、对所述健康素养调查问卷中任一问题,获取所述调查者关于该问题单人语音片段的关键词以及所述受测者回复所述问题的答题要点,识别分析所述关键词与所述答题要点的逻辑相关性;

26、当分析的逻辑相关性高于所述健康素养调查问卷预设的诱导提示相关性,则判定所述录音文件中存在诱导提示答题。

27、第二方面,本发明提出一种基于语音识别的健康素养调查质量控制系统,包括:

28、预处理模块,用于对任一录音文件进行预处理,确定所述语音文件中的多个语音对象;其中,所述语音对象包括调查者和受测者;

29、划分确定模块,用于根据所述录音文件的时间进程,划分并确定各语音对象的单人语音片段及片段间的对应关系;

30、语音识别模块,用于根据各所述语音对象的单人语音片段及片段间的对应关系,自动语音识别受测者答复任一问题的所述单人语音片段中的答题要点;

31、判断记录模块,用于根据所述答题要点,判断所述录音文件中是否存在不合格因素,并当所述录音文件存在任一不合格因素时记录所述录音文件不合格;其中,所述不合格因素包括时间不合格、诱导提示答题、跳题或代答题;

32、选择分析模块,用于选择合格的所述录音文件进行健康素养调查结果的分析。

33、进一步的,所述预处理模块对任一录音文件进行预处理,确定所述语音文件中的多个语音对象的执行单元,包括:

34、预处理单元,用于获取调查者和受测者的声音样本,并分别对所述声音样本的语音信号进行预处理;

35、第一处理单元,用于对预处理后的声音样本进行分帧,并对分帧处理后的原始分帧信号做连续性处理;

36、第二处理单元,用于将连续性处理后的声音信号经过快速傅里叶变换得到频谱能量分布,再经mel滤波器滤波并进行对数运算及离散余弦变换后,获得梅尔倒谱系数;

37、第一确定单元,用于以所述梅尔倒谱系数作为声纹特征确定所述语音文件中的语音对象。

38、进一步的,还包括:

39、判断模块,用于根据所述调查者和受测者的声纹特征,判断所述录音文件中是否存在第三人的声音信息;

40、识别划分模块,用于当所述录音文件中存在第三人的声音信息,识别并划分所述第三人的多个单人语音片段;

41、计算模块,用于根据所述第三人的单人语音片段及其在所述录音文件中的时间信息,计算所述单人语音片段与所述时间信息相关的设定时间周期内各问题的相关性;

42、判定模块,用于当所述单人语音片段与所述时间周期内任一问题的相关性超过设定相关系数,则判定所述录音文件存在诱导提示答题或代答题。

43、进一步的,所述判断记录模块根据所述答题要点,判断所述录音文件中存在跳题的执行单元,包括:

44、第二确定单元,用于根据健康素养调查问卷的内容、所述录音文件的时间进程及所述调查者的单人语音片段,顺序确定所述受测者回复所述健康素养调查问卷中各问题的单人语音片段;

45、对比分析单元,用于将所述健康素养调查问卷中各问题的模板回复要点与所述受测者回复各问题的答题要点进行对比分析,确定所述受测者的答复要点是否符合未答复问题或跳过问题;

46、统计单元,用于当所述受测者的答复要点符合未答复问题或跳过问题,则根据所述录音文件,统计所述受测者未答复问题或跳过问题的总次数;

47、第一判定单元,用于当统计的总次数超过所述健康素养调查问卷预设的跳题数量阈值,则判定所述录音文件中存在跳题。

48、第三方面,本发明提出一种电子设备,包括处理器、存储器和存储在所述存储器内的计算机程序,所述计算机程序被配置为被所述处理器运行时执行上述的基于语音识别的健康素养调查质量控制方法。

49、由以上技术方案可知,本发明的技术方案获得了如下有益效果:

50、本发明公开的基于语音识别的健康素养调查质量控制方法及系统,其方法包括:预处理录音文件,确定文件中的多个语音对象;根据录音文件的时间进程,划分并确定各语音对象的单人语音片段及片段间的对应关系;根据各语音对象的单人语音片段及片段间的对应关系,自动语音识别受测者答复任一问题的单人语音片段中的答题要点;根据答题要点,判断录音文件中是否存在不合格因素,并当存在任一不合格因素时记录录音文件不合格;选择合格的录音文件进行健康素养调查结果的分析。本发明解决当前采用人工听健康素养调查录音进行合格性检验而耗费大量时间成本和精力的问题,通过人声特征提取匹配识别、答题要点提取,以及根据预先学习的问卷问题及答复点校验答题要点是否合格等步骤,实现对健康素养调查过程中的时间不合格、诱导提示答题、跳题或代答题等不合格因素进行自动判断识别,提高录音文件合格性判断的处理速度和处理效率。

51、本发明在录音文件处理效率提升的基础上,能够扩大录音文件的处理量,在大量数据的基础上有效确保健康素养调查结果的准确度。

52、应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。

53、结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22852.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。