一种对话式查询机票系统的制作方法
- 国知局
- 2024-06-21 11:54:24
本发明涉及语音特征分析领域,尤其涉及一种对话式查询机票系统。
背景技术:
1、随着计算机技术以及互联网技术的发展,语音交互技术被广泛应用于各个领域,通过构建语音交互模型能够解答用户咨询的问题,通过语音控制实现各类功能,例如信息解答、信息检索等,因此,适用于各类应用场景的语音交互系统应运而生。
2、例如,中国专利公告号:cn108846071a,公开了一种应用于机场的机器人信息查询方法及机器人,其方法包括:在机场中,当用户需要查询航空相关信息时,解析用户的查询方式,并在用户选择的查询方式下获取用户的查询请求;所述查询方式包括:机票扫描查询、语音查询、屏幕选项查询;根据所述查询请求,在资源库中查找所述查询请求对应的查询结果;显示所述查询结果,并将所述查询结果生成对应的图像识别信息,所述图像识别信息包括二维码、可识别图像。通过本发明,乘客可以获取查询后的结果,通过图像识别信息能够多次查看查询结果。
3、但是,现有技术中还存在以下问题,
4、由于在机场的应用环境下,环境噪声嘈杂,尤其是问询设备前聚集游客,各游客发出的音频会干扰语音识别,造成语音识别错误,反馈不准确的问题。
技术实现思路
1、为此,本发明提供一种对话式查询机票系统,用以克服现有技术中由于在机场的应用环境下,环境噪声嘈杂,尤其是问询设备前聚集游客,各游客发出的音频会干扰语音识别,造成语音识别错误,反馈不准确的问题。
2、为实现上述目的,本发明提供一种对话式查询机票系统,其包括:
3、交互模块,其包括显示单元以及设置在所述显示单元一侧的语音播报单元;
4、数据采集模块,其包括设置在所述交互模块一侧能调整音频接收方向的语音采集单元以及用以采集预定区域图像的深度图像采集单元;
5、特征分析模块,其与所述数据采集模块连接,包括环境分类单元以及特征提取单元,
6、所述环境分类单元用以根据预定区域图像中人脸特征构建发音指向向量,根据各所述发音指向向量相对所述语音采集单元的偏移角度计算发音偏移影响系数,以判定当前收音环境的类别;
7、所述特征提取单元用以根据所述环境分类单元的判定结果选定针对所采集音频的音频分析方式,包括,
8、针对所采集音频进行背景降噪,识别音频对应文本信息;
9、或,根据各人脸特征与语音采集单元的空间位置关系确定表征人脸特征,以根据对应发音指向向量调整所述语音采集单元的音频接收方向,根据表征人脸特征的动态变化情况确定特征时间段,调整去噪频域进行背景降噪,仅对特征时间段内的音频进行分析,识别对应文本信息;
10、机票查询模块,其与所述特征分析模块以及云端票务数据库连接,用以提取所识别文本信息中的触发关键词,由票务数据库中检索对应触发关键词关联的信息,并推送至所述交互模块。
11、进一步地,所述环境分类单元根据预定区域图像中人脸特征构建发音指向向量包括,
12、根据嘴部特征对应空间坐标、左眼特征对应空间坐标以及右眼特征对应空间坐标构建唯一平面,以嘴部特征为起始点,以垂直于所述唯一平面的方向构建发音指向向量。
13、进一步地,所述环境分类单元根据公式(1)计算发音偏移影响系数,
14、
15、公式(1)中,e表示发音偏移影响系数,n表示人脸特征的数量,n0表示预设的人脸特征数量阈值,ci表示第i人脸特征对应发音指向向量与语音采集单元的偏移角度,δc表示偏移角度平均值,c0表示预设的标准偏移角度,α表示方向聚集权重系数,β表示偏移角度权重系数。
16、进一步地,所述环境分类单元还用以确定发音指向向量与语音采集单元的偏移角度,其中,
17、以发音指向向量的起点为基准,指向语音采集单元构建参照向量,将所述参照向量与所述发音指向向量的夹角确定为偏移角度。
18、进一步地,所述环境分类单元判定当前收音环境的类别,其中,
19、若所述发音偏移影响系数小于预设的发音偏移影响阈值,则判定当前收音环境为强影响类别;
20、若所述发音偏移影响系数大于或等于预设的发音偏移影响阈值,则判定当前收音环境为弱影响类别。
21、进一步地,所述特征提取单元选定针对所采集音频的音频分析方式,其中,
22、若所述环境分类单元判定当前收音环境为弱影响类别,则针对所采集音频进行背景降噪,识别音频对应文本信息;
23、若所述环境分类单元判定当前收音环境为强影响类别,则调整去噪频域,仅对特征时间段内的音频进行背景降噪,识别对应文本信息。
24、进一步地,所述特征提取单元确定表征人脸特征包括,
25、确定各人脸特征中嘴部特征对应空间坐标,计算与语音采集单元的空间距离,将最小空间距离对应人脸特征确定为表征人脸特征。
26、进一步地,所述特征提取单元调整所述语音采集单元的音频接收方向,其中,
27、所述特征提取单元控制所述语音采集单元的收音方向指向所述表征人脸特征对应的空间坐标。
28、进一步地,所述特征提取单元根据表征人脸特征的动态变化情况确定特征时间段,其中,
29、所述特征提取单元确定表征人脸特征的嘴部特征中边缘轮廓各边缘标定点的位移情况,将边缘轮廓的边缘标定点存在位移的时间段确定为特征时间段。
30、进一步地,所述特征提取单元调整去噪频域包括,
31、扩大原有去噪频域范围。
32、与现有技术相比,本发明通过设置交互模块、数据采集模块、特征分析模块以及机票查询模块,通过特征分析模块根据预定区域图像中人脸特征构建发音指向向量,根据各所述发音指向向量相对所述语音采集单元的偏移角度计算发音偏移影响系数,判定当前收音环境的类别,并且,根据判定结果选定针对所采集音频的音频分析方式,包括在强影响类别下调整语音采集单元的音频接收方向,根据表征人脸特征的动态变化情况确定特征时间段,调整去噪频域进行背景降噪,仅对特征时间段内的音频进行分析,识别对应文本信息,本发明通过上述过程,能够在减少数据处理量,节约算力的前提下,减少多源音频的干扰,提高语音识别准确性和可靠性。
33、尤其,本发明构建人脸特征对应的发音指向向量,并计算偏移影响系数,判定当前收音环境的类别,在实际情况中,应用场景为机场,环境噪声嘈杂,尤其是交互模块前容易聚集游客,存在多个音源点,并且,由于音频的传播性质,不同音源点的音频传播方向不同,在多个音源点干涉影响下,容易导致音频识别不准确,尤其是,多个音源点的音频传播方向向交互模块聚合时,加剧上述现象,因此,若采用单一音频分析方式不易满足需求,因此,本发明通过构建发音指向向量,并计算发音偏移影响系数,为后续划分收音环境的类别提供数据支持,以便于后续采用不同音频分析方式对所采集音频进行分析,进而,在减少数据处理量,节约算力的前提下,减少多源音频的干扰,提高语音识别准确性和可靠性。
34、尤其,本发明选定针对所采集音频的音频分析方式,在实际情况中,处于弱影响类别下,多音源的音频传播方向相对较为分散,且未集中向语音采集单元传播,因此,影响相对较小,可仅采用背景降噪方法对所采集音频进行处理,保证语音识别准确性和可靠性。
35、尤其,本发明在收音环境处于强影响类别下,调整音频接收方向,并确定特征时间段,仅对特征时间段内的音频进行分析,在实际情况中,若多音源传播方向整体向语音采集单元集中,则容易对语音识别造成干扰,因此,本发明根据表征人脸特征调整语音采集单元的音频接收方向,尽可能的接收目标发出的音频,并且特征时间段根据表征人脸特征的动态变化情况所确定,动态变化情况表征了目标的发音情况,因此,仅对特征时间段进行分析,以分析数据表征性强的音频,减少其他音源的干扰,并且,扩大原有的去噪频域,在影响较强的情况下去除较广频域的背景音频,减少其他音源的干扰,进而在减少数据处理量,节约算力的前提下,提高语音识别准确性和可靠性。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24391.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表