老年人情感健康分析与支持系统
- 国知局
- 2024-06-21 11:51:19
本发明属于语音分析,具体涉及老年人情感健康分析与支持系统。
背景技术:
1、随着社会的不断发展和人口老龄化的加剧,老年人的情感健康问题日益引起人们的关注。老年人的情感健康状况对其生活质量和社会参与度具有重要影响,因此,开发一种能够及时监测和支持老年人情感健康的系统具有重要意义。传统的情感健康监测方法主要依赖于医疗机构或专业人员进行面对面的评估,这种方法存在着资源消耗大、成本高、实时性差等问题,难以满足大规模的情感健康监测需求。因此,开发一种能够自动化地监测老年人情感健康,并在必要时提供支持和干预的系统具有重要的现实意义。
2、在过去的几年中,随着语音处理和情感分析领域的发展,越来越多的研究关注于利用语音信号进行情感识别和健康监测。传统的语音情感分析方法主要依赖于基于机器学习的模型,如支持向量机(svm)、深度神经网络(dnn)等。这些方法通过对语音信号进行特征提取,并将其与标注好的情感类别进行训练,从而实现情感识别和分类。然而,这些方法往往需要大量的标注数据和复杂的模型训练过程,且在实际应用中存在着准确率不高、泛化能力差等问题。
3、除了基于机器学习的方法外,还有一些基于信号处理和特征提取的方法被提出用于语音情感分析。例如,利用语音信号的基频、能量、梅尔频率倒谱系数(mfcc)等特征进行情感识别。这些方法通常具有较好的实时性和适用性,但是其准确率和鲁棒性仍然有待提高。
4、此外,针对老年人情感健康监测的系统也已经在学术界和工业界展开了一些尝试。这些系统通常包括语音采集装置、情感分析算法和支持干预机制等组成部分,旨在通过对老年人语音信号的分析来实现情感健康的监测和支持。然而,现有的系统往往缺乏对老年人语音特征的深入分析和有效的情感识别算法,导致其在实际应用中的效果不佳,且存在着误报率高、准确率低等问题。
5、因此,针对老年人情感健康分析与支持领域,需要一种能够结合语音处理技术和情感分析算法,实现对老年人情感状态的准确监测和支持的系统。这样的系统应具备对老年人语音信号的高效提取和特征分析能力,同时结合先进的情感分析算法,实现对老年人情感状态的准确判断和及时干预。同时,该系统还应考虑老年人的个性化需求和隐私保护问题,确保其在实际应用中的可接受性和可靠性。
技术实现思路
1、本发明的主要目的在于提供电网一次调频智能控制系统,通过语音信号的采集、处理和情感分析,实现了对老年人情感健康的全面监测和支持,具有重要的应用前景和社会意义。本发明能够实时监测老年人情感状态、准确识别情感特征、及时发出预警信号、进行情感干预和支持等,将为老年人的情感健康提供有效的保障和支持。
2、为了解决上述问题,本发明的技术方案是这样实现的:
3、老年人情感健康分析与支持系统,所述系统包括:语音采集装置、语音处理装置和语音情感分析装置;所述语音采集装置,用于在设定的时间段内,获取目标老年人的语音信号,并对语音信号进行信号初步分析,以判断是否需要进行语音情感分析,具体包括:统计分析语音信号的语音平均能量和语音频次占比;所述语音平均能量定义为在设定时间段内,语音信号的总能量与时间段的比值;所述语音频次占比定义为在设定时间段内,语音信号的长度与时间段的比值;若语音平均能量或语音频次占比均处于各自对应的阈值范围内,则判断不需要进行语音情感分析,否则,则判断需要进行语音情感分析;所述语音处理装置,用于在语音采集装置判断需要进行语音情感分析时,对采集到的语音信号应用预加重滤波器来平衡频谱,得到预处理信号,从预处理信号中提取mfcc特征、基频特征和能量特征,作为特征向量中的元素,组成特征向量,并基于特征向量,使用零交叉率的方法将预处理信号划分为语音段和非语音段;所述语音情感分析装置,用于对语音段的特征向量使用预先训练的语音情感分析模型进行情感分析,判断语音段的情感特征,所述情感特征包括:正向情感特征、中性情感特征和负向情感特征,若在设定的时间周期内处于负向情感特征的语音段的总帧数与时间周期的长度的比值超过设定的阈值,则判断目标老年人处于负向情绪中,发出需要情感干预的预警信号。
4、进一步的,所述语音采集装置包括:采集单元、增强单元、初步分析单元和噪声分离单元;所述采集单元,用于在设定的时间段内,通过语音识别判断发出的语音信号是否为目标老年人发出,若是,则对语音信号进行采集;所述增强单元,用于对语音信号进行信号增强,得到增强语音信号;所述初步分析单元,对语音信号进行信号初步分析,以判断是否需要进行语音情感分析;所述噪声分离单元,用于在判断需要进行语音情感分析时将背景噪声从语音信号中分离。
5、进一步的,增强单元,对语音信号进行信号增强,得到增强语音信号的方法包括:使用如下公式,将语音信号进行基于自回归模型的短时傅里叶变换,得到时频表示:
6、;
7、其中,表示短时傅里叶变换的时间片段索引;表示频率索引;为每个时间片段的窗长;为窗函数;是自回归模型的系数,是自回归模型的阶数;为虚数符号;时域索引;通过如下公式,采用具有非线性动态范围压缩特性的wiener滤波器对时频表示进行增强:
8、;
9、其中,和分别表示噪声和语音信号的功率谱估计;为增强语音信号的频域表示,将增强后的频域信号进行逆短时傅里叶变换得到增强语音信号。
10、进一步的,噪声分离单元,在判断需要进行语音情感分析时将背景噪声从语音信号中分离的方法包括:将语音信号表示为时域上的波形函数;通过短时傅里叶变换将其转换到频域,得到频域表示;设时间段的长度为,使用长度为的窗函数对其进行分段,窗口长度为,窗口之间的重叠长度为;窗口函数选择汉明窗,定义窗口函数为:
11、;
12、其中,表示窗口的采样索引;通过将窗口函数应用于语音信号的各个时间片段,并应用零填充将其扩展到长度为,以获得时域上的窗口信号;对每个窗口信号应用离散傅里叶变换,得到频域表示;设背景噪声是稳态的,并且与语音信号是线性叠加的;使用频域上的自适应滤波器对背景噪声进行建模和估计;设表示语音信号的干净频谱,表示背景噪声的频谱;定义自适应滤波器的频域响应为:
13、;
14、其中,是在时间处的自适应滤波器频域响应;通过如下公式,使用自适应滤波器对语音信号进行频域上的重构,得到重构信号:
15、;
16、其中,为重构信号;将重构信号转换回时域,得到将背景噪声从语音信号中分离后的语音信号。
17、进一步的,语音处理装置,在语音采集装置判断需要进行语音情感分析时,通过如下公式,对采集到的语音信号应用预加重滤波器来平衡频谱,然后将语音信号分割成重叠的帧:
18、;
19、;
20、其中,是原始信号;是预加重后的信号;是预加重系数;表示第帧;是帧长;是帧移,表述相邻帧之间的重叠。
21、进一步的,语音处理装置对每帧信号,进行窗函数处理后,应用离散傅里叶变换,然后通过梅尔滤波器处理,以提取mfcc特征,公式如下:
22、;
23、;
24、;
25、其中,第个语音帧中的第个样本;表示经过离散傅里叶变换处理的第个频域系数表示离散傅里叶变换的点数,同时也是每个语音帧的样本数量;等于表示离散傅里叶变换中独立频率成分的数量;是第个梅尔滤波器在第个频率点的增益;梅尔滤波器是一组重叠的三角形带通滤波器,用于模仿人耳的频率感知,对频率进行非线性的梅尔尺度转换;为梅尔滤波器的数量,代表在梅尔尺度上划分的频率带的数量;为通过将第个梅尔滤波器应用于离散傅里叶变换的系数并取对数得到的结果,它代表了第个频率带的对数能量;为第个梅尔频率倒谱系数,是对应用离散余弦变换的结果,目的是将梅尔滤波器的对数能量谱转换为时间域的倒谱系数,减少特征间的相关性,并突出频谱形状特征;为最终提取的mfcc特征的数量。
26、进一步的,基频特征通过如下公式计算得到:
27、;
28、其中,是自相关函数;是的峰值位置;是采样频率;能量特征通过如下公式,计算得到:
29、;
30、其中,为第个语音帧的能量;得到的特征向量为:
31、。
32、进一步的,预先训练的语音情感分析模型为一个三分支持向量模型,其类别标签为:
33、,
34、表示三种情感特征,类别标签中每个元素对应一种情感类别;所述语音情感分析模型使用如下公式进行表示:
35、;
36、;
37、;
38、;
39、;
40、其中,表示决策超平面的法向量,用于定义分类边界;表示偏置项,也称为截距,它是支持向量机模型中的参数,用于平移分类边界;表示额外决策函数的权重向量,用于定义额外的分类边界;表示额外决策函数的偏置项,用于平移额外分类边界;表示松弛变量,表示允许偏离超平面的程度;表示正则化参数,控制了松弛变量的重要性,它的值越大,对误分类的惩罚越严重;表示指示变量;为额外的决策函数;采集历史的语音段的特征向量,以及对应的类别标签,作为模型训练测试数据,将模型训练测试数据中的一部分作为训练数据,训练语音情感分析模型,训练的目标是找到一个最优的决策边界,以最大程度地正确分类训练集中的样本,并且保持模型的泛化能力;将模型训练测试数据中除训练数据以外的部分作为测试数据,使用测试数据对训练好的支持向量机模型进行评估,评估指标为准确率,若准确率超过设定的准确率阈值,则停止训练,否则,则调整模型的参数,继续进行训练,直到准确率超过设定的准确率阈值。
41、进一步的,额外的决策函数使用如下公式进行表示:
42、。
43、本发明的老年人情感健康分析与支持系统,具有以下有益效果:
44、首先,本发明通过对语音信号的采集装置、处理装置和情感分析装置的组合使用,实现了对老年人情感状态的全面监测。语音采集装置能够在设定的时间段内获取目标老年人的语音信号,并进行初步分析,判断是否需要进行情感分析。采集到的语音信号经过处理装置的预加重滤波器平衡频谱,然后分割成重叠的帧,并提取特征,如mfcc、基频和能量特征,为后续的情感分析做准备。情感分析装置则利用预先训练的语音情感分析模型,对提取的特征进行分析,判断老年人的情感状态,从而实现了对老年人情感健康的实时监测。
45、其次,本发明采用了基于机器学习的情感分析模型,结合了支持向量机等方法,能够对老年人的情感状态进行准确判断。预先训练的语音情感分析模型利用采集到的语音特征,能够有效地识别出语音信号中的情感特征,包括正向情感、中性情感和负向情感,从而准确判断老年人的情感状态。通过模型的训练和测试,可以不断优化模型参数,提高情感分析的准确率和鲁棒性,为老年人情感健康的监测提供可靠的支持。
46、再次,本发明还提供了实时干预机制,能够在老年人情感状态异常时及时发出预警信号,进行情感干预和支持。通过对情感分析结果的监测,当系统检测到老年人处于负向情感状态时,能够及时发出预警信号,提示相关工作人员或家庭成员进行干预和支持。这种及时的干预机制可以有效预防老年人情感健康问题的发生,提高其生活质量和幸福感。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24001.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表