一种基于生物特征识别的活动现场多维统计方法
- 国知局
- 2024-06-21 10:41:32
本发明涉及语音处理,具体涉及一种基于生物特征识别的活动现场多维统计方法。
背景技术:
1、在举办大型活动时,例如会议或者讲座,现场人员众多,人员分散在活动现场的各个区域,较难通过人为填写问卷的方式一一统计出现场人员是否对活动感兴趣。现有通常通过视频监控的方式判断出现场人员的数量,从而评估出现场人员对活动的感兴趣程度。现场人员的数量仅能代表现场出席的人数,无法表征出现场人员对举办的大型活动的感兴趣程度。举办的大型活动的成功程度如果仅从出席人数上来分析,较难评估出现场人员对活动的关注度。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种基于生物特征识别的活动现场多维统计方法解决了现有技术无法准确评估出现场人员对于活动的关注度的问题。
2、为了达到上述发明目的,本发明采用的技术方案为:一种基于生物特征识别的活动现场多维统计方法,包括以下步骤:
3、s1、在活动现场以阵列布局方式放置多个声音信号采集设备,获取连续时间声音讯息矩阵;
4、s2、对连续时间声音讯息矩阵提取声音特征,构建音纹生物特征样本;
5、s3、根据音纹生物特征样本,基于分类模型,得到活动现场的人群空间域聚集度和时间域活跃度。
6、进一步地,所述s2包括以下分步骤:
7、s21、对一段时间内的连续时间声音讯息矩阵进行采样处理,得到多个离散的声音讯息矩阵;
8、s22、在多个离散的声音讯息矩阵中提取同一个声音信号采集设备的元素,构成多个声音向量;
9、s23、对每个声音向量提取峰峰值、声音波形特征值和声音分布特征值;
10、s24、根据声音信号采集设备的阵列布局方式,构建峰峰值矩阵、声音波形特征值矩阵和声音分布特征值矩阵,其中,音纹生物特征样本包括:峰峰值矩阵、声音波形特征值矩阵和声音分布特征值矩阵。
11、上述进一步的技术方案的有益效果为:本发明中先对一段时间内的连续时间声音讯息矩阵进行采样处理,其采样处理的方式是将所有声音讯息矩阵中同一个位置点的元素进行采样处理,从而得到多个离散的声音讯息矩阵,离散的声音讯息矩阵中各个元素依然跟多个声音信号采集设备的阵列布局方式一致,实现对连续时间声音讯息矩阵的采样处理。本发明中一个声音向量是一个声音信号采集设备处的声音信号,因此,对其提取出峰峰值、声音波形特征值和声音分布特征值,进一步地减少数据量,凸出数据特征,再按声音信号采集设备的阵列布局方式构建峰峰值矩阵、声音波形特征值矩阵和声音分布特征值矩阵,实现对声音的特征提取。
12、进一步地,所述s23中提取峰峰值的公式为:
13、,
14、其中,gp为峰峰值,max为取最大值,min为取最小值,vi为声音向量中第i个元素,i为声音向量中元素的编号,n为声音向量中元素的数量。
15、上述进一步的技术方案的有益效果为:本发明中通过峰峰值体现出声音向量中最大值与最小值的差距。
16、进一步地,所述s23中提取声音波形特征值的公式为:
17、,
18、其中,gw为声音波形特征值,vi为声音向量中第i个元素,i为声音向量中元素的编号,n为声音向量中元素的数量。
19、上述进一步的技术方案的有益效果为:本发明中通过声音波形特征值体现声音向量中各个元素形成的声音波形的形状。
20、进一步地,所述s23中提取声音分布特征值的公式为:
21、,
22、其中,gd为声音分布特征值,vi为声音向量中第i个元素,i为声音向量中元素的编号,n为声音向量中元素的数量,gp为峰峰值。
23、上述进一步的技术方案的有益效果为:本发明中通过声音向量中每个元素与均值的四次方,体现每个元素距离均值的大小,并设置四次方,再与峰峰值做比值,凸显各个元素之间的差距。
24、进一步地,所述s3中分类模型包括:峰峰值特征提取单元、波形特征提取单元、分布特征提取单元、第一隐藏层、第二隐藏层、第三隐藏层和输出层;
25、所述峰峰值特征提取单元用于输入峰峰值矩阵;所述波形特征提取单元用于输入声音波形特征值矩阵;所述分布特征提取单元用于输入声音分布特征值矩阵;所述第一隐藏层的输入端与峰峰值特征提取单元的输出端连接;所述第二隐藏层的输入端与波形特征提取单元的输出端连接;所述第三隐藏层的输入端与分布特征提取单元的输出端连接;所述输出层的输入端分别与第一隐藏层的输出端、第二隐藏层的输出端和第三隐藏层的输出端连接,其输出端作为分类模型的输出端。
26、上述进一步的技术方案的有益效果为:本发明中通过峰峰值特征提取单元、波形特征提取单元、分布特征提取单元分别处理提取各自特征,再通过三层隐藏层估算出各自特征对输出结果的影响程度,实现一种从三方面特征综合评定现场人群空间域聚集度或时间域活跃度的方案。
27、进一步地,所述峰峰值特征提取单元、波形特征提取单元和分布特征提取单元均包括:第一卷积层、第二卷积层、softmax层、乘法器、第三卷积层和最大池化层;
28、所述第一卷积层的输入端作为峰峰值特征提取单元、波形特征提取单元或分布特征提取单元的输入端;所述第一卷积层的输出端分别与第二卷积层的输入端和乘法器的第一输入端连接;所述softmax层的输入端与第二卷积层的输出端连接,其输出端与乘法器的第二输入端连接;所述第三卷积层的输入端与乘法器的输出端连接,其输出端与最大池化层的输入端连接;所述最大池化层的输出端作为峰峰值特征提取单元、波形特征提取单元或分布特征提取单元的输出端。
29、上述进一步的技术方案的有益效果为:本发明通过第一卷积层提取特征后,在乘法器处通过第二卷积层和softmax层实现对第一卷积层输出特征的自适应增强,实现增加不同特征之间的区别,最后通过最大池化层将显著特征进行提取,减少数据量,凸显声音特征。
30、进一步地,所述第一隐藏层、第二隐藏层和第三隐藏层的表达式均为:
31、,
32、其中,r为第一隐藏层、第二隐藏层或第三隐藏层的输出,xj为第一隐藏层、第二隐藏层或第三隐藏层的第j个输入值,wx,j为xj的权重,bx,j为xj的偏置,m为输入值xj的数量,sigmoid为s型激活函数。
33、进一步地,所述输出层的表达式为:
34、,
35、其中,y为输出层的输出,r1为第一隐藏层的输出,r2第二隐藏层的输出,r3第三隐藏层的输出,wr,1为r1的权重,wr,2为r2的权重,wr,3为r3的权重。
36、综上,本发明的有益效果为:本发明在活动现场以阵列布局方式放置多个声音信号采集设备,从而便于采集每个活动位置的声音信号,构成连续时间声音讯息矩阵,从连续时间声音讯息矩阵中提取声音特征,构建为音纹生物特征样本,通过分类模型分别评估出活动现场的人群空间域聚集度和时间域活跃度,通过空间维度上的聚集度表征出每个样本此时空间人群的多少,通过时间维度上的活跃度表征出每个样本此时人群的活跃程度,一方面能反映人数另一方面能反映人群对活动的感兴趣程度,能准确评估出现场人员对于活动的关注度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21240.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表