基于深度学习的笼养肉鸡全生命周期异常发声检测方法
- 国知局
- 2024-06-21 11:49:46
本发明涉及音频处理技术、图像处理技术、深度学习技术以及网络通讯技术,具体地讲是一种基于深度学习的笼养肉鸡全生命周期异常发声检测方法。
背景技术:
1、畜牧业是我国农业农村经济发展的支柱产业,家禽养殖作为畜牧生产的重要组成,对国计民生具有关键影响。规模化肉鸡场高密度的养殖模式下,呼吸系统疾病的发现与防治意义重大,而咳嗽作为鸡只患病时的明显症状,针对其进行快速识别和监测能够为养殖人员及早提供预警信息,辅助采取干预措施,有效改善生产效益。
2、目前,肉鸡呼吸系统疾病的诊断主要依靠有经验的饲养员在夜间进行巡查侦听,该方式易受主观因素影响,引起鸡群不利应激,且劳动力成本高、工作任务量大,误差范围难以衡量,逐渐不能满足行业需要。声音信号识别作为一项新兴的无接触式检测技术,具有响应快、实时性高等优点,在畜禽养殖领域得到了成功实践。
3、南京农业大学曾向国家知识产权局提出了申请号为2018109324413的发明专利。该申请公开了一种基于音频技术的肉鸡咳嗽监测方法,位于采音室的拾音器将实时采集其发声信息,并通过数据线传输至音频存储单元保存;pc上位机定时读取存储单元里的音频数据,并对读取的音频数据进行预处理;通过人工选取音频中鸡只咳嗽状态的时间段,对时间段内的肉鸡咳嗽声数据进行特征提取,采用svm分类器训练决策模型;肉鸡声音在经过模型分类后若识别为咳嗽且达到程序设定的预警值时,pc端将发出肉鸡异常警告。该发明通过对肉鸡的咳嗽声音进行分析实现肉鸡呼吸道疾病自动识别报警,为肉鸡呼吸系统疾病的早期发现及处理提供了自动化判断方法。但是,该方案由于数据采集环境与实际养殖环境存在差异,采集的数据对实际情况的反映具有一定的局限性,且该方案未对鸡只日龄进行区分,使得模型对于不同日龄鸡只的咳嗽声识别准确率不一。为了提高方案的性能和实用性,需要针对这些不足进行改进和完善。
技术实现思路
1、本发明从现代化鸡只养殖关键技术出发,围绕生产数据采集难、准确性低、可靠性差,预警信息上报迟滞延后以及精准化管理程度弱等行业薄弱环节,以叠层笼养鸡只为受益主体,数据挖掘为核心,信息分析管控为推手,基于发声特征和深度学习实现鸡只全生命周期咳嗽声识别与预警系统的设计与开发,助力领域内养殖模式向自动化、标准化、规模化的方向发展,为鸡只呼吸系统疾病的早期诊断提供技术支持。
2、技术方案:
3、一种基于深度学习的笼养肉鸡全生命周期异常发声检测方法,它包括以下步骤:
4、s1、音频数据采集,基于拾音器实现鸡只发声音频数据获取;
5、s2、音频数据预处理,获得输入音频;
6、s3、鸡只声音特征参数提取;
7、s4、基于鸡只异常发声识别模型,识别鸡只异常发声。
8、优选的,s2中,音频数据预处理包括:
9、使用6阶巴特沃兹带通数字滤波器滤除低频噪声,设置截至频率为1 800hz和3500hz;
10、通过谱减法实现高频噪声信号频率点的抑制,获取较为纯净的发声信号;
11、使用频带能量与谱熵的比值作为参数实现端点监测,抑制噪声的突发性干扰。
12、优选的,s3中,鸡只声音特征参数提取包括以下步骤:
13、s3-1、参数初始化;
14、s3-2、判断输入音频是否符合要求,是则进入s3-3;否则结束;
15、要求:采样精度为16bit、采样频率为48khz,每段音频数据时长为1h,文件格式为wav,命名格式为“年-月-日-时-分-秒”。
16、s3-3、提取输入音频的时域特征;
17、s3-4、对时域特征进行分帧、预加重、加窗操作;
18、s3-5、帧信号快速傅里叶变换,将信号转换至频域进行特征提取;使用2048点离散傅里叶变换实现帧信号的时频转换,公式如下:
19、
20、其中,x(k)表示频域信号;x(n)表示时域信号;n表示信号长度;
21、s3-6、mel三角滤波;将声音信号转换至频域后,使信号通过mel三角滤波器组实现滤波,关系式如下:
22、
23、其中,fmel为感知频率,单位为mel;f为实际频率,单位为hz;
24、s3-7、对数变换;
25、s3-8、离散余弦变换;使用dct将信号能量聚集在前面的系数中,保留较少的系数即可表示信号的大部分信息,实现对声音特征的降维,关系函数为下:
26、
27、其中,c(n)表示余弦变换系数;f(x)表示时域信号;n表示信号长度;
28、s3-9、动态差分计算,合并静态特征以及一阶、二阶差分构成的动态特征,对3个参数做零-均值标准化处理,得到的三维数组供模型后续调用;
29、差分特征公式如下:
30、
31、其中,dt表示差分信号;ct表示时间t的信号值。
32、优选的,s3-8中,保留的系数为13个。
33、优选的,s4中,鸡只异常发声识别模型基于pytorch深度学习开发库搭建。
34、优选的,s4中,鸡只异常发声识别模型的训练集与验证集数据参照s1-s3方法获得。
35、优选的,s4中,鸡只异常发声识别模型的构建包括以下步骤:
36、s4-1、统一模型输入:输入音频长度保持45帧,控制模型的输入尺寸为40*64*3;
37、s4-2、超参数初始化:随机生成初始权值打乱神经网络对称性,每一轮训练过程epoch中使用shuffle函数随机样本排序;单次训练使用数据样本64个,全部数据遍历完成记为一次epoch结束;epoch初始值设置100,学习率设置0.001,动量设置0.9,学习衰减率设置0.98;优化器选用随机梯度下降,公式如下:
38、
39、其中,θj表示j次迭代时的参数值;η表示学习率;表示参数为θj时损失函数f的梯度;
40、损失函数选用交叉熵损失,公式如下:
41、
42、其中,p表示样本真实概率分布;q表示模型预测的概率分布;p(x)表示真实概率分布p在x上的概率值;logq(x)表示模型预测的概率分布q在x上的对数概率值;
43、s4-3、模型训练:通过损失计算在单次迭代后自调整参数设置,以50个epoch为间隔进行一次学习率降低;全部轮次结束后根据训练集与验证集的结果分析,损失与精确率误差满足要求,正常结束训练;
44、s4-4、模型评价:模型训练结果通过混淆矩阵形式输出,其中行表示真实分类,列表示模型预测分类,以tp代表正类模型预测正确样本数量,fp代表正类模型预测错误样本数量,tn代表反类模型预测正确样本数量,fn代表反类模型预测错误样本数量;基于混淆矩阵对各类标签识别结果的个数统计,计算得出以下指标综合衡量各模型优劣程度,分别为准确率accuracy、精确率precision、召回率recall以及f1-score,计算公式如下:
45、准确率代表模型预测正确的样本数量在总样本数量中的占比:
46、
47、精确率代表模型预测为正类的样本中,结果为正确的样本数量占比:
48、
49、召回率代表真实为正类的样本中,模型预测正确的数量占比:
50、
51、f1-score代表精确率和召回率的调和平均,取值由0~1代表模型效果由好至差:
52、
53、优选的,方法还包括s5、检测结果可视化展示。
54、优选的,通过搭建鸡只异常发声识别预警系统软件平台,实现检测结果可视化展示;
55、鸡只异常发声识别预警系统软件平台架构包括:
56、数据采集:包括鸡舍的音频录音数据,和鸡舍环境数据;
57、数据存储与预处理:采集数据经过预处理后进行存储;
58、数据可视化:预处理后的数据经过鸡只异常发声识别模型进行鸡只异常发声识别;识别结果和鸡舍环境数据通过web服务器发布。
59、本发明的有益效果
60、(1)鸡舍音频数据采集系统搭建及预处理办法。在实际生产环境下的鸡舍中利用网络拾音器搭建了一套可实现自动化鸡只发声音频录制的硬件采集系统。针对群体鸡只发声杂乱、设施运行噪声干扰大等问题,提出了设置有效采集时间为0点至3点的采集方式,并对鸡舍音频进行了时、频域等条件下的分析,利用数字滤波、基于多窗谱的谱减法实现了鸡只发声与背景噪声的分离。
61、(2)鸡只发声信号的特征提取研究。探究了当下应用较为广泛的两种声音特征—fbank、mfcc的提取流程及各项参数的详细设置。对音频信号的分帧、加窗操作设置预加重系数为0.97,选用汉明窗并设置采样频率为48khz,帧长为25ms,帧移为10ms,并对完成分帧的信号进行2048点短时傅里叶变换,实现时频转换。特征提取过程中设置fbank滤波器组个数为64个,mfcc的mel刻度滤波器组个数为128个。对所提取的两项静态特征进行动态计算,各自与其一阶、二阶差分组合,通过零-均值标准化处理形成3维数组作为后续神经网络的输入。
62、(3)基于深度神经网络的咳嗽声识别模型研究。通过vgg16和resnet18两种深度神经网络算法完成了三分类模型训练,依据准确率、查准率、召回率和f1值等评价指标对比了不同特征提取算法和神经网络组合在各日龄段下的识别性能表现,实现全生命周期下笼养肉鸡异常发声的检测识别。
63、(4)鸡只异常发声识别预警系统软件平台搭建。基于模型对鸡只全生命周期咳嗽发声的准确识别,利用springboot、vue、ngnix、中间件、mysql数据库等技术在云端服务器搭建一套可提供鸡舍基础信息展示、咳嗽声实时监测与预警、管理员信息及权限管理等功能的软件系统平台。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23818.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表