技术新讯 > 计算推算,计数设备的制造及其应用技术 > 鸡蛋孵化率预测模型构建、孵化率特征评估及预测方法  >  正文

鸡蛋孵化率预测模型构建、孵化率特征评估及预测方法

  • 国知局
  • 2025-01-10 13:15:08

本发明属于机器学习领域,具体涉及一种鸡蛋孵化率预测模型构建、孵化率特征评估及预测方法。

背景技术:

1、随着经济的发展,居民对饮食营养的需求不断提升。鸡蛋是居民饮食中蛋白质的重要来源,对于保障身体健康具有重要意义。蛋鸡种蛋的孵化对于鸡蛋的稳定供应至关重要,而无孵化能力的鸡蛋会占用孵化设备空间,造成能源和食物的浪费。因此,在孵化前准确预测出鸡蛋的孵化率,对孵化率低的鸡蛋进行重点监测,并将无孵化能力的鸡蛋剔除十分必要。

2、目前对鸡蛋孵化的研究主要有孵化率预测方法和基于孵化率影响因素的孵化流程管理方法。传统的孵化率预测方法为人工目视检测,使用照蛋器在黑暗条件下对胚蛋进行透视光照,观察胚胎的发育情况。根据鸡蛋胚胎血管网的分布和颜色来判断鸡蛋的孵化性能。该方法较为准确但需要大量专业技术人员,且费时费力。

3、机器学习方法在一定程度上提升了孵化率预测的效率,因此,大型孵化场逐渐使用机器学习技术来预测鸡蛋孵化率。例如通过超声波和机器视觉等技术获取鸡蛋孵化性能相关信息。等人在鸡蛋上打下小孔,使超声波能够进入鸡蛋内部,利用鸡蛋的超声影像对胚胎发育情况进行推断,进而预测鸡蛋孵化率(e,i h,gulhan t,etal.astudy regarding the fertility discrimination of eggs by using ultrasound[j].indian journal of animal research,2017,51(2):322-326.)。张伏等人发明的专利使用神经网络模型提取鸡蛋光学影像的纹理特征,检测鸡蛋的受精信息,实现了群体种蛋孵化性能的无损检测(张伏等.基于深度学习的群蛋图像分割受精信息检测装置和方法[p].河南省:cn114544630a,2022-05-27.)。

4、对于鸡蛋孵化流程的管理,前人主要从生物性因素(基因育种)、环境因素和孵化设备因素三方面出发进行探索。tona等人通过对照实验发现棕色品系种鸡所产蛋比白色品系孵化率更高(tona k,agbo k,kamers b,et al.comparison of lohmann white andlohmann brown strains in embryo physiology[j].international journal ofpoultry science,2010,9(9):907-910.)。tainika等人发现鸡蛋存储温度超过21℃对雏鸡胚胎发育有害,进而降低孵化率。因此鸡蛋在孵化前需要存储在相对凉爽的环境中(tainika b,abdallah n,damaziak k,et al.egg storage conditions andmanipulations during storage:effect on egg quality traits,embryonicdevelopment,hatchability and chick quality of broiler hatching eggs[j].world's poultry science journal,2024,80(1):75-107.)。徐青珍和李平发明了一种能自动消毒的鸡蛋孵化设备,提升了鸡蛋孵化率(徐青珍,李平.徐青珍和李平:cn108293915b[p].2018-02-24.)。

5、传统机器学习驱动的孵化率预测方法忽略了鸡蛋孵化率的不平衡分布,即大多数鸡蛋具有较高的孵化率,而不能孵化的鸡蛋只占很小一部分。在这种情况下,机器学习模型会偏向多数类样本(高孵化率鸡蛋),从而产生预测偏差。此外使用单一预测模型的孵化率预测方法容易产生过拟合问题,进而降低预测精确度。而且,机器学习方法虽然具有较高的预测准确率,但属于“黑箱”模型,可解释性较差,制约了其在孵化场生产管理中的实际应用。

6、同时,现有的鸡蛋孵化管理方法主要关注与基因育种相关的生物性因素,而对鸡蛋存储环境及孵化设备等对鸡蛋孵化率有重大影响的其他要素关注较少,不利于实现鸡蛋孵化的全周期精准管理。此外,通过基因改良和研发新型孵化设备等手段提升孵化率需要较大的资金投入,回报周期长,对专业人员技术水平要求较高。

技术实现思路

1、为了解决现有技术中存在的上述问题,本发明提供了一种鸡蛋孵化率预测模型构建、孵化率特征评估及预测方法。本发明要解决的技术问题通过以下技术方案实现:

2、第一方面,本发明实施例提供了一种鸡蛋孵化率预测模型构建方法,所述鸡蛋孵化率预测模型构建方法包括:

3、针对多个鸡蛋批次,分别获取对应的特征数据组和孵化率;其中,每个鸡蛋批次含有若干个鸡蛋;每个鸡蛋批次的特征数据组含有生物特征、环境特征、孵化设备特征对应的多个特征数据;

4、将每个鸡蛋批次的特征数据组分别进行数据预处理,得到对应鸡蛋批次的数据样本,合并所有数据样本得到原始样本集;

5、对所述原始样本集中孵化率低于孵化率阈值的数据样本进行增广处理,得到增广后样本集;

6、搭建原始预测模型,所述原始预测模型包括顺次连接的第一层学习器和第二层学习器;所述第一层学习器包括并列的多个基学习器,均用于预测鸡蛋孵化率,所述第二层学习器连接所述多个基学习器的输出端,且采用线性回归模型;

7、基于所述增广后样本集以及其中各数据样本的孵化率,对所述原始预测模型进行训练,得到训练完成的鸡蛋孵化率预测模型。

8、在本发明的一个实施例中,任一鸡蛋批次的特征数据组中,

9、生物特征对应的特征数据包括:种鸡育种等级、种鸡品系、种鸡来源养殖场、种鸡平均年龄、鸡蛋平均重量和鸡蛋重量均匀度;

10、环境特征对应的特征数据包括:孵化月份、存储天数、转换天数和重量损失;

11、孵化设备特征对应的特征数据包括:鸡蛋数量、孵化器编号和出雏器编号。

12、在本发明的一个实施例中,针对任一特征数据组,所述数据预处理的过程,包括:

13、对该特征数据组中的连续型特征数据进行归一化处理;其中,所述连续型特征数据包括种鸡平均年龄、鸡蛋平均重量、鸡蛋重量均匀度、存储天数、转换天数、重量损失和鸡蛋数量;

14、对该特征数据组中的循环型特征数据进行离散至连续的转换处理;其中,所述循环型特征数据包括孵化月份;

15、将该特征数据组中的分类型特征数据转化为独热编码;其中,所述分类型特征数据包括种鸡育种等级、种鸡品系、种鸡来源养殖场、孵化器编号和出雏器编号。

16、在本发明的一个实施例中,对所述原始样本集中孵化率低于孵化率阈值的数据样本进行增广处理,得到增广后样本集,包括:

17、对所述原始样本集中孵化率低于孵化率阈值的数据样本,利用条件生成对抗网络生成相似数据样本,将得到的所有相似数据样本加入所述原始样本集中得到增广后样本集。

18、在本发明的一个实施例中,所述第一层学习器包括并列的三个基学习器,分别为随机森林模型、轻量级梯度提升树模型和支持向量机模型。

19、在本发明的一个实施例中,基于所述增广后样本集以及其中各数据样本的孵化率,对所述原始预测模型进行训练,得到训练完成的鸡蛋孵化率预测模型,包括:

20、利用所述增广后样本集以及其中各数据样本的孵化率,以多折交叉验证的方式,对所述第一层学习器中的各基学习器进行分别训练,得到训练完成的各基学习器;

21、将训练完成的各基学习器针对数据样本的孵化率预测值的多折均值作为输入数据,并利用数据样本的孵化率,对所述第二层学习器进行训练,由训练完成的第二层学习器和训练完成的第一层学习器构成鸡蛋孵化率预测模型。

22、第二方面,本发明实施例提供了一种鸡蛋孵化率特征评估方法,所述鸡蛋孵化率特征评估方法包括:

23、获取鸡蛋孵化率预测模型以及所述鸡蛋孵化率预测模型训练过程中所使用的各鸡蛋批次的数据样本;其中,所述鸡蛋孵化率预测模型是利用第一方面所述的鸡蛋孵化率预测模型构建方法得到的;

24、针对每个鸡蛋批次,使用shap方法计算该鸡蛋批次的特征数据组中,各特征数据对孵化率的边际贡献值,从而进行该鸡蛋批次内特征数据的影响分析;其中,边际贡献值表示特征数据对该鸡蛋批次的孵化率的影响,分为正影响和负影响;

25、针对每一类特征数据,计算该类特征数据在所有鸡蛋批次中的平均边际贡献值,利用各类特征数据计算出的平均边际贡献值,进行所有鸡蛋批次内特征数据的影响分析。

26、在本发明的一个实施例中,所述利用各类特征数据计算出的平均边际贡献值,进行所有鸡蛋批次内特征数据的影响分析,包括:

27、根据各类特征数据的平均边际贡献值绘制散点图,并分析各类特征数据对所有鸡蛋批次的孵化率的影响重要性及影响方向。

28、第三方面,本发明实施例提供了一种鸡蛋孵化率预测方法,所述鸡蛋孵化率预测方法包括:

29、获取目标鸡蛋批次的特征数据组;其中,所述特征数据组含有生物特征、环境特征、孵化设备特征对应的多个特征数据;

30、将所述目标鸡蛋批次的特征数据组进行数据预处理后,输入预先训练完成的鸡蛋孵化率预测模型,得到所述目标鸡蛋批次的预测孵化率;其中,所述鸡蛋孵化率预测模型是根据第一方面所述的鸡蛋孵化率预测模型构建方法得到的。

31、在本发明的一个实施例中,得到所述目标鸡蛋批次的预测孵化率之后,所述鸡蛋孵化率预测方法还包括:

32、针对所述目标鸡蛋批次,使用shap方法计算其特征数据组中,各特征数据对孵化率的边际贡献值,从而进行所述目标鸡蛋批次内特征数据的影响分析;其中,边际贡献值表示特征数据对所述目标鸡蛋批次的孵化率的影响,分为正影响和负影响。

33、本发明的有益效果:

34、针对鸡蛋孵化率预测问题,传统机器学习算法模型往往只关注到生物特征(鸡蛋本身的属性),预测结果会偏向多数类样本且容易产生过拟合问题,进而造成预测偏差。而依据本发明提供的鸡蛋孵化率预测模型构建方法所得到的鸡蛋孵化率预测模型,综合考虑了生物特征、环境特征和孵化设备特征,采集这些影响鸡蛋孵化的多阶段特征作为输入数据,使本方法能更全面的提取影响鸡蛋孵化能力的特征分布,从而能够显著提高预测的准确性。本发明的模型可以通过鸡蛋的生物特征、环境特征以及孵化设备特征这些影响孵化率的关键因素,使用特征增强的分层监督预测方法估算出整批鸡蛋的孵化率,可以防止预测结果偏向多数类,并缓解单一预测模型带来的过拟合问题。

35、本发明实施例所提供的鸡蛋孵化率特征评估方法中,利用提供的鸡蛋孵化率预测模型及鸡蛋孵化率预测模型训练过程中所使用的各鸡蛋批次的数据样本,使用可解释的机器学习方法对预测结果进行分析,可确定影响孵化率的关键特征,从而打破传统机器学习方法的“黑箱”属性,实现孵化全周期的精准管理以提高孵化率,为孵化场经营管理提供决策支持方法,可以更好的指导孵化场的日常经营,降低生产成本和减少资源浪费。

36、本发明实施例所提供的鸡蛋孵化率预测方法,采用的算法框架新颖,准确性高,可解释性强,能够有效解决传统机器学习在样本不平衡时的预测偏差以及单个模型容易出现的过拟合问题,能够实现鸡蛋批次孵化率的准确预测,并能对孵化率的预测结果进行可解释性分析以支持孵化全周期精准管理。本发明针对现代化商业孵化场的情境运用人工智能算法解决了鸡蛋孵化率预测与孵化流程管理等问题,具有较高的实用价值。

本文地址:https://www.jishuxx.com/zhuanli/20250110/351907.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。