基于kmeans聚类和随机森林模型对古代玻璃样品分类方法
- 国知局
- 2024-10-09 14:34:35
本发明涉及数据挖掘领域。
背景技术:
1、古代玻璃极易受埋藏环境的影响而风化。在风化过程中,内部元素与环境元素进行大量交换,导致其成分比例发生变化,从而影响对其类别的正确判断。
2、随机森林是一种比较新的机器学习模型(非线性基于树的模型)集成学习方法。通过反复二分数据进行分类或回归,计算量大大降低。把分类树组合成随机森林,即在变量的使用和数据的使用上进行随机化,生成很多分类树,再汇总分类树结果。随机森林在运算量没有显著提高前提下提高了预测精度,随机森林对多元共线性不敏感,结果对缺失数据和非平衡数据比较稳健,可以很好地预测多达几千个解释变量的作用,被誉为当前最好算法之一。
3、本发明将随机森林模型改进并应用在古代玻璃分类上,通过已有的玻璃各化学成分含量,结合k-means聚类分析,训练出精确度更高的模型。
技术实现思路
1、本发明提供了一种基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,以提高研究分析时分类古代玻璃效率。
2、再根据本公开的实施例中,所述的基于kmeans聚类和随机森林模型对古代玻璃样品分类方法包括,定性分析样本各化学成分含量均值,定量分析随机森林特征重要性构成其分类规律。先以各化学成分的归一化作为特征,随机选取一部分数据位训练集进行随机森林训练,再嵌套k-means聚类分析模型,进行二次聚类
3、对于预测风化前化学成分的含量,首先进行卡方检验并绘制了交叉图,从数值和概况方面对表面风化的因素进行分析,得到玻璃类型、纹饰和颜色与风化均相关,并进行了详细的阐释。在预测模型方面,我们建立了变化率模型,并结合bp神经网络模型进行修正,很好的预测了风化前的化学成分含量。
4、对于重要指标进行k-means聚类,高钾玻璃主要分为ⅰ类玻璃的亚分类应用随机森林模型应用随机森林模型,通过训练和测试,模型的预测正确率达到100%。在亚类划分方面,我们忽略了一些化学成分非常少的指标,(sio2)和ⅱ类(cao),铅钡玻璃主要分为ⅰ类(cao)、ⅱ类(sio2)和ⅲ类(cuo),对于合理性,我们分别从数值和古代玻璃应用两方面进行阐释,对于敏感性,我们对每一个亚类的主要成分进行了10%的扰动,得出模型敏感性良好。
5、应用模型进行数据分类测试,针对模型鲁棒性不好的原因应用随机森林模型进行修正,构建了k-means+随机森林模型,该模型在继承k-means良好敏感性的基础之上,又增强了模型的鲁棒性,对表单三中的数据进行分类,其中3个高钾玻璃,5个铅钡玻璃,并结合问题二进行了亚分类。
6、比较不同类别玻璃文物化学成分关联关系,我们对数据进行了灰色关联分析,并绘制了热力图,发现每个类别中某些化学成分之间有很紧密的联系,例如在铅钡无风化类别中,sio2和mgo、cuo、na2o之间的灰度关联系数达到了0.8以上,同时,每种类别之间又有一些明显的差异,并进行了具体分析,此外,通过本题的分析,也为问题一中bp神经网络的应用提供了理论方面的支撑。
7、基于上述,本公开实例可以提高古代玻璃分类的准确性和效率。
技术特征:1.基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,其特征在于,所述分类方法包括:
2.根据权利要求1所述的基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,其特征在于,所述特征值比较步骤包括:统计全数据各成分含量均值,画柱状图做对比。
3.根据权利要求1所述的基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,其特征在于,所述随机森林模型建立步骤包括:对各化学成分进行归一化,主成分分析,用随机森林模型进行训练得出预测模型。
4.根据权利要求1所述的基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,其特征在于,所述亚分类步骤包括:对各化学成分进行归一化,主成分分析,做k-means聚类分析,确定聚类k值,得到聚类轮廓系数,探索最优k值,即为所分类数。
5.根据权利要求1所述的基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,其特征在于,所述亚分类合理性分析步骤包括:k-means聚类时欧氏距离越大,差异越明显,分类越合理;考虑古代玻璃分类文献,对照发现分类确实合理。
技术总结本发明提供了一种基于kmeans聚类和随机森林模型对古代玻璃样品分类方法,属于数据挖掘领域,所述分类方法包括特征数据比较步骤,随机森林模型建立过程,亚分类步骤,亚分类合理性分析步骤,亚分类敏感性分析步骤。技术研发人员:王睿,韩治国受保护的技术使用者:西北工业大学技术研发日:技术公布日:2024/9/29本文地址:https://www.jishuxx.com/zhuanli/20241009/305708.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。