技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种基于黎曼流形的烟草成分相似性分析方法与流程  >  正文

一种基于黎曼流形的烟草成分相似性分析方法与流程

  • 国知局
  • 2024-07-12 10:35:33

本发明涉及烟草成分相似性分析,尤其涉及一种基于黎曼流形的烟草成分相似性分析方法。

背景技术:

1、烟叶化学成分是反映烟叶品质的物质基础,与外观质量、感官质量密切相关,是决定评吸质量和烟气特性等质量特性的内在因素。利用化学成分指标对烟叶质量进行合理的评价,不仅能真实反映烟叶品质,对卷烟企业合理开展生产布局,提升产品质量同样具有重要意义。以往研究者将烟叶内在化学组成作为评价烤烟品质的重要指标。烟叶化学成分种类多、结构复杂,受遗传因素、生态环境、栽培技术和调制陈化技术等条件影响,各种化学成分含量和相互间比例的变化存在较大差异。通过分析和比较不同产地样品化学成分之间的相似性,可以为卷烟加工过程中烟叶原料的选用提供参考。

2、目前,采用欧式距离的线性度量方法进行烟草成分相似性分析,这种分析方法并未反映出烟草内部各个化学成分之间的非线性本质关系。

3、因此,亟需一种基于黎曼流形的烟草成分相似性分析方法。

技术实现思路

1、本发明的目的是提供一种基于黎曼流形的烟草成分相似性分析方法,以解决上述现有技术中的问题,通过在黎曼空间计算测地距离能够更好地体现出烟草化学成分内在的非线性关系,这种相似性分析方法突破了传统欧式距离的线性化方法的局限。

2、本发明提供了一种基于黎曼流形的烟草成分相似性分析方法,其中,包括:

3、针对烟草化学成分数据样本集,构建对称正定稀疏化学成分关系连接网络集合,作为高维烟草化学成分数据的一组嵌入黎曼流形;

4、采用基于测地距离的两阶段层次核聚类方法,对所述对称正定稀疏化学成分关系连接网络集合进行聚类分析;

5、根据聚类分析结果,对烟草化学成分进行相似性判别。

6、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,所述针对烟草化学成分数据样本集,构建对称正定稀疏化学成分关系连接网络集合,作为高维烟草化学成分数据的一组嵌入黎曼流形,具体包括:

7、获取烟草化学成分数据,得到烟草化学成分数据样本集;

8、利用带惩罚项对数似然函数对烟草化学成分数据的逆协方差矩阵∑-1进行估计,以构建对称正定稀疏化学成分关系连接网络;

9、将多个所述对称正定稀疏化学成分关系连接网络组成对称正定稀疏烟草化学成分关系连接网络集合。

10、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,所述获取烟草化学成分数据,得到烟草化学成分数据样本集,具体包括:

11、获取样本个数为m的某类型烟草的化学成分数据x={x1,x2,…,xm},

12、其中,xi表示d维向量,对应第i个d维烟草成分样本数据,并且,xi服从多维高斯分布其中,μ表示多维高斯分布的均值向量,∑表示多维高斯分布的协方差矩阵。

13、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,所述利用带惩罚项对数似然函数对烟草化学成分数据的逆协方差矩阵∑-1进行估计,以构建对称正定稀疏化学成分关系连接网络,具体包括:

14、利用带惩罚项对数似然函数,通过以下公式对烟草化学成分数据的逆协方差矩阵∑-1进行优化估计,以构建对称正定稀疏化学成分关系连接网络:

15、

16、其中,表示烟草化学成分数据{x1,x2,…,xm}的样本协方差矩阵,det()表示矩阵行列式算子,tr()表示矩阵迹算子,|| ||1表示矩阵所有元素绝对值之和,λ>0为预设的稀疏正则化参数,表示逆协方差矩阵的估计值;

17、根据稀疏正则化参数λ调整稀疏程度,利用fused graphical lasso模型求解方法对公式(1)进行求解,得到以表示稀疏化学成分关系连接网络。

18、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,所述将多个所述对称正定稀疏化学成分关系连接网络组成对称正定稀疏烟草化学成分关系连接网络集合,具体包括:

19、针对n种类型烟草的化学成分数据样本集,每种类型均含有m个d维烟草数据样本,分别利用公式(1)构建n个对称正定稀疏化学成分关系连接网络组成对称正定稀疏烟草化学成分关系连接网络集合,

20、其中,sn表示第n种类型烟草的对称正定稀疏化学成分关系连接网络,由该类型烟草化学成分的稀疏逆协方差矩阵估计获得,表示d×d维对称正定矩阵空间。

21、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,在所述聚类分析过程中,采用仿射不变测地距离,通过以下公式衡量化学成分关系连接网络之间的相似度:

22、dl,m=dist(sl,sm)=tr{log2(sl)-(1/2)smsl-(1/2)}   (2)

23、其中,dl,m表示化学成分关系连接网络sl与化学成分关系连接网络sm之间的相似度。

24、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,所述采用基于测地距离的两阶段层次核聚类方法,对所述对称正定稀疏化学成分关系连接网络集合进行聚类分析,具体包括:

25、采用层次聚类算法分别对全部类型烟草的对称正定稀疏化学成分关系连接网络集合进行第一阶段的层次聚类,并根据第一阶段的聚类结果计算聚类到同一相似类别的烟草的对称正定稀疏化学成分关系连接网络对应的化学成分关系连接在黎曼空间上的平均值;

26、采用层次聚类算法,对聚类到同一相似类的烟草的对称正定稀疏化学成分关系连接网络对应的化学成分关系连接在黎曼空间上的平均值进行第二阶段的层次聚类,并根据第二阶段的聚类结果计算每个类别的平均化学成分关系连接网络强度。

27、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,在所述第一阶段的层次聚类中,根据贝叶斯信息准则确定最优的类别数量,

28、并且,在第一阶段层次聚类后,将全部类型烟草的对称正定稀疏化学成分关系连接网络聚类为c1个类别,并通过以下公式计算聚类到同一相似类别的烟草的对称正定稀疏化学成分关系连接网络对应的化学成分关系连接在黎曼空间上的平均值:

29、

30、其中,表示第c′类别的平均化学成分关系连接网络强度,反映了第c′类别中烟草化学成分关系连接网络共同的特征,sn表示第n品型烟草的化学成分关系连接网络强度,nc′表示聚类到第c′类别的化学成分关系连接网络的数量。

31、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,在所述第二阶段的层次聚类中,根据贝叶斯信息准则确定最优的类别数量,以将全部类型烟草的对称正定稀疏化学成分关系连接网络分别聚类到c2个类别中,并按照公式(4)计算每个类别的平均化学成分关系连接网络强度:

32、

33、其中,表示第c″类别的平均化学成分关系连接网络强度,反映了第c″类别中烟草化学成分关系连接网络共同的特征,nc″表示聚类到第c″类别的化学成分关系连接网络的数量。

34、如上所述的基于黎曼流形的烟草成分相似性分析方法,其中,优选的是,所述根据聚类分析结果,对烟草化学成分进行相似性判别,具体包括:

35、对于新的待识别烟草化学成分数据构建对应的稀疏化学成分关系连接网络

36、计算新的待识别烟草化学成分数据所对应的稀疏化学成分关系连接网络与两阶段层次核聚类之后每个类别的平均化学成分关系连接网络强度的距离,将新的待识别烟草化学成分数据划归到距离最短的类别。

37、本发明提供一种基于黎曼流形的烟草成分相似性分析方法,从非线性分析的角度出发进行烟草成分相似性分析,挖掘烟草化学成分相互之间的非线性关联关系,用黎曼空间内的距离来反映真实的相似性度量,能够更好地体现出烟草化学成分内在的非线性关系,这种相似性分析方法能避免欧式距离的线性度量方法没有反映出烟草内部各个化学成分之间的非线性本质关系。

本文地址:https://www.jishuxx.com/zhuanli/20240614/87903.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。