一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于卷积神经网络的拉曼光谱智能分类方法

2022-06-01 10:32:05 来源:中国专利 TAG:


1.本发明涉及拉曼光谱技术领域,特别涉及一种基于卷积神经网络的拉曼光谱智能分类方法。


背景技术:

2.目前,国内外对食源性致病菌的检测方法有免疫学检测技术,分子生物学技术以及pcr技术等方法,免疫学方法存在灵敏度较低、分子生物学技术需要大量数据支撑且适应性不强、pcr技术价格昂贵且稳定性和精密性略低,而食品卫生需要对食源性致病菌的检测需要保证检测的特异性,灵敏度以及高效性。拉曼光谱是一种新型分子检测方法,基于光和材料内化学键的相互作用进行鉴别,分析得到分子振动及转动方面的信息,进而得到物质的组成成分,并能够对物质成分进行判定,具有快速、无损、抗干扰性强等特点。
3.目前拉曼光谱分析中大部分利用传统的机器学习算法,深度学习通过训练大量数据,在拉曼光谱数据的多分类问题中具有更优秀的泛化能力。卷积神经网络(cnn)是一种具有深度监督学习特性的多层神经网络,能自动提取低、中和高层特征。卷积神经网络进行特征提取实现了特征提取的封装,能够更好解决拉曼光谱数据特征提取困难的问题。


技术实现要素:

4.针对三种拉曼峰相似的食源性致病菌——大肠杆菌、粘质沙雷氏菌和枯草杆菌,本发明提供一种基于卷积神经网络的拉曼光谱智能分类方法,来进行对食源性致病菌分类检测的高效性和精确性。
5.为了达到上述发明目的,解决其技术问题所采用的技术方案如下:
6.一种基于卷积神经网络的拉曼光谱智能分类方法,包括以下步骤:
7.步骤s1,利用硅片对labram hr evolution拉曼光谱仪进行校正,测量的拉曼光谱偏移值范围为0~1800,光源设定为632mm的氦氖激光,强度设置为14mw,积分时间为4s,在拉曼偏移范围内得到800个特征数,总计3*30=90个拉曼光谱数据;
8.步骤s2,对收集到的拉曼光谱实验数据进行三种不同的预处理;
9.步骤s3,构建深度学习模型,即基于卷积神经网络的分类模型,用于不同预处理方式的拉曼光谱数据进行分类;
10.步骤s4,数据分类:模型构建完成后,将三份拉曼光谱数据各自都按5:1的比例随机分为训练集和测试集,放入卷积网络中进行训练,待训练完成后进行数据分析;
11.步骤s5,数据分析:进行对比实验,分析数据预处理方式的优劣,判断预处理是否可以提高模型准确率,是否可以保留更多有效特征,以及对比分析卷积神经网络模型与传统机器学习算法的优劣。
12.进一步的,步骤s2,对收集到的拉曼光谱实验数据进行三种不同的预处理方式:
13.步骤s21:将拉曼光谱数据直接进行数据增强,样本扩充,通常有旋转、移位、平移、缩放操作;通过向拉曼光谱数据中从左至右随机添加适量高斯噪声,将总样本数据扩充到
1000条样本,以便后续投入神经网络中进行训练;
14.步骤s22:对光谱进行预处理:包括去噪,归一化,s-g平滑,并进行pca和lda不同降维方式提取特征,再通过数据增强的方式扩充样本;
15.步骤s23:将拉曼光谱数据先进行预处理,再对预处理后的拉曼光谱数据进行数据增强,得到预处理后的增强数据,并将数据投入神经网络中进行训练。
16.优选的,步骤s22中将数据通过数据归一化,即将差异度较大的数据进行同倍数缩放,使数据处于一个设置的小的特定区间0-1内,通过归一化来消除数据指标之间的量纲影响。
17.优选的,步骤s22中采用s-g滤波算法来对光谱进行降噪,消除一定的噪音与毛刺。
18.优选的,步骤s22中通过pca和lda降维方法进行特征提取,选取恰当的主成分个数来代表所有样本数据,实现剔除冗余信息和保留有效信息的目标,最终将得到的拉曼光谱数据投入神经网络中进行训练与步骤s2中的步骤s21做对比分析。
19.进一步的,步骤s3,构建深度学习模型——基于卷积神经网络的分类模型,由卷积层、批标准化处理层、池化层和全连接层组成,实验预计采用一个卷积层,一个批标准化处理层,一个池化层,两个全连接层组成分类模型,激活函数使用relu激活函数,学习率设置为0.002,在反向传播更新参数的过程中,采用adam优化器进行实验,全连接层将使用dropout函数来加快模型的收敛。
20.本发明由于采用以上技术方案,使之与现有技术相比,具有以下的优点和积极效果:
21.本发明一种基于卷积神经网络的拉曼光谱智能分类方法,针对三种拉曼峰相似的食源性致病菌的拉曼光谱数据进行处理实现食源性致病菌的分类。方法主要包括以下几个步骤:1.利用硅片对labram hr evolution拉曼光谱仪进行校正,进行拉曼实验;2.对收集到的拉曼光谱数据进行两种预处理方式进行实验对比:s1预处理:包括去噪,归一化,s-g平滑等,并进行pca和lda降维提取特征,再通过数据增强的方式扩充样本;s2预处理:将拉曼光谱数据直接进行数据增强,实现样本扩充;3.构建卷积神经网络模型用于拉曼光谱数据分类,进行对比实验。通过上述方式,解决了深度学习模型对数据量的依赖,成功实现了食源性致病菌的高效精准分类,为拉曼光谱技术结合深度学习提供一种新思路。
附图说明
22.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图中:
23.图1是本发明中三种食源性致病菌的拉曼光谱图;
24.图2是本发明中卷积网络模型训练流程图。
具体实施方式
25.下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术
人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
26.目前深度学习模型以其强大的表征能力在人工智能的各个领域越来越受到重视,具有强大的判断以及学习能力。卷积神经网络是深度学习中的一个重要分支,作为一种端到端的模型,可以采取较少的数据预处理甚至不进行数据预处理,直接对光谱信号进行采集、训练、验证、测试。
27.如图1-2所示,本实施例公开了一种基于卷积神经网络的拉曼光谱智能分类方法,包括以下步骤:
28.步骤s1,利用硅片对labram hr evolution拉曼光谱仪进行校正,测量的拉曼光谱偏移值范围为0~1800,光源设定为632mm的氦氖激光,强度设置为14mw,积分时间为4s,在拉曼偏移范围内得到800个特征数,总计3*30=90个拉曼光谱数据;
29.步骤s2,对收集到的拉曼光谱实验数据进行三种不同的预处理;
30.拉曼光谱的信号强度比较弱,重叠严重,同时受环境、探测器等因素的影响,使得测得的拉曼光谱常伴随较严重的噪声,例如仪器噪声、荧光噪声等。同时,拉曼光谱还会伴有基线漂移等问题。为了准确地分析光谱数据,一般会对拉曼光谱进行降噪基线校正,波长选择处理。
31.具体的,对收集到的拉曼光谱实验数据进行三种不同的预处理方式,增加不同预处理方式,扩充样本量通过基于深度学习来进行模型构建、训练:
32.步骤s21:将拉曼光谱数据直接进行数据增强,样本扩充,通常有旋转、移位、平移、缩放等操作;通过向拉曼光谱数据中从左至右随机添加适量高斯噪声(适量的高斯噪声可以增强神经网络的学习能力),将总样本数据扩充到1000条样本,以便后续投入神经网络中进行训练;
33.步骤s22:对光谱进行预处理:包括去噪,归一化,s-g平滑等,并进行pca和lda等不同降维方式提取特征,再通过数据增强的方式扩充样本;
34.(1)步骤s22中将数据通过数据归一化,即将差异度较大的数据进行同倍数缩放,使数据处于一个设置的小的特定区间0-1内,通过归一化来消除数据指标之间的量纲影响。
35.(2)步骤s22中采用s-g滤波算法来对光谱进行降噪,消除一定的噪音与毛刺。
36.(3)步骤s22中通过pca和lda等降维方法进行特征提取,选取恰当的主成分个数来代表所有样本数据,实现剔除冗余信息和保留有效信息的目标,最终将得到的拉曼光谱数据投入神经网络中进行训练与步骤s2中的步骤s21做对比分析。
37.经过数据增强后,可以通过设置结构相似度(structural similarity index,ssim指标来判断计算原始光谱和生成光谱之间ssim值,若ssim值大于等于0.9才采用该生成光谱,若小于0.9则不符合标准进行舍弃。
38.步骤s23:将拉曼光谱数据先进行预处理,再对预处理后的拉曼光谱数据进行数据增强,得到预处理后的增强数据,并将数据投入神经网络中进行训练。
39.步骤s3,构建深度学习模型,即基于卷积神经网络的分类模型,用于不同预处理方式的拉曼光谱数据进行分类;
40.具体的,构建深度学习模型——基于卷积神经网络的分类模型,由卷积层、批标准化处理层、池化层和全连接层组成,先正向传播得到输入数据特征,然后反向传播使用梯度下降进行迭代,完成权值更新。卷积层通过卷积运算提取输入数据特征,池化层对卷积层提
取得到的特征进行进一步降维,加快运算速率。
41.本实验模型采用一个卷积层,一个批标准化处理层,一个池化层,两个全连接层组成分类模型,每条拉曼光谱样本数据在训练前被整理成一维的特征向量,输入到网络的第一层,激活函数使用relu激活函数,学习率设置为0.002,在反向传播更新参数的过程中,采用adam优化器进行实验,全连接层将使用dropout函数来加快模型的收敛。
42.步骤s4,数据分类:模型构建完成后,将三份拉曼光谱数据各自都按5:1的比例随机分为训练集和测试集,放入卷积网络中进行训练,待训练完成后进行数据分析;
43.步骤s5,数据分析:进行对比实验,分析数据预处理方式的优劣,判断预处理是否可以提高模型准确率,是否可以保留更多有效特征,以及对比分析卷积神经网络模型与传统机器学习算法的优劣。
44.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献