一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多终端数据训练神经网络模型的方法和系统及介质与流程

2022-07-13 20:40:55 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种基于多终端数据训练神经网络模型的方法和系统及介质。


背景技术:

2.随着人工智能深度学习图像识别技术的飞速发展,将深度学习技术应用于脑电图识别的时机将变得成熟。癫痫患者发作时脑电图会表现出各种癫痫波形状,医生需要对这些癫痫波识别出来用作确诊判断,而一份长程脑电图会有几个到十几个小时之长,要医生把整份脑电图看完再找出癫痫发作的时间段将非常消耗人力资源。按照以往一般医院的做法是让患者陪同家属在患者癫痫发作的时候开始人工记录发作时间,或者在患者床头放置一个按钮让患者觉得要发作前自己点按记录时间。这些方案都有明显的问题,癫痫发作往往发生在睡眠期间,患者或患者陪同家属很容易会错过时间的记录。而目前也有通过机器学习进行计算机定位判断的技术发明,但是支持向量机等传统机器学习对脑电图判断的准确度不够高。一般的脑电图深度学习模型最后是通过全连接层输出判断,导致模型没办法对多频率的脑电图进行判断,而现实情况是每家医院采购的脑电机型号不一样,采集的精度不一样,导致采集的频率也各种各样。
3.如今世界上有通过贝叶斯决策树模型的癫痫诊断方法,也有通过快速傅里叶变换、小波变换后再结合多视角tsk型模糊系统进行癫痫判断的方法,甚至最近几年出现的有各种网络参数层次设计的带有全连接层的深度学习神经网络模型来进行脑电图癫痫波判断。
4.在如今大数据和现代gpu算力的加持下,具有更庞大参数量和更深层次的深度学习神经网络模型的准确性已经超过其它传统的机器学习方法,比如支持向量机、贝叶斯决策树等。而快速傅里叶变换、小波变换等其实是通过人工设计的固定函数来凸显某些重点特征值,但是同时也会削弱其它特征,而这些人工设计的固定函数变换其实对于通过大数据训练出来的深度学习模型来说意义并不大,因为深度学习模型通过大数据训练后本身就是自动抽取出事物的特征维度,这些特征维度比人类设计的特征会更能表示该事物的特点,这也是机器学习的特性。而最近几年涌现出来的用于脑电图癫痫波判断的深度学习神经网络模型,其泛化能力不足,训练集通常只是某个固定的数据源,导致不能对不同医院的各种品牌型号脑电机采集到的不同频率的脑电图都有很好的准确度,其需要训练一种神经网络模型来适应不同数据来源。


技术实现要素:

5.本发明的目的在于克服现有技术的不足,本发明提供了一种基于多终端数据训练神经网络模型的方法和系统及介质,提高了ai模型对不同来源不同频率的脑电图癫痫发作波形识别的泛化识别能力,使得神经网络模型可以对各种品牌型号脑电机采集到的不同频率的脑电图进行癫痫发作波形诊断都有很好的准确度。
6.为了解决上述问题,本发明提出了一种基于多终端数据训练神经网络模型的方法,所述方法包括:
7.获取不同终端所采集的脑电图数据,并基于脑电图数据提取癫痫波数据;
8.基于滑动窗口对癫痫波数据进行数据切片提取含有癫痫波的脑电图样本数据;
9.将含有癫痫波的脑电图样本数据基于混合多尺度卷积核残差网络进行泛化训练形成初步神经网络模型;
10.从初步神经网络模型所训练的整体数据中提取伪差数据;
11.将提取的伪差数据和基于脑电图数据提取的癫痫波数据进行数据整合,得到癫痫波整合数据;
12.基于滑动窗口对癫痫波整合数据进行数据切片提取含有整合后的脑电图样本数据;
13.将整合后的脑电图样本数据重新基于混合多尺度卷积核残差网络进行泛化训练形成最终神经网络模型。
14.所述获取不同终端所采集的脑电图数据之后还包括:
15.将所采集的脑电图数据进行滤波处理。
16.所述将所采集的脑电图数据进行滤波处理包括:
17.将所采集的脑电图数据进行50赫兹的滤波去除环境噪音;
18.进行30赫兹的低通滤波消除高频噪声;
19.进行0.1赫兹的高通滤波消除电压偏移。
20.所述基于混合多尺度卷积核残差网络进行泛化训练包括:
21.获取具有癫痫波的脑电图样本数据集合;
22.将脑电图样本数据集合按照不同脑电图采集频率分批输入混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合抽取特征向量;
23.对拟合后的特征向量进行批归一化处理;
24.对批归一化处理后的特征向量通过1x1卷积配套全局平均池化处理,获得指定输出维度的特征图;
25.将所述特征图经过神经网络的dropout层进行数据处理,抑制过拟合;
26.将处理后的数据流输入softmax层进行运算,最终输出神经网络最初输入的脑电波是否癫痫发作的判断结果。
27.所述将脑电图样本数据集合按照不同脑电图采集频率分批输入混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合包括:
28.将所述脑电图样本数据集合输入混合多层度卷积核残差网络的第一级卷积网络,并基于第一级卷积网络对所述脑电图样本进行第一级拟合处理,所述第一级卷积网络包括五层卷积网络,每一层卷积网络上设置有32个1x1卷积核、32个3x3卷积核、32个5x5卷积核;
29.将第一级拟合处理后的脑电图样本数据集合输入混合多层度卷积核残差网络的第二级卷积网络,并基于第二级卷积网络对所述脑电图样本进行第二级拟合处理,所述第二级卷积网络包括十层卷积网络,每一层卷积网络上设置有128个1x1卷积核、128个3x3卷积核、128个5x5卷积核;
30.将第二级拟合处理后的脑电图样本数据集合输入混合多层度卷积核残差网络的
第三级卷积网络,并基于第三级卷积网络对所述脑电图样本进行第三级拟合处理,所述第三级卷积网络包括五层卷积网络,每一层卷积网络上设置有192个1x1卷积核、192个3x3卷积核、192个5x5卷积核。
31.所述对拟合后的脑电图样本数据集进行批归一化处理包括:
32.计算拟合后的脑电图样本数据集的均值;
33.计算拟合后的脑电图样本数据集的方差;
34.使用计算的均值和方差对拟合后的脑电图样本数据集进行归一化处理,获得0-1分布;
35.对拟合后的脑电图样本数据集进行尺度变换和偏移处理。
36.所述从初步神经网络模型所训练的整体数据中提取伪差数据包括:
37.将整体脑电图导入训练好的初步模型进行推断,将误判的假阳性脑电波段数据提取出来。
38.所述脑电图样本数据集合中的数据源具有相同频率,所述脑电图样本数据集合中的数据源顺序随机打乱,所述脑电图样本数据集合中的数据源为从不同采集端所采集的脑电图数据。
39.相应的,本发明还提出了一种基于多终端数据训练神经网络模型的系统,所述系统包括:
40.采集模块,用于获取不同终端所采集的脑电图数据,并基于脑电图数据提取癫痫波数据;
41.第一数据切片模块,用于基于滑动窗口对癫痫波数据进行数据切片提取含有癫痫波的脑电图样本数据;
42.第一泛化训练模块,用于将含有癫痫波的脑电图样本数据基于混合多尺度卷积核残差网络进行泛化训练形成初步神经网络模型;
43.伪差数据提取模块,用于从初步神经网络模型所训练的整体数据中提取伪差数据;
44.数据整合模块,用于将提取的伪差数据和基于脑电图数据提取的癫痫波数据进行数据整合,得到癫痫波整合数据;
45.第二数据切片模块,用于基于滑动窗口对癫痫波整合数据进行数据切片提取含有整合后的脑电图样本数据;
46.第二泛化训练模块,用于将整合后的脑电图样本数据重新基于混合多尺度卷积核残差网络进行泛化训练形成最终神经网络模型。
47.相应的,本发明还提出了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行以上所述的方法。
48.本发明实施例在深度学习神经网络的训练过程中上,通过混合多尺度卷积核残差网络模块使ai模型可以传入各种频率不同来源的脑电图样本数据进行训练,突破了以往脑电识别神经网络只能在单一维度数据源的限制,提高了ai模型对不同来源不同频率的脑电图癫痫发作波形识别的泛化识别能力,从而可以对各种品牌型号脑电机采集到的不同频率的脑电图进行癫痫发作波形诊断都有很好的准确度。在整个神经网络模型训练过程中,通
过滑动窗口数据切片方式提升样本的描述能力,通过泛化训练提升模型对多种来源不同频率的脑电图癫痫发作波形识别的泛化能力,通过提取并整合伪差数据提升了ai模型对脑电图癫痫发作波形的真阳性判断准确率。
附图说明
49.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
50.图1是本发明实施例中的基于多终端数据训练神经网络模型的方法流程图;
51.图2是本发明实施例中的基于混合多尺度卷积核残差网络进行泛化训练的方法流程图;
52.图3是本发明实施例中的神经网络模型整体结构示意图;
53.图4是本发明实施例中的混合多尺度卷积核残差网络结构体a中每一层卷积网络的结构示意图;
54.图5是本发明实施例中的混合多尺度卷积核残差网络结构体b中每一层卷积网络的结构示意图;
55.图6是本发明实施例中的混合多尺度卷积核残差网络结构体c中每一层卷积网络的结构示意图;
56.图7是本发明实施例中的基于神经网络模型训练的方法流程图;
57.图8是本发明实施例中的基于多终端数据训练神经网络模型的系统结构示意图。
具体实施方式
58.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
59.本发明实施例中所涉及的基于多终端数据训练神经网络模型的方法,该方法包括:获取不同终端所采集的脑电图数据,并基于脑电图数据提取癫痫波数据;基于滑动窗口对癫痫波数据进行数据切片提取含有癫痫波的脑电图样本数据;将含有癫痫波的脑电图样本数据基于混合多尺度卷积核残差网络进行泛化训练形成初步神经网络模型;从初步神经网络模型所训练的整体数据中提取伪差数据;将提取的伪差数据和基于脑电图数据提取的癫痫波数据进行数据整合,得到癫痫波整合数据;基于滑动窗口对癫痫波整合数据进行数据切片提取含有整合后的脑电图样本数据;将整合后的脑电图样本数据重新基于混合多尺度卷积核残差网络进行泛化训练形成最终神经网络模型。
60.具体的,图1示出了本发明实施例中的基于多终端数据训练神经网络模型的方法流程图,该方法包括以下步骤:
61.s101、获取不同终端所采集的脑电图数据;
62.具体的,原始数据是来自国内多家医院不同设备采集上来的脑电图数据,其可以
采用互联网模式从不同设备即不同终端上采集到脑电图数据。
63.s102、将所采集的脑电图数据进行滤波处理;
64.这里将所采集的脑电图数据进行滤波处理包括:将所采集的脑电图数据进行50赫兹的滤波去除环境噪音;进行30赫兹的低通滤波消除高频噪声;进行0.1赫兹的高通滤波消除电压偏移。
65.这里可以将所有脑电图原始数据通过python mne库进行50赫兹的滤波去除可能存在的环境噪音,再进行30赫兹的低通滤波消除高频噪声,进行0.1赫兹的高通滤波消除电压偏移,通过滤除干扰熟数据,使得整个脑电图数据量减少,同时也减少对整个神经网络模型训练的干扰。
66.s103、基于脑电图数据提取癫痫波数据;
67.需要说明的是,一份癫痫患者的脑电图里,癫痫波所占的比例只是极少的一部分,如果将所有数据都导入模型进行训练,将会造成正负样本数量严重失衡,导致模型训练难以收敛,而癫痫发作时间段的波形与其前面癫痫发作前的波形和其后面癫痫发作结束后的波形有巨大差异,因此提取癫痫发作及其前后共1:1:1时间段的波形作为训练数据,正负样本比例为1:2。
68.s104、基于滑动窗口对癫痫波数据进行数据切片提取含有癫痫波的脑电图样本数据;
69.比如对于256赫兹的脑电图数据,如果直接使用每一秒的256个采点作为一个训练样本,那么可能存在一种情况就是,癫痫波形可能存在于0.8秒到1.4秒之间,那么就需要这2秒共512个采点之间才能完整展示出癫痫波形,因此这里将使用滑动窗口的思想进行数据切片提取数据样本,以64个采点作为滑动步伐,滑动窗口大小为频率数,第一个样本是第1~256个采点,第二个样本就是第65~320个采点,以此类推。
70.在提取含有癫痫波的脑电图样本数据之后,将每个数据源中不同频率的样本合并成一个集合,将集合的样本顺序随机打乱,这里的不同数据源是指不同医院诊所采集的脑电图数据,通过这种方式获得了一个随机化训练样本。
71.s105、将含有癫痫波的脑电图样本数据基于混合多尺度卷积核残差网络进行泛化训练形成初步神经网络模型;
72.具体的,由于模型结构采取的是全卷积网络结构,不带有全连接层,所以输入样本的维度可以不固定,因此这里将对不同频率的数据集按频率从大到小依次导入网络进行训练,每组频率数据集训练100个epoch,循环训练3次。
73.本发明实施例所涉及的基于混合多尺度卷积核残差网络进行泛化训练的方法,其方法包括:获取具有癫痫波的脑电图样本数据集合;将脑电图样本数据集合按照不同脑电图采集频率分批输入混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合抽取特征向量;对拟合后的特征向量进行批归一化处理;对批归一化处理后的特征向量通过1x1卷积配套全局平均池化处理,获得指定输出维度的特征图;将所述特征图经过神经网络的dropout层进行数据处理,抑制过拟合;将处理后的数据流输入softmax层进行运算,最终输出神经网络最初输入的脑电波是否癫痫发作的判断结果。
74.这里脑电图样本数据集合中的数据源具有不同频率,所述脑电图样本数据集合中的数据源顺序随机打乱,所述脑电图样本数据集合中的数据源为从不同采集端所采集的脑
电图数据。
75.具体的,图2示出了本发明实施例中的基于混合多尺度卷积核残差网络进行泛化训练的方法,包括以下步骤:
76.s201、获取具有癫痫波的脑电图样本数据集合;
77.需要说明的是,该脑电图样本数据集合中的数据源具有不同频率,所述脑电图样本数据集合中的数据源顺序随机打乱,所述脑电图样本数据集合中的数据源为从不同采集端所采集的脑电图数据。
78.需要说明的是,这里脑电图样本数据集合中数据源的输入维度为(批量x通道数x频率),其中通道是常用的19个电极做成20个双导联(fp1-f7,f7-t3,t3-t5,t5-o1,fp1-f3,f3-c3,c3-p3,p3-o1,fp2-f4,f4-c4,c4-p4,p4-o2,fp2-f8,f8-t4,t4-t6,t6-o2,fz-cz,cz-pz,t5-t3,t4-t6)等等形式。
79.后续将脑电图样本数据集合按照输入维度输入中混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合,即进入到s202至s204中进行处理,这里的res-multi-conv网络结构里采用了不同大小的卷积核,这样可以增加网络对不同大小脑电波型的适应性,最后拼接意味着不同大小波型特征的拟合。
80.s202、将所述脑电图样本数据集合输入混合多层度卷积核残差网络的第一级卷积网络,并基于第一级卷积网络对所述脑电图样本进行第一级拟合处理;
81.具体的,所述第一级卷积网络包括五层卷积网络,每一层卷积网络上设置有32个1x1卷积核、32个3x3卷积核、32个5x5卷积核;图4示出了混合多尺度卷积核残差网络结构体a中每一层卷积网络的结构示意图,该混合多尺度卷积核残差网络结构体a为第一级卷积网络,在数据输入进入每一层卷积网络时,对输入的数据进行批归一化处理,然后进行每一层卷积网络进行拟合处理,在每一层卷积网络对数据进行拟合处理后,对输出的数据基于relu激活函数进行处理。进行批归一化处理,可以对一批数据进行求均值以及求方差做归一化,加快了模型的收敛速度,在一定程度缓解了深层网络中梯度弥散的问题,使训练深层网络模型更加容易和稳定。
82.s203、将第一级拟合处理后的脑电图样本数据集合输入混合多层度卷积核残差网络的第二级卷积网络,并基于第二级卷积网络对所述脑电图样本进行第二级拟合处理;
83.具体的,所述第二级卷积网络包括十层卷积网络,每一层卷积网络上设置有128个1x1卷积核、128个3x3卷积核、128个5x5卷积核;图5示出了混合多尺度卷积核残差网络结构体b中每一层卷积网络的结构示意图,该混合多尺度卷积核残差网络结构体b为第二级卷积网络,在数据输入进入每一层卷积网络时,对输入的数据进行批归一化处理,然后进行每一层卷积网络进行拟合处理,在每一层卷积网络对数据进行拟合处理后,对输出的数据基于relu激活函数进行处理。进行批归一化处理,可以对一批数据进行求均值以及求方差做归一化,加快了模型的收敛速度,在一定程度缓解了深层网络中梯度弥散的问题,使训练深层网络模型更加容易和稳定。
84.s204、将第二级拟合处理后的脑电图样本数据集合输入混合多层度卷积核残差网络的第三级卷积网络,并基于第三级卷积网络对所述脑电图样本进行第三级拟合处理;
85.具体的,所述第三级卷积网络包括五层卷积网络,每一层卷积网络上设置有192个1x1卷积核、192个3x3卷积核、192个5x5卷积核;图6示出了,该混合多尺度卷积核残差网络
结构体c中每一层卷积网络的结构示意图,该混合多尺度卷积核残差网络结构体c为第三级卷积网络,在数据输入进入每一层卷积网络时,对输入的数据进行批归一化处理,然后进行每一层卷积网络进行拟合处理,在每一层卷积网络对数据进行拟合处理后,对输出的数据基于relu激活函数进行处理。进行批归一化处理,可以对一批数据进行求均值以及求方差做归一化,加快了模型的收敛速度,在一定程度缓解了深层网络中梯度弥散的问题,使训练深层网络模型更加容易和稳定。
86.需要说明的是,图4至图6中的网络结构图中“卷积”前面的nxn指卷积核尺寸,后面的小括号里的数字指卷积核数量。
87.s205、对拟合后的脑电图样本数据集进行批归一化处理;
88.需要说明的是,对拟合后的脑电图样本数据集进行求均值以及求方差做归一化,加快了整个网络模型的收敛速度,在一定程度缓解了深层网络中梯度弥散的问题,使训练深层网络模型更加容易和稳定。
89.这里对拟合后的脑电图样本数据集进行批归一化处理包括:计算拟合后的脑电图样本数据集的均值;计算拟合后的脑电图样本数据集的方差;使用计算的均值和方差对拟合后的脑电图样本数据集进行归一化处理,获得0-1分布;对拟合后的脑电图样本数据集进行尺度变换和偏移处理。
90.s206、对批归一化处理后的电脑图样本数据通过1x1卷积配套全局平均池化处理,获得指定输出维度的脑电图样本数据;
91.本发明实施例中采用1x1卷积配套全局平均池化处理,跟全连接层的作用是一样的,用来锁定最终的输出维度,而全连接层会对模型的输入维度大小有要求,必须每个样本的维度大小一至,而这里需要对不同频率的脑电图进行训练来提高网络的泛化能力,因此采用1x1卷积配套全局平均池化处理,使得整个训练的泛华能力更高。
92.s207、将指定输出维度的脑电图样本数据经过神经网络的dropout层进行数据处理,得到过拟合后的脑电图样本数据,所述dropout层按照神经元的激活值进行工作;
93.具体实施过程中,在网络前向传播时,使得神经元的激活值以概率值0.5进行工作。
94.在网络前向传播时,让神经元的激活值以一定的概率p(这里p=0.5)停止工作,使得最终结果不会太依赖某些局部的特征,可以明显地减少过拟合现象,从而使模型的泛化能力加强。
95.s208、将拟合后的脑电图样本数据基于softmax层输出脑电图样本数据中每个癫痫波的输出值。
96.具体实施过程中,基于softmax函数将癫痫波的输出值转换为范围在0至1的概率分布。softmax函数是做分类输出的,它输出表征了不同类别之间的相对概率,这里也就是每个样本癫痫正在发作是与否二分类的概率。
97.基于以上的方法,在深度学习神经网络的结构设计上,通过混合多尺度卷积核残差网络模块和1x1卷积配合全局平均池化层,使ai模型可以传入各种频率不同来源的脑电图样本数据进行训练,突破了以往脑电识别神经网络只能在单一维度数据源的限制,提高了ai模型对不同来源不同频率的脑电图癫痫发作波形识别的泛化识别能力,从而可以对各种品牌型号脑电机采集到的不同频率的脑电图进行癫痫发作波形诊断都有很好的准确度。
98.基于图2所示的内容,图3示出了本发明实施例中的神经网络模型整体结构示意图,具体说明如下:
99.1、res-multi-conv网络结构里采用了不同大小的卷积核,这样可以增加网络对不同大小脑电波型的适应性,最后拼接意味着不同大小波型特征的拟合;
100.2、批归一化,对一批数据进行求均值以及求方差做归一化,加快了模型的收敛速度,在一定程度缓解了深层网络中梯度弥散的问题,使训练深层网络模型更加容易和稳定;
101.3、1x1卷积 全局平均池化层,跟全连接层的作用是一样的,用来锁定最终的输出维度,而全连接层会对模型的输入维度大小有要求,必须每个样本的维度大小一至,而这里需要对不同频率的脑电图进行训练来提高网络的泛化能力,因此采用1x1卷积 全局平均池化层;
102.4、dropout层,在网络前向传播时,让神经元的激活值以一定的概率p(这里p=0.5)停止工作,使得最终结果不会太依赖某些局部的特征,可以明显地减少过拟合现象,从而使模型的泛化能力加强;
103.5、softmax层,softmax函数是做分类输出的,它输出表征了不同类别之间的相对概率,这里也就是每个样本癫痫正在发作是与否二分类的概率。
104.s106、从初步神经网络模型所训练的整体数据中提取伪差数据;
105.这里将整体脑电图导入训练好的初步模型进行推断,将误判的假阳性脑电波段数据提取出来。
106.由于上述提取的训练数据只是总体脑电图数据的很小的一部分,模型并不能学习到所有数据的全貌,特别是一些由其他原因导致的伪差脑电波数据,由于这些伪差数据“长”得很像真的癫痫波,会使得模型误判,因此将第s105中训练出来的模型,对整体所有数据判断一遍,将误判的假阳性脑电波段数据提取出来。
107.s107、将提取的伪差数据和基于脑电图数据提取的癫痫波数据进行数据整合,得到癫痫波整合数据;
108.s108、基于滑动窗口对癫痫波整合数据进行数据切片提取含有整合后的脑电图样本数据;
109.该步骤与s104类似,其主要处理对象是癫痫波整合数据,其处理过程不再一一进行赘述。
110.s109、将整合后的脑电图样本数据重新基于混合多尺度卷积核残差网络进行泛化训练形成最终神经网络模型。
111.该步骤与s105类似,其主要处理对象是整合后的脑电图样本数据,其处理过程不再一一进行赘述。
112.基于上述方法,在深度学习神经网络的训练过程中上,通过混合多尺度卷积核残差网络模块使ai模型可以传入各种频率不同来源的脑电图样本数据进行训练,突破了以往脑电识别神经网络只能在单一维度数据源的限制,提高了ai模型对不同来源不同频率的脑电图癫痫发作波形识别的泛化识别能力,从而可以对各种品牌型号脑电机采集到的不同频率的脑电图进行癫痫发作波形诊断都有很好的准确度。在整个神经网络模型训练过程中,通过滑动窗口数据切片方式提升样本的描述能力,通过泛化训练提升模型对多种来源不同频率的脑电图癫痫发作波形识别的泛化能力,通过提取并整合伪差数据提升了ai模型对脑
电图癫痫发作波形的真阳性判断准确率。
113.相应的,图7示出了本发明实施例中的基于神经网络模型训练的方法流程图,其结合图1至6进行说明,具体内容如下:
114.这里的1-6步是拿原始数据的部分数据进行训练模型只看过部分数据,第7步将所有原始数据都拿给1-6训练出来的模型进行预测,模型会把一些之前没看过但看起来很像是癫痫发作的,但实际上又不是癫痫发作的波型误判,然后把这部分误判的波型(也就是伪差)结合到第2-3步数据提取到的数据,重新训练模型;初步模型跟最终模型的网络结构都是一样的,其为图3所述的神经网络结构,这里主要是介绍网络训练的流程特点。
115.1、原始数据是来自国内多家医院不同设备采集上来的脑电图数据;
116.2、滤波:将所有脑电图原始数据通过python mne库进行50赫兹的滤波去除可能存在的环境噪音,再进行30赫兹的低通滤波消除高频噪声,进行0.1赫兹的高通滤波消除电压偏移;
117.3、数据提取:一份癫痫患者的脑电图里,癫痫波所占的比例只是极少的一部分,如果将所有数据都导入模型进行训练,将会造成正负样本数量严重失衡,导致模型训练难以收敛,而癫痫发作时间段的波形与其前面癫痫发作前的波形和其后面癫痫发作结束后的波形有巨大差异,因此提取癫痫发作及其前后共1:1:1时间段的波形作为训练数据,正负样本比例为1:2;
118.4、数据切片:比方说对于256赫兹的脑电图数据,如果直接使用每一秒的256个采点作为一个训练样本,那么可能存在一种情况就是,癫痫波形可能存在于0.8秒到1.4秒之间,那么就需要这2秒共512个采点之间才能完整展示出癫痫波形,因此这里将使用滑动窗口的思想进行数据切片提取数据样本,以64个采点作为滑动步伐,滑动窗口大小为频率数,第一个样本是第1~256个采点,第二个样本就是第65~320个采点,以此类推;
119.5、随机化训练样本:将每个数据源中不同频率的样本合并成一个集合,将集合的样本顺序随机打乱,这里的不同数据源是指不同医院诊所采集的脑电图数据;
120.6、泛化训练:由于模型结构采取的是全卷积网络结构,不带有全连接层,所以输入样本的维度可以不固定,因此这里将对不同频率的数据集按频率从大到小依次导入网络进行训练,每组频率数据集训练100个epoch,循环训练3次;
121.7、提取伪差数据:由于上述提取的训练数据只是总体脑电图数据的很小的一部分,模型并不能学习到所有数据的全貌,特别是一些由其他原因导致的伪差脑电波数据,由于这些伪差数据“长”得很像真的癫痫波,会使得模型误判,因此将第6步训练出来的模型,对整体所有数据判断一遍,将误判的假阳性脑电波段数据提取出来;
122.8、持续学习,迭代训练:将第7步提取到的伪差数据整合到第3步提取到的数据,然后重新执行第4、5、6步,训练出最终的深度学习算法模型。
123.相应的,图8示出了本发明实施例中的基于多终端数据训练神经网络模型的系统,该系统包括:
124.采集模块,用于获取不同终端所采集的脑电图数据,并基于脑电图数据提取癫痫波数据;
125.第一数据切片模块,用于基于滑动窗口对癫痫波数据进行数据切片提取含有癫痫波的脑电图样本数据;
126.第一泛化训练模块,用于将含有癫痫波的脑电图样本数据基于混合多尺度卷积核残差网络进行泛化训练形成初步神经网络模型;
127.伪差数据提取模块,用于从初步神经网络模型所训练的整体数据中提取伪差数据;
128.数据整合模块,用于将提取的伪差数据和基于脑电图数据提取的癫痫波数据进行数据整合,得到癫痫波整合数据;
129.第二数据切片模块,用于基于滑动窗口对癫痫波整合数据进行数据切片提取含有整合后的脑电图样本数据;
130.第二泛化训练模块,用于将整合后的脑电图样本数据重新基于混合多尺度卷积核残差网络进行泛化训练形成最终神经网络模型。
131.该系统还包括滤波模块,该滤波模块用于将所采集的脑电图数据进行滤波处理。
132.需要说明的是,将所采集的脑电图数据进行滤波处理包括:将所采集的脑电图数据进行50赫兹的滤波去除环境噪音;进行30赫兹的低通滤波消除高频噪声;进行0.1赫兹的高通滤波消除电压偏移。
133.需要说明的是,该基于混合多尺度卷积核残差网络进行泛化训练包括:获取具有癫痫波的脑电图样本数据集合;将脑电图样本数据集合按照不同脑电图采集频率分批输入混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合抽取特征向量;对拟合后的特征向量进行批归一化处理;对批归一化处理后的特征向量通过1x1卷积配套全局平均池化处理,获得指定输出维度的特征图;将所述特征图经过神经网络的dropout层进行数据处理,抑制过拟合;将处理后的数据流输入softmax层进行运算,最终输出神经网络最初输入的脑电波是否癫痫发作的判断结果。
134.需要说明的是,这里将脑电图样本数据集合按照输入维度输入中混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合包括:将所述脑电图样本数据集合输入混合多层度卷积核残差网络的第一级卷积网络,并基于第一级卷积网络对所述脑电图样本进行第一级拟合处理,所述第一级卷积网络包括五层卷积网络,每一层卷积网络上设置有32个1x1卷积核、32个3x3卷积核、32个5x5卷积核;将第一级拟合处理后的脑电图样本数据集合输入混合多层度卷积核残差网络的第二级卷积网络,并基于第二级卷积网络对所述脑电图样本进行第二级拟合处理,所述第二级卷积网络包括十层卷积网络,每一层卷积网络上设置有128个1x1卷积核、128个3x3卷积核、128个5x5卷积核;将第二级拟合处理后的脑电图样本数据集合输入混合多层度卷积核残差网络的第三级卷积网络,并基于第三级卷积网络对所述脑电图样本进行第三级拟合处理,所述第三级卷积网络包括五层卷积网络,每一层卷积网络上设置有192个1x1卷积核、192个3x3卷积核、192个5x5卷积核。
135.需要说明的是,这里对拟合后的脑电图样本数据集进行批归一化处理包括:计算拟合后的脑电图样本数据集的均值;计算拟合后的脑电图样本数据集的方差;使用计算的均值和方差对拟合后的脑电图样本数据集进行归一化处理,获得0-1分布;对拟合后的脑电图样本数据集进行尺度变换和偏移处理。
136.需要说明的是,这里dropout层按照神经元的激活值进行工作包括:在网络前向传播时,使得神经元的激活值以概率值0.5进行工作。
137.需要说明的是,这里将拟合后的脑电图样本数据基于softmax层输出脑电图样本
数据中每个癫痫波的输出值包括:基于softmax函数将癫痫波的输出值转换为范围在0至1的概率分布值。
138.需要说明的是,脑电图样本数据集合中的数据源具有不同频率,所述脑电图样本数据集合中的数据源顺序随机打乱,所述脑电图样本数据集合中的数据源为从不同采集端所采集的脑电图数据。
139.需要说明的是,将脑电图样本数据集合按照输入维度输入中混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合中还包括:在数据输入进入每一层卷积网络时,对输入的数据进行批归一化处理,然后进行每一层卷积网络进行拟合处理。
140.需要说明的是,将脑电图样本数据集合按照输入维度输入中混合多尺度卷积核残差网络对所述脑电图样本数据集不同大小波型特性进行拟合中还包括:在每一层卷积网络对数据进行拟合处理后,对输出的数据基于relu激活函数进行处理。
141.相应的,本发明还提出了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行以上所述的方法。
142.基于以上的系统或者存储介质,本发明实施例在深度学习神经网络的训练过程中上,通过混合多尺度卷积核残差网络模块使ai模型可以传入各种频率不同来源的脑电图样本数据进行训练,突破了以往脑电识别神经网络只能在单一维度数据源的限制,提高了ai模型对不同来源不同频率的脑电图癫痫发作波形识别的泛化识别能力,从而可以对各种品牌型号脑电机采集到的不同频率的脑电图进行癫痫发作波形诊断都有很好的准确度。在整个神经网络模型训练过程中,通过滑动窗口数据切片方式提升样本的描述能力,通过泛化训练提升模型对多种来源不同频率的脑电图癫痫发作波形识别的泛化能力,通过提取并整合伪差数据提升了ai模型对脑电图癫痫发作波形的真阳性判断准确率。
143.以上对本发明实施例进行了详细介绍,本文中采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献