一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于处理MRI数据的系统和方法与流程

2022-02-22 03:23:09 来源:中国专利 TAG:

用于处理mri数据的系统和方法
1.相关申请的交叉引用
2.本技术要求于2019年5月1日提交的美国临时专利申请序列号62/841,420和2019年10月18日提交的美国临时专利申请序列号62/923,238的优先权和权益,在此将它们各自的全部内容通过引用合并于此。
技术领域
3.本发明涉及mti数据的处理。


背景技术:

4.mri数据需要对扫描图像进行大量预处理以构建可用的输出数据集。mri数据处理的质量控制(qc)是分析大规模数据集的重大障碍,并且特别地会影响用于fmri数据的预处理特征。传统的数据处理需要人工介入(例如,“人在回环(或人机回圈)”)。这种人工介入的数据处理需要专家手动识别正确预处理的输出图像。通常,专家评审员需要大量的时间。
5.此外,结构和功能mri扫描的预处理是计算密集型操作,通常每个受试者(即个体)需要几个小时。这可能导致mri数据采集与其分析之间的等待时间过长,特别是在具有数百个受试者的大型数据集中,尤其是在使用诸如高性能工作站单元等传统计算机基础设施执行计算时。本公开旨在解决这些问题并且解决其他需求。


技术实现要素:

6.根据本公开的一些实施方案,开发了用于使mri扫描的qc自动化的系统和方法。特别地,使用源自大脑mr图像的特征对机器学习分类器进行训练,以预测这些图像的质量,这是基于专家意见的基本事实。专业qc(quality control)评审员检查原始mri扫描并对图像进行预处理以判定质量是否足以进行进一步分析是该领域的常见做法。所公开的用于使qc自动化的分类器可以结合多种特征。在一个示例中,利用源自预处理日志文件(mri预处理期间输出的文本文件)的特征的分类器特别准确,并且展示了泛化到新数据集的能力,这也使得所公开的技术能够扩展到新的数据集和/或mri预处理管道。
7.另外,针对常规的mri数据处理和预处理方法的局限性,本公开提供了用于选择最佳fmri预处理管道参数的自动搜索方法和用于执行质量控制的自动化方法。所公开的系统和方法的实施已经在两个独立的数据集上得到了验证。对于每个受试者(例如,个体或患者),所公开的方法自动搜索大量的预处理参数,以预测将使受试者的扫描图像能够通过视觉qc的特定预处理参数。因此,所公开的系统和方法为每个受试者提供参数集推荐的生成;这些特定的参数集大大减少了专家评审员对数据集进行全面质量控制所需的周转时间和精力。因此,所公开的系统和方法产生了一种用于对预处理的fmr图像执行qc的新颖、高效且有效的技术。
8.根据本公开的一些实施方案,分析mri数据的方法提供了接收与生物结构的mr图像集相对应的未处理的mri数据。此外,该方法提供了对所接收的mri数据进行预处理。预处
理包括:(1)对mr图像集中的各mr图像执行结构-功能对齐和颅骨剥离(skull-stripping)过程;和(2)输出与预处理相关的多个参数集。此外,该方法提供了基于多个参数集生成多个函数连通矩阵(在一些示例中为全脑函数连通矩阵)。此外,该方法提供了识别多个函数连通矩阵中的相似矩阵以产生多个矩阵簇。此外,该方法提供了选择多个矩阵簇的主要集群。此外,该方法提供了输出多个参数集中与占优矩阵(dominant matrix)相对应的参数子集。
9.在一些示例中,识别相似矩阵包括:(1)确定多个函数连通矩阵中的矩阵之间的成对差异的frobenius范数;(2)当所确定的frobenius范数小于阈值时,将多个全脑函数连通矩阵中的矩阵分组为子集簇;和(3)将子集簇输出到多个矩阵簇中。
10.在一些示例中,识别相似矩阵还包括:增大阈值直至多个矩阵簇中最大集群的大小是多个矩阵簇中第二大集群的大小的两倍。
11.在一些示例中,多个参数集对应于与功能-结构对齐和颅骨剥离过程中的至少一者相关联的多个参数中的四个参数。
12.在一些示例中,输出的参数子集对应于主导集群的质心。
13.在一些示例中,该方法还包括:用输出的参数子集处理所接收的mri数据,以产生处理过的mr图像集。
14.在一些示例中,所接收的mri数据对应于受试者的mri数据。在一些示例中,该方法还包括扫描受试者的大脑以输出mr图像集。
15.在一些实施方式中,本公开提供了一种包括存储器和控制系统的系统。所述存储器包含机器可读介质,该机器可读介质包括机器可执行代码,其上存储有用于执行方法的指令。所述控制系统连接到存储器并且包括一个或多个处理器。该控制系统被配置为执行机器可执行代码以使得控制系统执行上面关于所公开的分析mri数据的方法而讨论的方法。该系统的附加示例如上面关于所公开的分析mri数据的方法所提供的那样。
16.在一些实施方式中,本公开提供了一种非暂时性机器可读介质。该介质上存储有用于执行方法的指令,并且该介质包括机器可执行代码。所述代码在由至少一台机器执行时使该机器执行上面关于所公开的分析mri数据的方法而讨论的所公开的方法。该非暂时性机器可读介质的附加示例如上面关于所公开的分析mri数据的方法所提供的那样。
17.根据本公开的一些实施方式,一种用于分析mri数据的系统包括存储器和控制系统。所述存储器包含机器可读介质,该机器可读介质包括机器可执行代码,其上存储有用于执行方法的指令。所述控制系统是存储器。该控制系统具有一个或多个处理器。该控制系统被配置为执行机器可执行代码以使控制系统接收与mr图像集相对应的未处理的mri数据。对所接收的未处理的mri数据进行预处理,以输出预处理过的mr图像集。输出与预处理相关的特征集。使用机器学习模型,处理该特征集以确定具有阈值图像质量的预处理mr图像组的子集。
18.在一些示例中,阈值图像质量包括足以通过人工质量控制的图像质量。
19.在一些示例中,阈值图像质量包括适合由模型进一步处理以识别功能性磁共振成像(fmri:functional magnetic resonance imaging)特征集的图像质量。在一些这样的实施方式中,该fmri特征集至少包括功能连通性。
20.在一些示例中,预处理包括对mr图像集中的各mr图像执行结构-功能对齐。
21.在一些示例中,机器学习模型包括逻辑回归模型、支持向量机、梯度提升机或随机森林模型。
22.在一些示例中,机器学习模型使用基于手动qc评级的结果标签进行训练。
23.在一些示例中,特征集包括来自mri预处理运行时间日志的日志数据集。在一些这样的示例中,来自mri预处理运行时间日志的日志数据集包括与结构-功能对齐的定量评估相关的文本格式的数据。在其他一些这样的示例中,来自mri预处理运行时间日志的日志数据集包括以下的至少一者:预处理步骤运行时间、大脑坐标、结构-功能对齐成本值、对mr图像集进行的大量编辑、以及mr图像集中大脑的图像采集角度。
24.在一些示例中,控制系统还被配置为将mr图像集的子集存储在存储器中。
25.在一些示例中,预处理还包括颅骨剥离过程。
26.在一些示例中,预处理后的mr图像集包括结构mr图像。
27.在一些示例中,预处理后的mr图像集包括功能mr图像。
28.在一些示例中,mr图像集包括表示每个患者的大脑的未处理的功能mri数据和未处理的结构mri数据。
29.根据本公开的一些实施方式,用于分析mri数据的方法包括接收与mr图像集相对应的未处理的mri数据。对所接收的未处理的mri数据执行预处理,以输出预处理过的mr图像集。输出与预处理相关的特征集。使用机器学习模型,对特征集进行处理,以确定具有阈值图像质量的预处理过的mr图像集的子集。
30.根据本公开的一些实施方式,非暂时性机器可读介质上存储有用于执行方法的指令。非暂时性机器可读介质包括机器可执行代码,该机器可执行代码在由至少一个机器执行时使该机器分析mri数据,包括接收与mr图像集相对应的未处理的mri数据。对所接收的未处理的mri数据执行预处理,以输出预处理过的mr图像集。输出与预处理相关的特征集。使用机器学习模型,对特征集进行处理,以确定具有阈值图像质量的预处理过的mr图像集的子集。
31.在一些实施方式中,分析mri数据的方法包括首先接收未处理的mri数据。未处理的mri数据包括生物结构的多个mr图像集。每个mr图像集对应于多个患者中的一个患者。此外,该方法提供了对所接收的mri数据进行预处理。预处理包括对每个mr图像集中的序列图像进行并行处理。此外,该方法提供了基于所接收的mri数据的预处理,针对每个mr图像集输出分割的、体素级预处理的时间序列。
32.在一些示例中,未处理的mri数据包括原始结构mri数据和原始静息态功能mri数据。
33.在一些示例中,对所接收的mri数据进行预处理包括执行一系列预处理步骤。这一系列预处理步骤包括以下的至少一者:结构预处理、去尖峰、运动校正、颅骨剥离、结构图像和功能图像之间的配准、空间平滑、平均信号归一化、干扰信号回归以及归一化到talairach坐标。这些步骤能够按任何顺序执行。
34.在一些示例中,对所接收的mri数据进行预处理包括对每个mr图像集中的每个mr图像执行(1)结构-功能对齐,和(2)颅骨剥离过程。此外,该方法能够提供与预处理相关的多个参数集的输出。此外,该方法能够提供基于多个参数集生成多个函数连通矩阵;识别多个函数连通矩阵中的相似矩阵,以产生多个矩阵簇;选择多个矩阵簇中的主导集群;以及输
出与主导矩阵相对应的多个参数集的参数子集。如上所述,这能够根据图2的方法200来执行。
35.在上面预处理的一些示例中,识别相似矩阵包括:(1)确定多个函数连通矩阵中的矩阵之间的成对差异的frobenius范数;(2)当所确定的frobenius范数小于阈值时,将多个函数连通矩阵中的矩阵分组为子集簇;和(3)将子集簇输出到多个矩阵簇中。在一些示例中,该方法还能够提供增大阈值直至多个矩阵簇中最大集群的大小是多个矩阵簇中第二大集群的大小的两倍。在一些示例中,多个参数集对应于与功能-结构对齐和颅骨剥离过程中的至少一者相关联的多个参数中的四个参数。在一些示例中,输出的参数子集对应于主导集群的质心。在一些示例中,该方法还能够提供:基于输出的参数子集,对多个mr图像集中的每个图像集进行预处理。
36.在一些示例中,每个mr图像集对应于受试者的生物结构的mri数据。
37.在一些示例中,该方法还提供了扫描受试者的大脑以输出mr图像集。
38.鉴于各种实施例和/或实施方式的详细说明,本公开的前述和另外的方面和实施方式对于本领域技术人员来说将是显而易见的,所述各种实施例和/或实施方式参考了附图,接下来提供附图的简要说明。
附图说明
39.通过阅读以下详细说明并且通过参照附图,本公开的上述和其他优点将变得显而易见。
40.图1示出了根据本公开的一些实施方案的用于执行预处理mri数据的方法的系统。
41.图2示出了根据本公开的一些实施方案的用于预处理mri数据的方法。
42.图3是根据本公开的一些实施方案的用于采集nmr数据的mri系统的框图。
43.图4是根据本公开的一些实施方案的形成图3的mri系统的一部分的收发器的框图。
44.图5示出了根据本公开的一些实施方案的用于mri数据的自动化质量控制(“qc”)过程的方法。
45.图6a至图6c是示出了根据本公开的一些实施方案的用于自动化qc的各种机器学习模型的性能的曲线图。
46.图7示出了根据本公开的一些实施方案的用于mri数据的自动化质量控制(“qc”)过程的方法。
47.图8示出了根据本公开的一些实施方案的已经通过并提交qc的预处理图像的示例。
48.图9是示出了根据本公开的一些实施方案的预处理管道的示例的流程图。
49.图10示出了根据本公开的一些实施方案的从预处理日志中摘录的示例。
50.图11a至图11d是示出了根据本公开的一些实施方案的用于自动化qc的各种机器学习模型的性能的曲线图。图11a示出了使用flag-qc特征的性能;图11b示出了所有特征的性能;图11c示出了用于结构mri的mriqc特征的性能;并且图11d示出了用于功能mri的mriqc特征的性能。
51.图12a至图12d是示出了根据本公开的一些实施方案的用于自动化qc的各种机器
学习模型的性能的曲线图。图12a示出了使用随机森林的flag-qc特征的性能;图12b示出了使用随机森林的所有特征的性能;图12c示出了使用梯度增强机的用于结构mri的mriqc特征的性能;并且图11d示出了使用逻辑回归的用于功能mri的mriqc特征的性能。
52.尽管本公开易于受到各种变形和替代形式的影响,但已经通过附图中的示例的方式示出了具体实施方案并且将在本文中进一步详细说明。然而,应当理解的是,本公开不旨在限于所公开的特定形式。相反,本公开旨在涵盖落入由所附权利要求限定的本公开的主旨和范围内的所有变形例、等同物和替代。
具体实施方案
53.将参照附图说明本发明,其中贯穿附图使用相同的参考标号来表示相似或等效的元件。附图未按比例绘制,并且仅提供用来说明本发明。下面将参考示例应用说明本发明的几个方面以供说明。应当理解的是,阐述了许多具体细节、关系和方法以提供对本发明的全面理解。然而,相关领域的普通技术人员将容易地认识到,可以在没有一个或多个具体细节的情况下或通过其他方法来实施本发明。在其他情况下,未详细示出众所周知的结构或操作以避免混淆本发明。本发明不受所示的动作或事件的顺序的限制,因为一些动作可能以不同的顺序发生和/或与其他动作或事件同时发生。此外,在根据本发明的方法中并非所示的所有动作或事件都需要实现。
54.概述
55.在用于任何统计分析之前,原始fmr图像必须经过一组复杂的计算变换,通常称为预处理。这些原始图像和预处理图像通常由专家评审员在称为“质量控制”(qc)的过程中手动地评估质量。这些评审员通常在多个步骤中,将预处理图像可视化,并且检查它们是否存在可能会错误地影响未来分析的明显错误。已经提出了许多用于质量控制的评估方案。然而,需要一种简单、清晰的策略来确定扫描(i)通过并因此可用,或者(ii)失败并从进一步分析中丢弃。
56.qc的劳动密集和/或耗时性可能是大规模分析fmr图像的瓶颈。在开始分析之前,对具有数百条扫描的fmri数据集的qc可能需要一位专家评审员花费数周到数月的手动评估。正如这里所讨论的,许多最近的fmri研究已经收集了达到或甚至高于该规模的数据,为该领域开发可扩展的qc框架提供了令人信服的动力,以(i)减轻个体研究人员的负担,并且(ii)标准化fmri数据的质量控制。
57.因此,公开了用于使mri扫描的qc自动化的系统和方法。例如,可以使用源自大脑mr图像的特征训练机器学习分类器,以预测这些图像的质量,这是基于专家意见的基本事实。通常,专业qc评审员检查原始mri扫描和预处理图像,以确定质量是否足以用以进一步分析。所公开的分类器用于使qc自动化,并且可以结合多种特征。在一些实施方案中,发现使用源自预处理日志文件(例如,mri预处理期间输出的文本文件)的特征的分类器特别准确,并且还证明了其泛化到新数据集的能力,这也使得所公开的技术可扩展到新的数据集和/或mri预处理管道。
58.此外,针对处理和预处理mri数据的常规方法的局限性,本公开提供(i)用于选择最佳fmri预处理管道参数的自动搜索方法,(ii)qc的自动化方法,以及相关的系统和方法。所公开的系统和方法的实施方案已经在两个独立的数据集上得到验证。一些所公开的系统
和方法自动地搜索针对各受试者的大量的预处理参数,以预测将使受试者的扫描图像通过视觉qc的特定的预处理参数。因此,所公开的系统和方法提供了用于针对各受试者生成参数集推荐;这些特定的参数集显著地减少了专家评审员对数据集进行全面质量控制(qc)所需的周期时间和工作量。因此,所公开的系统和方法产生一种新颖、高效并且有效的方法来执行预处理的fmr图像的qc。
59.系统
60.图1示出了根据本公开的一些实施方案的用于执行预处理mri数据和/或qc mri数据集的方法的系统100。系统100包括mri扫描仪110、控制器120、存储模块130、网络140和外部数据库150。mri扫描仪110扫描一个或多个受试者(例如,个体、患者)的生物结构。mri扫描仪110可以通过网络140将对应于生物结构的扫描图像发送至外部数据库150和/或存储模块130。在一些实施方案中,mri扫描仪110可以发送对应于特定患者的多个扫描图像。
61.在一些实施方案中,mri扫描仪110可以通过网络140由外部计算设备控制。例如,外部计算设备可以包括控制器120和存储模块130。在一些实施方案中,外部计算设备包括外部数据库150,和/或可以访问外部数据库150。在一些实施方案中,如本文进一步讨论的,控制器120根据图2的方法200处理来自mri扫描仪110的扫描图像。在一些实施方案中,外部数据库150包括用于多个用户数据(例如,患者数据)的存储设备。用户数据可以包括由mri扫描仪110拍摄的mri扫描和/或本领域已知的任何其他健康数据。
62.参数选择的示例方法
63.在一些情况下,在数据采集期间用于控制mri扫描仪(例如,系统100的mri扫描仪110)的参数可能影响结果图像的质量和特性。因此,在一些实施方案中,讨论了用于选择用于mr图像采集的最优参数的方法。例如,图2示出了根据本公开的一些实施方案的用于预处理mri数据以选择最优参数的方法。在本文公开的其他示例方法中,参数可以是用于研究中的每次扫描的标准和/或预定义参数。
64.在一些实施方案中,方法200开始于以接收未处理的mri数据的步骤210。在一些示例中,未处理的mri数据对应于生物结构的mr图像集。生物结构可以是受试者(例如,患者)的大脑。接收到的mri数据可以对应于针对受试者的任何类型的mri数据。在一些示例中,方法200开始于扫描受试者的大脑以输出该mr图像集。
65.此外,方法200的步骤220提供用于对接收到的mri数据进行预处理。预处理数据包括对mr图像集中的每个mr图像执行结构性-功能性对齐和颅骨剥离过程。在一些实施方案中,步骤220还提供用于输出与预处理相关的多个参数集。
66.方法200的步骤230提供用于基于步骤220输出的多个参数集生成多个函数连通矩阵。在一些示例中,多个函数连通矩阵可以包括全脑功能性连通矩阵。
67.方法200的步骤240提供用于识别多个函数连通矩阵和/或全脑功能性连通矩阵中的相似矩阵。在一些实施方案中,识别出的相似矩阵被分组以产生多个矩阵簇。
68.在一些实施方案中,识别相似矩阵包括:(1)在多个全脑功能性连通矩阵中的矩阵之间确定成对差异的frobenius范数;(2)当所确定的frobenius范数小于阈值时,将多个全脑功能性连通矩阵中的矩阵分组为子集簇;和/或(3)将子集簇输出到多个矩阵簇中。
69.在一些实施方案中,可以增加阈值直到多个矩阵簇中最大簇的大小是该多个矩阵簇中最二大簇的大小的两倍。在一些实施方案中,多个参数集对应于来自与结构功能对齐
和颅骨剥离过程中至少一者相关联的多个参数中的四个参数。
70.方法200的步骤250提供用于选择多个矩阵簇中的主簇。方法200的步骤260提供用于输出与主矩阵相对应的多个参数集的参数子集。在一些实施方案中,输出的参数子集对应于主簇的质心。
71.在一些实施方案中,方法200还包括接收具有输出的参数子集的mri数据以产生处理过的mr图像集。
72.核磁共振系统示例
73.通常参照图3,在核磁共振(nmr)系统上可以可替代地或附加地执行本公开的系统和方法。在一些实施方案中,nmr可以包括用于生成不同类型的扫描(包括mri扫描)的硬件。通常参照图3和图4,如图所示,nmr系统的主要组件的示例可以用于执行本文公开的各种实施方案的系统和方法。图4示出了用于图3的nmr系统的收发器的组件。应当注意的是,本公开的各种实施方案的系统和方法也可以使用其他nmr系统和/或其他设置、范围或组件来执行。
74.图3和图4所示系统的操作由操作员控制台300控制,该操作员控制台包括扫描键盘302的控制台处理器301。在一些实施方案中,操作员控制台300通过例如控制面板303和/或等离子显示器/触摸屏304接收来自人工操作员的输入。控制台处理器301通过通信链路316与独立的计算机系统307的应用程序接口模块317通信。通过键盘302和控制器303,操作员通过计算机系统307的图像处理器306控制图像的产生和显示。在一些实施方案中,图像处理器306通过视频电缆305直接连接至控制台300上的视频显示器318。
75.计算机系统307是围绕符合vme标准的背板总线形成的,并且包括通过该背板彼此通信的多个模块。除了应用程序接口317和图像处理器306之外,计算机系统307还可以包括控制vme背板的cpu模块308,和/或通过总线310将计算机系统307连接至一组外围设备(例如,磁盘存储器311和磁带设备312)的scsi接口模块309。在一些实施方案中,计算机系统307还包括存储模块313(例如,作为用于存储图像数据阵列的帧缓冲器)和/或通过高速串行链路315将计算机系统307连接至位于独立的系统控制柜322中的系统接口模块320的串行接口模块314。
76.在一些实施方案中,系统控制322包括一系列模块,这些模块通过共用背板318连接在一起。背板318包括多个总线结构,诸如由cpu模块319控制的总线结构。串行接口模块320将背板318连接至高速串行链路315,并且脉冲生成器模块321通过串行链路325将背板318连接至操作员控制台300。正是通过该链路325,系统控制322接收来自操作员的指示将执行的扫描序列的命令。
77.脉冲生成器模块321操作系统组件以执行期望的扫描序列。脉冲生成器模块产生表明将产生的rf脉冲的时间、强度和形状以及数据采集窗口的时间和长度的数据。脉冲生成器模块321还通过串行链路326连接至一组梯度放大器327,并且向其传送指示在扫描期间将产生的梯度脉冲的时间和形状的数据。脉冲生成器模块321还通过串行链路328接收来自生理采集控制器329的用户数据。
78.生理采集控制器329可以从连接至患者的多个不同传感器接收信号。例如,它可以接收来自电极的ecg信号或来自波纹管的呼吸信号,并且为脉冲生成器模块321产生脉冲,使扫描与患者的心动周期和/或呼吸周期同步。最后,脉冲生成器模块321通过串行链路332
连接至在输入端335处接收来自与患者和磁体系统的位置和状况相关联的各种传感器的信号的扫描室接口电路333。患者定位系统334也通过扫描室接口电路333接收命令,该命令移动患者支架并且将患者运送到扫描所需的位置。
79.由脉冲生成器模块321产生的梯度波形被施加至分别由gx放大器336、gy放大器337和gz放大器338组成的梯度放大器系统327。各放大器336、337和338用于在通常指定为339的组件中激励相应的梯度线圈。梯度线圈组件339形成包括产生1.5特斯拉的穿过孔水平地延伸的极化场的极化磁体340的磁体组件355的一部分。
80.梯度线圈339环绕孔。当通电时,梯度线圈339产生与主极化磁场相同方向的磁场,但是具有在笛卡尔坐标系的正交x轴、y轴和z轴方向定向的梯度gx、gy和gz。即,如果由主磁体440产生的磁场定向在z方向并且称为bo,并且z方向的总磁场称为bz,则体440产生的磁场定向在z方向并且称为bo,并且z方向的总磁场称为bz,则并且并且磁体组件441的孔中任何点(x,y,z)处的磁场由b(x,y,z)=bo gxx gyygzz给出。
81.梯度磁场用于将空间信息编码到从被扫描的患者发出的nmr信号中。因为当使用epi序列来实施本公开的一些实施方案时梯度场以非常高的速度切换,所以采用局部梯度线圈代替全身梯度线圈139。这些局部梯度线圈被设计用于头部并且在其附近。这使得局部梯度线圈的电感能够降低并且梯度切换率能够根据epi脉冲序列的需要而增加。局部梯度线圈的示例包括在1994年12月13日发布且名称为“nmr local coil for brain imaging(用于大脑成像的nmr局部线圈)”的美国专利号5,372,137中所公开的,其通过引入合并于此。
82.位于孔342内的是圆柱形整体rf线圈352。线圈352响应于由系统控制柜322的收发器模块350提供的rf脉冲产生圆极化rf场。这些脉冲被rf放大器351放大并且通过发射/接收开关354连接至rf线圈352,发射/接收开关354形成rf线圈组件的组成部分。波形和/或控制信号由脉冲生成器模块321提供,并且由收发器模块350用于rf载波调制和模式控制。由患者的受激核辐射的最终nmr信号可以由相同的rf线圈352感测,并且通过发射/接收开关354连接至前置放大器353。在一些实施方案中,放大的nmr信号被解调、滤波并且在收发器350的接收器部被数字化。
83.发射/接收开关354由来自脉冲生成器模块321的信号控制以在发射模式期间将rf放大器351电连接至线圈352,并且在接收模式期间连接前置放大器353。发射/接收开关354还使得能够在发射和接收模式中使用单独的局部rf头部线圈以提高接收到的nmr信号的信噪比。对于nmr系统,为了检测nmr信号的微小变化优选局部rf线圈。局部rf线圈的示例包括在上面引述的通过引用合并于此的美国专利号5,372,137所公开的局部rf线圈。
84.除了支撑极化磁体340、梯度线圈339和rf线圈352之外,主磁体组件341还支撑一组与主磁体340相关联且用于校正极化磁场的不均匀性的匀场线圈356。主电源357用于使由超导主磁体340产生的极化场达到合适的工作强度,然后被移除。
85.由rf线圈接收到的nmr信号由收发器模块350数字化,并且传送到也是系统控制322的一部分的存储模块360。当扫描完成并且在存储模块360中获取了整个数据阵列时,阵列处理器361操作以将数据傅立叶变换成图像数据阵列。该图像数据通过串行链路315传送到计算机系统307,其中,图像数据被存储在磁盘存储器311中。响应于从操作员控制台300接收到的命令,该图像数据可以归档在磁带设备312上,或者它可以由图像处理器1306进一
步处理并且传送至操作员控制台300且显示在下文将更详细说明的视频显示器318上。
86.特别地参照图4,收发器350(图3)包括在线圈352a处通过功率放大器351产生rf激励场b1的部件和接收在线圈352b中感应所得的nmr信号的部件。类似于以上讨论的线圈352(图3),线圈352a和线圈352b可以是单个整体线圈。然而,最好的结果是使用专为头部设计的单个局部rf线圈来实现。rf激励场的基频或载波频率在频率合成器400的控制下产生,频率合成器400通过背板318从cpu模块319(图3)和脉冲生成器模块321(图3)接收一组数字信号(cf)。这些数字信号表示在输出部401处产生的rf载波信号的频率和相位。
87.被控制的rf载波被施加至调制器和上变频器402,该调制器和上变频器振幅响应于来自脉冲生成器模块321也通过背板318接收到的信号r(t)被调制。信号r(t)定义包络(envelope),从而定义要生成的rf激励脉冲的带宽。它是在模块321中通过依次地读出代表期望包络的一系列存储数字值来产生的。这些存储的数字值进而可以从操作员控制台300(图3)改变以能够产生任何期望的rf脉冲包络。
88.调制器和上变频器402在输出端405处以期望的larmor频率产生rf脉冲。通过线路405输出的rf激励脉冲的幅度被接收来自背板318的数字命令ta的激励衰减器电路406衰减。衰减的rf激励脉冲被施加至驱动rf线圈352a的功率放大器351。收发器322的该部分的示例包括美国专利第4,952,877号中公开的内容,其通过引入合并于此。
89.仍然参照图3和图4,由受试者产生的nmr信号被接收线圈352b获得,并且通过前置放大器353施加至接收衰减器407的输入。接收衰减器407进一步放大nmr信号;并且衰减由从背板318接收的数字衰减信号(ra)确定的量。接收衰减器407也被来自脉冲生成器模块321的信号导通和截止,使得其在rf激励期间不会过载。
90.接收到的nmr信号处于或接近larmor频率,在一些实施方案中,对于1.5特斯拉,larmor频率约为63.86mhz。该高频信号由下变频器408在以下两步过程中向下变频:首先将nmr信号与线路401上的载波信号混合,然后将所得差异信号与线路404上的2.5mhz参考信号混合。在线路412上产生的下变频的nmr信号具有最大125khz的带宽,并且其中心频率为187.5khz。
91.下变频的nmr信号被施加至模数(a/d)转换器409的输入端,该转换器以250khz的速率对模拟信号进行采样和数字化。a/d转换器409的输出被施加至数字检测器和信号处理器410,其产生对应于接收到的数字信号的16位同相(i)值和16位正交值(q值)。接收到的nmr信号的数字化i值和q值的结果流通过背板318输出至将它们用来重建图像的存储模块360。
92.为了保留接收到的nmr信号中包含的相位信息,激励部中的调制器和上变频器402以及接收部中的下变频器408都使用共用信号来操作。更具体地,在两个频率转换过程中都使用频率合成器400的输出端401处的载波信号和参考频率生成器403的输出端404处的2.5mhz参考信号。因此保持了相位一致性,并且检测到的nmr信号中的相位变化准确地示出了由激励自旋产生的相变。2.5mhz参考信号以及5mhz、10mhz和60mhz参考信号由参考频率生成器403从共用20mhz主时钟信号产生。后三个参考信号被频率合成器400用来在输出端401上产生载波信号。接收器的示例包括美国专利第4,992,736号公开的内容,其通过引入合并与此。
93.示例1:参数选择
94.响应于处理和/或预处理mri数据的常规系统和方法的局限性,本公开提供了一种用于选择最佳fmri预处理管道参数的自动搜索方法。所公开的系统和方法的实施方案已经在两个独立的数据集上得到验证。
95.例如,从两个公开可用的mri数据集cnp la5c1(n=251)和embarc2(n=330)中,使用72个不同的参数集预处理mri数据。这是由于所公开的技术能够大规模地并且通过基于afni的云计算(cloud-enabled)管道执行并行fmri预处理。这72个参数集是通过改变通常需要人工优化的四个不同参数创建的——两个来自结构功能对齐步骤,且两个来自头颅骨剥离步骤。
96.对于每个受试者的72个管道输出中的各者,基于矩阵之间成对差异的frobenius范数,生成全脑功能性连通(fc)矩阵并且通过相似性将其分组成簇。用于对矩阵进行分组的相似性阈值设置为最小值,以便找到占主导地位的稳定的簇,这由两个最大簇之间的大小比至少为2比1来表示。针对每个受试者的参数的最大簇的质心被选为我们的预测以通过qc并且算法生成的预测使用来自专家评审员的视觉qc得到验证。
97.将自动参数预测方法与对两个独立的数据集中的受试者使用单一、专家选择的参数集的控制方法进行比较。在没有我们的预测方法的情况下,给定评审员相同量的工作,选择控制方法作为结果的估计。使用从各数据集中随机选择的50个受试者,自动参数预测方法使92%的受试者通过了cnp的视觉qc并且80%的受试者通过了embarc的,而控制方法针对cnp仅通过了62%的受试者并且针对embarc通过了70%。
98.示例2:用以参数选择的针对qc的并行处理
99.在本公开的一些实施方案中,对接收到的mri数据进行预处理可以包括并行处理。结构和功能mri扫描的预处理是一项计算密集型操作,每个受试者通常需要几个小时。这导致mri数据采集和分析之间的等待时间过长,特别是在具有数百个受试者的大型数据集中,并且尤其是在使用诸如高性能工作站单元等传统计算机基础设施执行计算时。
100.本公开提供用于云计算的和/或大规模的并行mri预处理管道。并行预处理可以包括任何合适的并行处理技术。在一些实施方案中,该方法每天提供平均超过150次扫描的预处理。例如,在某些实施方案中,可以使用freesurfer和afni软件套件(software suite)构建预处理管道。管道可以获取原始结构和/或静息态函数mri数据,并且输出分割的和/或体素级预处理时间序列以及函数连通矩阵。
101.在一些实施方案中,在使用管道之前可以采取几个步骤来预处理原始数据。这些步骤包括:结构预处理、去尖峰、运动校正、颅骨剥离、结构图像和功能图像之间的配准、空间平滑、通过平均信号归一化、干扰信号回归、对mni空间的归一化等,或它们的任何组合。所公开的管道遵循脑成像数据结构(bids)标准,并且可以用作云服务;其包括在aws s3中按需检索和存储文件以及在需要最少支持的docker容器中执行。所公开的管道还与aws batch兼容,使得使用基于云的簇环境并行预处理完整数据集。
102.在所公开的管道的一个实验实施方案中,对来自以下数据集的静息态扫描进行预处理:abide i、cnp和embarc。所公开的管道在43小时内对cnp数据集进行了预处理(n=251,5.8个受试者/小时);在42小时内对embarc数据集进行了预处理(n=326,7.7个受试者/小时);并且在在80小时内对abide i数据集进行了预处理(n=1056,13.2个受试者/小时)。容器化管道代码在每个容器的ram限制为8gb的“c5”aws ec2计算机上执行。这些结果
是在使用达到1300个并发aws ec2 vcpu的限制下获得的。
103.因此,所公开的mri预处理管道是通过创建具有最小离线足迹和长期成本的灵活的按需高性能计算基础设施,将最新技术引入神经影像分析的向前的一步。重要地,针对完整mri数据集的端到端预处理时间的显着减少使得科学家能够研究参数变化的影响和敏感性,并且为在mri数据集之间的大数据(包含数千个受试者的数据集)分析打开了大门。
104.示例3:基于自动化qc的机器学习
105.在过去的二十五(25)年中,在功能性磁共振成像(fmri)数据的收集和分析的进步使得人们对人类健康和疾病的大脑基础有了新的认识。现在可以在神经层面将个体行为变化可视化为大脑区域之间的连接模式。因此,功能性脑成像通过揭示区域和网络异常与精神症状之间的联系,增强了我们对临床精神疾病的理解。
106.最近该领域的初步成功已促使收集更大的数据集,这些数据集需要利用fmri来生成基于大脑的生物标志物,以支持精准药物的开发。尽管方法学使计算能力进步和增强,但评估fmri扫描质量仍然是分析框架中的关键步骤。在进行分析之前,专家评审员视觉地检查各个原始扫描和预处理的衍生物,以确定数据的可行性。这种qc过程是劳动密集型的,并且无法大规模地充分自动化已被证明是临床神经科学的一个限制因素。
107.例如,原始fmr图像在用于任何统计分析之前必须经过一组复杂的计算变换,通常称为预处理。这些原始图像和预处理图像通常由专家评审员在称为质量控制/qc的过程中人工评估质量。这些评审员通常分多个步骤,将预处理图像可视化,并且检查它们是否存在明显错误,这些错误可能会错误地影响未来的分析。已经提出了许多针对qc的评估方案。然而,仍然需要一种简单、清晰的策略来确定扫描是通过并且因此可用,还是扫描失败并且从进一步分析中丢弃。因此,本公开满足了这种需要和其他需要。
108.qc的劳动密集型和耗时性是大规模fmr图像分析的瓶颈。在开始分析之前,单个专家评审员可能需要数周到数月对包括数百次扫描的fmri数据集的qc进行人工评估。正如本文所讨论的,许多最近的fmri研究已经收集了达到或甚至高于该规模的数据,为开发可扩展的qc框架提供了令人信服的动力,以减轻个体研究人员的负担并且标准化fmri数据的质量控制。因此,本公开提供了这种可扩展的qc框架。
109.因此,公开了用于使mr扫描的qc自动化的技术。例如,在某些实施方案中,机器学习分类器使用源自大脑mr图像的特征进行训练,以预测这些图像的质量,这是基于专家意见的基本事实。通常,专业qc评审员检查原始mri扫描和预处理的图像,以确定质量是否足以进行进一步分析。对于体积数据,3d预处理的mr图像在空间上采样为2d图像,以便于评审员的评估。
110.参照图8,qc“通过”和“失败”的2d图像示例显示了诸如结构和功能mri扫描未对准或自动去除非脑组织失败等常见的失败点。在一些示例中,在原始数据的图像质量的评估和跨多个预处理步骤后,评审员针对各受试者的fmri扫描做出二进制“通过”或“失败”决定。因此,fmri扫描被标记为可用(通过)或不可用(失败),并且这些标签用作基本事实的决策,以该决策训练所公开的分类器。
111.这些分类器在从额外研究收集的数据上进行测试(例如,不同于用于训练分类的那些)。使用分类器的预测能够在来自不同研究的跨数据中进行泛化。这一点特别重要,因为以前自动化qc泛化的尝试很差。此外,还没有将自动化qc框架应用于fmri数据的已知尝
试。
112.此外,自动化qc分类器被应用于两个大型开源fmri数据集。分类器包括题为“fmri preprocessing log mining for automated,generalizable quality control(用于自动化、可泛化质量控制的fmri预处理日志挖掘)”(flag-qc)用于评估一系列特征集。具体地,评估了这些分类器泛化不同研究中收集的跨fmri数据的能力。结果证明:仅使用本公开(本文讨论的基于日志的特征)中提出的新颖的flag-qc特征,分类器能够实现这种泛化。
113.现在参照图5,示出了流程图并且示出了用于预测一组mr图像中的哪些图像将通过质量控制的方法的示例。该方法可以利用作为本文公开的预处理方法的结果生成的某些参数作为用于每个图像的机器学习模型的输入参数。在其他实施方案中,该方法可以利用标准参数来处理mri数据。
114.首先,可以接收原始的、未处理的mr数据(步骤500),即,例如,从扫描仪输出的和/或存储在数据库中的。此外,例如,原始mr数据可以被预处理(步骤510)成图像。如果图像是功能性磁共振图像(fmri),基于正在创建的图像类型这可以包括各种步骤,包括颅骨剥离步骤503和/或结构性-功能性对齐步骤502。在预处理步骤中,可以输出(步骤530)作为结果或预处理期间创建的各种特征。
115.这些特征可以包括日志数据511、预处理513的各个步骤的运行时间、大脑坐标515、与结构性-功能性对齐相关的成本或误差值517、对图像进行编辑的数量519、图像拍摄的角度521、或其他,或它们的组合。此外,预处理后的图像(来自步骤520)和/或预处理特征(来自步骤530)或其他特征可以被输入到机器学习模型540中以输出预处理图像550的图像质量。
116.机器学习模型540可以包括支持向量机505、梯度增强机507、随机森林509或其他合适的机器学习模型,或它们的任何组合。在一些实施方案中,所使用的机器学习模型540包括针对输出的预处理后图像520的通过523或失败525的分类,和/或它是否适合处理成fmr图像。在一些实施方案中,机器学习模型540可以输出预处理后图像的图像质量的量化评估,诸如图像质量分数527等。在一些实施方案中,可以使用用作结果标签的来自人类评审员的人工qc审查评级的数据训练机器学习模型540。
117.参数选择相关的特征
118.除了预处理特征530(例如日志文件)之外,可以用作输入到机器学习模型540的其他特征可以包括,使用参数选择,而不是使用标准mr参数进行数据采集的示例中使用的以下特征中的至少一者或多者:
119.·
最终簇包含阈值;
120.·
最大簇中的参数集数量;
121.·
两个最大簇中参数集数量的比率;
122.·
簇大小中的参数集数量》1;
123.·
以及其他。
124.如图6a-图6c所示,使用参数相关特征作为机器学习模型的输入在示例数据集上对所公开的用于自动化qc的技术进行了测试。如图所示,这些模型在执行自动化qc功能时具有良好的准确度(约80%)。在一些示例中,(i)识别用于预处理mr图像的最佳参数和(ii)使用这些参数和相关特征作为机器学习算法的输入以自动地通过或拒绝mr图像的组合使
得能够可靠地预测哪些图像将通过人工qc。在一些示例中,自动化qc系统和方法成功地应用于全脑功能性连通mri数据。
125.mri预处理特征
126.在一些示例中,由斯坦福大学poldrack实验室软件(mriqc)生成的特征可以用作所公开的机器学习模型的输入。mriqc是由斯坦福大学poldrack实验室开发的软件。其特征之一是能够从原始mr图像生成图像质量度量。这些图像质量指标(iqms)用于预测smri扫描上的人工qc标签。这些指标被指定为“无参考”,或者没有基本真实的正确值。相反,可以根据这些特征在其他图像集上的分布来判断从一个图像产生的指标。mriqc从结构性和功能性两者的原始图像中生成iqms。
127.结构性iqms分为四类:基于噪声水平的度量、基于信息论的度量、针对特定伪影(artifact)的度量以及其他三类未具体覆盖的度量。功能性iqms分为三类:用于空间结构的度量、用于时域结构的度量以及伪影等的度量。总共有112个由mriqc生成的特征,68个结构性特征和44个功能性特征。在mriqc.readthedocs.io上可以找到由mriqc生成的特征的完整列表。该软件可以作为python库或docker容器运行。本公开使用docker版本以在embarc和cnp上生成iqms。
128.作为分类器特征的日志文件
129.现在参照图7,其示出了流程图并且示出了用于预测一组mr图像中的哪些图像将通过质量控制的方法的另一示例。图7所示的方法与图5所示的方法相同或相似,其中相同的参考标号指代相同的元件。
130.在步骤500中,接收未处理的mri数据。在步骤510中,对接收到的mri数据进行预处理。预处理的mri数据然后作为预处理图像(步骤520)和/或作为预处理日志(步骤600)输出。在输出预处理日志(步骤600)之后,在步骤610中执行自动日志解析。在步骤620中可以识别特征,该步骤可以包括特征选择(602)和/或预定义密钥(605)。
131.预处理的图像(来自步骤520)和/或识别的特征(来自步骤620)可以被输入到机器学习模型540中,机器学习模型540然后输出预处理图像的图像质量(步骤550)。
132.因此,从mri预处理管道(例如,图7中所示的步骤和元素)输出的各种运行时日志被用作机器学习模型(例如,机器学习模型540)的输入特征。mri系统在系统运行时(包括在预处理期间)将事件写入日志文件。在一些示例中,特征源自在fmri预处理管道期间运行的afni软件注释。这些命令负责将fmri数据转换为经过人工qc的最终输出。当正在执行afni命令(例如)时,它会输出运行时日志。
133.在一些示例中,这些运行时日志可以被复制并且保存到文本文件或其他文件类型中。这些日志包含大量各种各样的信息,其中一些与给定命令的最终或中间步骤的结果有关。当对fmr图像进行预处理时,日志可以包括与结构图和功能图的对齐之间的成本或差异有关的数据。这些终端命令行日志可以预测图像的预处理情况如何。
134.在一些示例中,日志相关的fmri特征可以分为四个子组:步骤运行时、体素计数、大脑坐标和其他指标。步骤运行时特征量化了管道中给定步骤或步骤集运行花费的时间。体素计数特征根据“体素”或体积3d像素测量管道中给定步骤的输出大小。大脑坐标特征仅指大脑图像边界框的x坐标、y坐标和z坐标。其他指标是量化预处理管道某个步骤的结果的杂项值。
135.这些其他指标中的一个示例是与管道的对齐结构和功能扫描的步骤相关联的成本函数值。在一些示例中,可能有5、10、15、20、30、35、38、42或更多日志相关特征。
136.图10示出了在患者的fmri扫描的预处理期间(例如,图7中的步骤600)输出的运行时日志文本文件的示例。突出显示的部分是标识为所公开的机器学习模型的输入的特征。
137.从日志文件中自动解析和特征选择
138.在一些实施方案中,mr预处理日志文件可以被自动解析(例如,使用用python或类似编程语言的脚本)以标识特征(例如,图7的步骤600至步骤620)。例如,python正则表达式库可用于解析文本文件,并且提取潜在的信息特征。在一些实施方案中,这可以包括识别所有潜在特征(例如,620),以及使用特征选择过程(例如,602)来从日志文件中标识最相关的特征。因此,使用这些实施方案,如果日志文件是基于文件,诸如.csv、xls、.doc等或其他文件的文本,该技术可以自动搜索数字和相邻文本。这些数字可以输入到数据库或其他存储器中,并带有对附近文本的类别或说明符的引用或标签。
139.此外,可以利用各种方法来去除不是好的特征的数字,例如通过过滤患者之间具有较小差异的数字。此外,与机器学习模型相关的各种特征选择方法可以用于通过它们的文本标签(基于相邻文本)来标识最重要的特征。
140.例如,应用了与模型无关的方法。具体地,可以使用基于hilbert-schmidt independence criterion lasso(希尔伯特-施密特独立标准lasso,hsic lasso)的特征选择。hsic lasso利用特征核化lasso捕捉非线性输入-输出依赖。可以有效地计算全局最优方案使这种方法在计算上便宜。
141.在第二阶段,应用了依赖模型的前向选择方法。在一些示例中,选择两阶段方法是因为它在分类器性能、快速计算和泛化(generalization)之间提供了良好的平衡。所选特征的实际数量取决于交叉验证性能。
142.此外,一旦特定的mr处理管道及其相关联的日志文件已经被完全处理以标识最佳特征,就可以使用这些特征来训练机器学习模型。因此,例如,对于使用相同管道扫描的每个新患者,该模型可以用于处理与各图像相关联的日志文件,并且标识可能通过人工qc的图像。
143.分类器的实验测试
144.在一些示例中,使用数据测试所公开的基于方法的日志。具体地,使用了一种名为“fmri preprocessing log mining for automated,generalizable quality control(用于自动化、可泛化的质量控制的fmri预处理日志挖掘)”(flag-qc)的方法,其中使用从挖掘运行时日志中导出的特征来训练并且作为分类器的输入。实验数据表明,在测试它们在跨研究中的泛化能力时,在flag-qc特征上训练的分类器表现(auc=0.79)得比之前提出的特征集(auc=0.56)好得多。
145.为了证明所公开技术的有效性,使用了从两项独立研究中获得的fmri扫描:(1)建立抑郁症临床护理的抗抑郁反应的调节剂和生物特征(establishing moderators and biosignatures of antidepressant response for clinical care for depression,embarc),(2)ucla神经精神表型组学研究联合体la5c(cnp)。这些数据与不同的特征集一起使用。
146.用于训练qc分类器的特征来自两个不同的管道:(1)flag-qc特征,对本研究来说
新颖的特征集,和(2)mriqc特征(例如,由mriqc软件套件生成的特征)。在图9中示出了显示用于创建各组特征的过程的高级框图。本文中已经说明flag-qc和mriqc特征。
147.embarc
148.收集embarc数据集以检查抑郁症患者的一系列生物标志物,以了解他们如何能够为临床治疗决策提供信息。该研究招募了336名18-65岁的患者,在14周内针对多次就诊收集人口统计学、行为学、影像学和湿性生物标志物测量值。数据于2018年6月19日从国家数据档案馆(nda)存储库中获取,并获得blackthorn therapeutics的许可。
149.所公开的研究仅分析来自患者第一次和第二次到研究地点就诊期间收集的smri和fmri扫描的数据。具体地,使用了t1加权结构mri扫描和t2*加权血氧水平依赖(bold)静息态函数mri扫描,并且标签为运行1。总共,对来自第一次就诊的324个结构功能mri对扫描以及来自第二次就诊的288个结构功能mri对扫描进行了分析,总共产生了612对扫描对。
150.cnp
151.收集cnp数据集是为了便于发现心理和神经系统表型变异的遗传和环境基础,以阐明将人类基因组与复杂心理综合征联系起来的机制,并且促进用于神经精神疾病的新疗法开发的突破。该研究共招募了272名年龄在21-50岁之间的参与者。在参与者组中,有138名健康人,58人被诊断为精神分裂症,49人被诊断为双相情感障碍,以及45人被诊断为多动症(adhd)。所有数据均在每位参与者的单次就诊中收集,并且包括人口统计学、行为学和影像学测量值。
152.与embarc类似,使用来自具有t1加权smri和t2*加权bold静息态fmri扫描的参与者的数据,并且标签为运行1。这相当于251个结构功能mri扫描对。
153.使用这两项研究,证明了所公开的分类器可以在使用上述任何特征集的一个数据源内准确地预测fmri扫描上的人工qc标签,但只有基于特征集的日志成功地泛化到另一独立研究的数据。从同一研究中收集的数据将被称为“数据集内”样本,而从未训练的给定模型的研究中收集的数据将被称为“未知研究”数据。
154.为了预测fmri qc标签,使用sci-kit learn python库评估了四种不同的预测模型:(1)逻辑回归,(2)支持向量机(svm),(3)随机森林,以及(4)梯度增强分类器。使用5折网格搜索交叉验证为svm、随机森林和梯度增强模型调整了超参数。表1示出了从“数据集内”和分类结果中选择特征的汇总。
[0155][0156]
[0157]
表1:数据集内前向特征选择分类结果汇总
[0158]
在一些示例中,对在单个研究中收集的数据集中保留的扫描集预测人工qc标签。在本文提到的标签为“flag-qc”、“mriqc,功能”和“mriqc,结构”的三个特征集的各者以及标签为“所有特征”的全体成员上分别地训练和测试逻辑回归、svm、随机森林和梯度增强分类器。为此,在5折(5-fold)交叉验证方案中评估各特征模型对,首先使用hsic lasso来降低特征空间的维数。此外,运行前向特征选择,并且报告每个选定特征数量的所有折(fold)的平均auc。在图11a至图11d中显示了针对embarc数据集使用这些方法的结果,并且在表1中显示了针对embarc和cnp数据集的汇总结果。
[0159]
在embarc数据集中,在向前特征选择之后,发现flag-qc特征集达到了0.89的auc。其他单个特征集的表现稍差,mriqc功能特征的auc为0.86,mriqc结构特征的auc为0.86。还观察到的是,通过将所有特征一起使用,创建具有最佳性能的分类,达到0.90的auc。然而,观察到的是,在各特征集上表现最好的模型存在易变性,所有模型在所有特征集上都表现得相当好,且最低的特征模型auc为0.83(mriqc,结构-svm)。
[0160]
在cnp数据集上重复相同的过程,结果是flag-qc(svm)的auc为0.93;mriqc功能特征(svm)的为0.79;mriqc,结构(随机森林)的为0.85以及集成特征集(svm)的为0.97。从flag-qc特征优于mriqc特征集(尽管这次幅度更大)也看到了类似的模式,并且所有特征集的组合优于任何单个特征集。同样,所有特征模型对都表现得相当准确(使用梯度增强的mriqc功能特征的最小auc为0.77)。
[0161]
未知研究数据集作为测试集
[0162]
相同的建模框架也被应用于预测一个数据集上的qc标签,同时在从完全地独立的研究收集的数据上训练分类器。在该示例中,来自embarc数据集的所有612个标签扫描都用作训练集。因此,通过前向特征选择在数据集交叉验证预测中使用来自embarc的结果来选择将在测试集cnp上评估的模型。对于各特征集,选择具有最高auc的分类器。表1示出了为各特征集选择的分类器。
[0163]
在各特征集中,再次开始:通过在训练数据集上运行hsic lasso以进行初始模型独立特征选择,然后执行前向特征选择以选择在cnp数据上测试的最终特征集。最后,执行最后一次5折cv参数网格搜索,以专门针对最终选择的特征集调整和训练模型。使用这个框架,预测来自cnp数据集扫描的人工qc标签来评估模型的性能。
[0164]
当对来自cnp数据集的未知研究数据进行预测时,flag-qc特征比任何其他特征集表现得更好,达到0.79的auc,如表2所示。
[0165]
指标flag-qc日志mriqc功能mriqc结构所有特征auc0.790.560.560.64准确性74.90%61.35%56.57%64.54.%精确度0.720.620.590.64招回率0.950.850.830.93
[0166]
表2:分类器指标
[0167]
在图12a至图12d中显示的来自这些预测的roc曲线以及表2清楚地显示了本公开的新颖特征集与先前提出的那些特征集之间的性能差异。在看不见的研究中,单个mriqc特征集表现更差,每个仅达到0.56的auc。此外,表现第二好的特征集是auc为0.64的“所有特
征”。这组课程包含flag-qc特征,进一步突出了flag-qc特征在分类器的泛化跨数据集的能力中的重要性。与包含mriqc特征的所有模型相关的未知研究预测的性能的显著下降意味着与flag-qc相比,这些特征可能导致训练集上更大的过拟合。使用flag-qc特征获得的结果证明了所公开的分类器在预测未知研究中的fmri qc标签方面的泛化能力。
[0168]
额外的实施方案
[0169]
根据本公开的一些实施方式,分析mri数据的方法包括接收与生物结构的mr图像集相对应的未处理的mri数据。对所接收的mri数据进行预处理,其中,预处理包括:(i)对mr图像集中的各mr图像执行结构-功能对齐;(ii)执行颅骨剥离过程;和(iii)输出与预处理相关的多个参数集。基于多个参数集生成多个函数连通矩阵。识别多个函数连通矩阵中的相似矩阵以产生多个矩阵簇。选择多个矩阵簇的主要簇。输出与主导矩阵相对应的多个参数集的参数子集。
[0170]
在一些实施方式中,识别相似矩阵还包括确定多个函数连通矩阵中的矩阵之间的成对差异的frobenius范数。当所确定的frobenius范数小于阈值时,将多个函数连通矩阵中的矩阵分组为子集簇。将子集簇输出到多个矩阵簇中。在一些这样的实施方式中,识别相似矩阵还包括:增大阈值直至多个矩阵簇中最大簇的大小是多个矩阵簇中第二大簇的大小的两倍。
[0171]
在一些实施方式中,多个参数集对应于多个参数中与功能-结构对齐和颅骨剥离过程中的至少一者相关联的的四个参数。
[0172]
在一些实施方式中,输出的参数子集对应于主簇的质心。
[0173]
在一些实施方式中,用输出的参数子集处理所接收的mri数据,以产生一组处理过的mr图像。
[0174]
在一些实施方式中,所接收的mri数据对应于受试者的mri数据。
[0175]
在一些实施方式中,扫描受试者的大脑以输出mr图像集。
[0176]
根据本公开的一些实施方式,用于分析mri数据的系统包括存储器和控制系统。存储器包含机器可读介质,其包括机器可执行代码,其上存储有用于执行方法的指令。控制系统耦合到存储器,并且包括一个或多个处理器。控制系统被配置为执行机器可执行代码以使得控制系统接收与生物结构的一组mr图像相对应的未处理的mri数据。对接收的mri数据进行预处理,其中预处理包括(i)对一组mr图像中的每个mr图像执行结构功能对齐,(ii)执行颅骨剥离程序,以及(iii)输出多个与预处理相关的参数集。基于多个参数集生成多个函数连通矩阵。识别多个函数连通矩阵中的相似矩阵以产生多个矩阵簇。选择多个矩阵簇中的主簇。输出对应于主导矩阵的多个参数集合的参数子集。
[0177]
根据本公开的一些实施方案,非暂时性机器可读介质在其上存储用于执行方法的指令。非暂时性机器可读介质包括机器可执行代码,该代码在由至少一个机器执行时使机器接收与生物结构的一组mr图像对应的未处理的mri数据。对接收的mri数据进行预处理,其中预处理包括:(i)对一组mr图像中的每个mr图像执行结构功能对齐,(ii)执行颅骨剥离程序,以及(iii)输出多个与预处理相关的参数集。基于多个参数集生成多个函数连通矩阵。识别多个函数连通矩阵中的相似矩阵以产生多个矩阵簇。选择多个矩阵簇中的主簇。输出对应于主导矩阵的多个参数集合的参数子集。
[0178]
根据本公开的一些实施方案,用于分析mri数据的系统包括存储器和控制系统。存
储器包含机器可读介质,其包括机器可执行代码,其上存储有用于执行方法的指令。控制系统耦合到存储器,并且包括一个或多个处理器。控制系统被配置为执行机器可执行代码以使得控制系统接收与生物结构的一组mr图像相对应的未处理的mri数据。对接收的mri数据进行预处理,其中预处理包括:(i)对一组mr图像中的每个mr图像执行结构功能对齐,(ii)执行颅骨剥离程序,以及(iii)输出多个与预处理相关的参数集。基于多个参数集生成多个全脑功能性连通矩阵。识别多个全脑功能性连通矩阵中的相似矩阵以产生多个矩阵簇。选择多个矩阵簇中的主簇。输出与主簇对应的多个参数集的参数子集。使用机器学习模型,处理与基于参数子集的该组mr图像相关联的一组特征以确定预测通过质量控制的该组mr图像的子集。
[0179]
在一些实施方案中,机器学习模型包括逻辑回归、支持向量机、随机森林模型或其任何组合。
[0180]
在一些实施方案中,该组特征包括最终簇包含阈值、最大簇中的参数集数量、最大簇和第二大簇中的参数集数量之比、簇大小大于1的参数集数量或其任意组合。
[0181]
在一些实施方案中,机器学习模型使用基于人工qc评级的结果标签来训练。
[0182]
在一些实施方案中,该特征集包括来自mri预处理运行时日志的数据集。
[0183]
在一些实施方案中,控制系统还被配置为用参数的输出子集处理另外接收的未处理的mri数据,以产生一组处理的mr图像。
[0184]
公开的计算机和硬件实施方案
[0185]
最初应该理解,这里的公开可以用任何类型的硬件和/或软件来实现,并且可以是预编程的通用计算设备。例如,该系统可以使用服务器、个人计算机、便携式计算机、瘦客户端或任何合适的设备或多个设备来实现。本公开和/或其组件可以是位于单个位置的单个设备或者是位于单个或多个位置的多个设备,这些设备使用任何适当的通信协议通过任何通信介质(例如电缆、光纤电缆)或以无线方式连接。
[0186]
还应当注意的是,本公开在本文中被图示和讨论为具有执行特定功能的多个模块。应理解,这些模块仅为了清楚起见,仅基于其功能示意性地示出,并不一定代表具体的硬件或软件。在这点上,这些模块可以是硬件和/或软件,其被实现以基本上执行所讨论的特定功能。此外,模块可以在本公开内容内组合在一起,或者基于期望的特定功能划分为附加模块。因此,本公开不应被解释为限制本发明,而仅应被理解为说明本发明的一个示例实施方案。
[0187]
计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离并且通常通过通信网络进行交互。客户端和服务器的关系是由于在各自的计算机上运行的计算机程序而产生的,并且彼此之间具有客户端-服务器关系。在一些实现方式中,服务器将数据(例如,html页面)传输到客户端设备(例如,出于向与客户端设备交互的用户显示数据和从与客户端设备交互的用户接收用户输入的目的)。可以在服务器处从客户端设备接收在客户端设备处生成的数据(例如,用户交互的结果)。
[0188]
本说明书中说明的主题的实现可以在包括后端组件(例如,作为数据服务器)或包括中间件组件(例如,应用服务器)或包括前端组件(例如,具有图形用户界面或web浏览器,用户可以通过它与本说明书中说明的主题实现交互)或者一个或多个这样的后端、中间件或前端组件的任意组合的计算系统中实现。系统的组件可以通过任何形式或媒介的数字数
据通信互连,例如通信网络。通信网络的示例包括局域网(“lan”)和广域网(“wan”)、网络间(例如,因特网)和对等网络(例如,ad hoc对等网络)。
[0189]
本说明书中说明的主题和操作的实现可以在数字电子电路中实现,或在计算机软件、固件或硬件中实现,其包括本说明书中公开的结构及其结构等效物或它们的一种或多种组合。本说明书中说明的主题的实施可以被实现为一个或多个计算机程序,即,一个或多个计算机程序指令模块,其编码在计算机存储介质上以供数据处理设备执行或控制数据处理设备的操作。替代地或另外地,程序指令可以被编码在手动生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以对信息进行编码以传输到合适的接收器装置以供数据处理装置执行。计算机存储介质可以是或被包括在计算机可读存储设备、计算机可读存储基板、随机或串行存取存储器阵列或设备、或它们中的一个或多个组合中。此外,虽然计算机存储介质不是传播信号,但计算机存储介质可以是编码在手动生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质还可以是或被包括在一个或多个单独的物理组件或介质(例如,多个cd、磁盘或其他存储设备)中。
[0190]
本说明书中说明的操作可以实现为“数据处理装置”对存储在一个或多个计算机可读存储设备上或从其他来源接收的数据执行的操作。
[0191]
术语“数据处理装置”包括用于处理数据的所有种类的装置、装置和机器,例如包括可编程处理器、计算机、片上系统、或前述装置中的多个或组合。上述装置可以包括专用逻辑电路,例如fpga(现场可编程门阵列)或asic(专用集成电路)。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或它们中的一个或多个组合的代码。装置和执行环境可以实现各种不同的计算模型基础设施,例如网络服务、分布式计算和网格计算基础设施。
[0192]
计算机程序(也称为程序、软件、软件应用程序、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言、说明性或过程性语言,并且它可以以任何形式设置,包括作为独立程序或作为模块、组件、子程序、对象或其他适用于计算环境的单元。计算机程序可以但不必对应于文件系统中的文件。程序可以存储在包含其他程序或数据的文件的一部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于相关程序的单个文件或多个协同文件(例如、存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以设置为在一台计算机上执行,也可以在位于一个站点或分布在多个站点并通过通信网络互连的多台计算机上执行。
[0193]
本说明书中说明的过程和逻辑流程可由一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行动作。过程和逻辑流程也可以由专用逻辑电路,例如,fpga(现场可编程门阵列)或asic(专用集成电路),来执行,并且装置也可以通过专用逻辑电路来实现。
[0194]
适合于执行计算机程序的处理器包括例如通用和专用微处理器以及任何种类的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是根据指令执行操作的处理器和用于存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备(例如,磁光盘、磁光碟或光盘),或计算机可操作地耦合以从一个或多个用于存储数
据的大容量存储设备(例如,磁光盘、磁光碟或光盘)接收数据或将数据传送到这些设备或两者。然而,计算机不需要有这样的设备。此外,计算机可以嵌入到另一个设备中,例如移动电话、个人数字助理(pda)、移动音频或视频播放器、游戏机、全球定位系统(gps)接收器或便携式存储设备(例如,通用串行总线(usb)闪存驱动器),仅举几例。适用于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储设备,例如包括半导体存储设备,例如eprom、eeprom和闪存设备;磁盘,例如内置硬盘或可移动磁盘;磁光盘;和cd rom和dvd-rom磁盘。处理器和存储器可由专用逻辑电路补充或合并到专用逻辑电路中。
[0195]
参考文献
[0196]
alfaro-almagro,f.;et al.2018.image processing and quality control for the first 10,000 brain imaging datasets from uk biobank.neuroimage 166:400-424.
[0197]
casey,b.;et al.2018.the adolescent brain cognitive development(abcd)study:imaging acquisition across 21 sites.developmental cognitive neuroscience 32:43-54.the adolescent brain cognitive development(abcd)consortium:rationale,aims,and assessment strategy.
[0198]
cox,r.w.1996.afni:software for analysis and visualization of functional magnetic resonance neuroimages.computers and biomedical research 29(3):162-173.
[0199]
cremers,h r.;wager,t.d.;and yarkoni,t.2017.the relation between statistical power and inference in fmri.plos one 12(11):1-20.
[0200]
di martino,a.;et al.2014.the autism brain imaging data exchange:towards a large-scale evaluation of the intrinsic brain architecture in autism.molecular psychiatry 19(6):659-667.
[0201]
drysdale,a.t.;et al.2016.resting-state connectivity biomarkers define neurophy siological subtypes of depression.nature medicine 23:28 ep-.article.
[0202]
essen,d.v.;et al.2012.the human connectome project:a data acquisition perspective.neuroimage 62(4):2222-2231.connectivity.
[0203]
esteban,o.;et al.2017.mriqc:advancing the automatic prediction of image quality in mri from unseen sites.plos one 12(9):1-21.
[0204]
fischl,b.;et al.2002.whole brain segmentation:auto-mated labeling of neuroanatomical structures in the human brain.neuron 33(3):341-355.
[0205]
gao,s.;calhoun,v.d.;and sui,j.2018.machine learning in major depression:from classification to treatment outcome prediction.cns neuroscience&therapeutics 24(11):1037-1052.
[0206]
hastie,t.;tibshirani,r.;and friedman,j.2009.the elements of statistical learning:data mining,inference,and prediction.springer.
[0207]
liu,y.;et al.2018.highly predictive transdiagnostic features shared across schizophrenia,bipolar disorder,and adhd identified using a machine learning based approach.biorxiv.
[0208]
liu,y.;et al.2019.machine learning identifies large-scale reward-related activity modulated by dopaminergic enhancement in major depression.biological psychiatry:cognitive neuroscience and neuroimaging.
[0209]
lu,w.;dong,k.;cui,d.;jiao,q.;and qiu,j.2019.quality assurance of human functional magnetic resonance imaging:a literature review.quantitative imaging in medicine and surgery 9(6).
[0210]
mellem,m.s.;et al.2018.machine learning models identify multimodal measurements highly predictive of transdiagnostic symptom severity for mood,anhedonia,and anxiety.biorxiv.
[0211]
mortamet,b.;et al.2009.automatic quality assessment in structural brain magnetic resonance imaging.magnetic resonance in medicine 62(2):365-372.
[0212]
pizarro,r.a.;et al.2016.automated quality assessment of structural magnetic resonance brain images based on a supervised machine learning algorithm.frontiers in neuroin formatics 10:52.
[0213]
poldrack,r.a.;et al.2016.a phenome-wide examination of neural and cognitive function.scientific data 3(1):160110.
[0214]
reuter,m.2013.freesurfer.
[0215]
soares,j.m.;et al.2016.a hitchhiker’s guide to functional magnetic resonance imaging.frontiers in neuroscience 10:515.
[0216]
trivedi,m.h.;et al.2016.establishing moderators and biosignatures of antidepressant response in clinical care(embarc):rationale and design.journal of psychiatric research 78:11-23.
[0217]
woodard,j.p.,and carley-spencer,m.p.2006.
[0218]
no-reference image quality metrics for structural mri.neuroinformatics 4(3):243-262.
[0219]
yamada,m.;jitkrittum,w.;sigal,l.;xing,e.p.;and sugiyama,m.2014.high-dimensional feature selection by feature-wise kernelized lasso.neural computation 26(1):185207.
[0220]
结论
[0221]
上述的各种方法和技术提供了实施本发明的多种方式。当然,应当理解,根据本文所述的任何特定实施方案,不一定能够实现所说明的所有目标或优点。因此,例如,本领域技术人员将认识到,可以以实现或优化如本文所教导的一个优势或一组优势的方式执行该方法,而不必实现如本文所教导或建议的其他目标或优势。这里提到了多种替代方案。应当理解,一些实施方案具体地包括一个、另一个或几个特征,而其他实施方案具体地排除一个、另一个或几个特征,而还有一些实施方案通过包括一个、另一个或几个有利特征来减轻特定特征。
[0222]
此外,技术人员将认识到来自不同实施方案的各种特征的适用性。类似地,本领域普通技术人员可以以各种组合使用以上讨论的各种要素、特征和步骤以及每个这样的要
素、特征或步骤的其他已知等效物,以执行根据所述原理的方法。在此处。在各种元素、特征和步骤中,一些将被特别包括在不同的实施方案中,而另一些将被明确排除在外。
[0223]
尽管在某些实施方案和示例的上下文中公开了本技术,但是本领域技术人员将理解,本技术的实施方案超出具体公开的实施方案扩展到其他替代实施方案和/或使用和修改及其等价物。
[0224]
在一些实施方案中,在说明本技术的特定实施方案的上下文中(尤其是在以下某些权利要求的上下文中)使用的术语“一个”和“该/所述”以及类似的参考可以被解释为涵盖单数和复数。此处对值范围的叙述仅旨在用作单独提及落入该范围内的每个单独值的简略表达方式。除非在本文中另有说明,否则每个单独的值都被并入说明书中,就好像它在本文中被单独引用一样。除非本文另有说明或与上下文明显矛盾,否则本文所述的所有方法都可以任何合适的顺序进行。关于本文中的某些实施方案提供的任何和所有示例或示例性语言(例如,“诸如”)的使用仅旨在更好地阐明本技术,并且不对另外要求保护的本技术的范围构成限制。说明书中的任何语言都不应被解释为表示对本技术的实践至关重要的任何未要求保护的元素。
[0225]
这里说明了本技术的某些实施方案。在阅读上述说明后,那些实施方案的变化对于本领域普通技术人员将变得显而易见。预期技术人员可以适当地采用这种变化,并且可以以不同于本文具体说明的方式来实践该申请。因此,本技术的许多实施方案包括法律适用所允许的所附权利要求中记载的主题的所有修改和等效物。此外,除非本文另有说明或以其他方式与上下文明显矛盾,否则上述要素的所有可能变化形式的任何组合都包含在本技术中。
[0226]
已经说明了本技术的特定实施方式。其他实施方式也在以下权利要求的范围内。在某些情况下,权利要求中记载的动作能够按不同的顺序执行,并且仍能达到理想的结果。另外,附图中所示的过程不一定需要按所示的特定顺序或连续顺序来实现期望的结果。
[0227]
除了与本文相关的任何起诉文件历史、与本文件不一致或冲突的任何文件、或可能对现在或以后与本文件相关的最大权利要求范围具有限制影响的任何文件之外,在此引用的所有专利、专利申请、专利申请的出版物和/或其他材料,例如论文、书籍、说明书、出版物、文献、事物等等,出于所有目的通过引用其全部内容而并入本文。举例来说,如果与任何并入材料相关的术语和与本文件相关的术语在说明、定义和/或使用上存在任何不一致或冲突,则应以本文件中的术语的说明、定义和/或使用为准。
[0228]
最后,应当理解,本文公开的申请的实施方式是对本技术的实施方式的原理的说明。能够采用的其他变形能够在本技术的范围内。因此,作为示例而非限制,能够根据本文的教导使用本技术的实施方式的替代配置。因此,本技术的实施方式并不限于如所示和所描述的那样。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献