技术新讯 > 测量装置的制造及其应用技术 > 一种UHPLC-HRMSprofile模式数据质心化转换方法  >  正文

一种UHPLC-HRMSprofile模式数据质心化转换方法

  • 国知局
  • 2025-01-10 13:20:41

本发明属于超高效液相色谱-高分辨质谱数据解析,具体涉及一种uhplc-hrms profile模式数据质心化转换方法。

背景技术:

1、超高效液相色谱-高分辨质谱(ultra-high performance liquidchromatography-high resolution mass spectrometry,uhplc-hrms)被广泛应用于组学研究,包括代谢组学和脂质组学。在常规分析中,大多数供应商的仪器,如agilent、waters、thermofisher等,都支持centroid和profile(或continues)模式用于uhplc-hrms数据采集。与centroid模式相比,profile模式的一个优点是可以最大限度地保留质谱中的所有信息,因此可以为每个分析的样品提供一个相当大的数据文件。对研究人员来说,有效和高质量地分析uhplc-hrms profile模式的数据绝不是一件容易的事。

2、uhplc-hrms profile模式数据分析与centroid模式数据分析没有明显区别,只是需要进行数据质心转换的过程。简而言之,profile模式数据分析的工作流程包括质心转换、提取的离子色谱图(extracted ion chromatogram,eic)构建、色谱峰提取和注释、色谱峰对齐和注册。目前的uhplc-hrms数据分析工具可以根据实现的质心化转换简要地分为两类:i)质心转换是借助于第三方软件如msconvert完成的;ii)数据分析工具本身支持质心转换。

3、质心转换的主要目的是将每个质谱图内的代谢物的信息从背景噪声的信息中清楚地分离出来。已发表的数据分析工具采用了各种策略来实现这一目标。例如,最有效的质心转换可以通过挑选出每个质谱峰的最大值来完成。在这种情况下,质心转换可以在数据采集过程中迅速完成,因此被安捷伦的masshunter等供应商软件采用。xcms进一步采用了平滑策略,在质谱峰提取之前增强原始质谱图中的真实峰信号。在ms-dial中,一个基于微分计算和噪声估计的质谱峰提取算法被用来提取每个质谱中的峰以执行质心转换。另一个更复杂的策略可以在msconvert中发现,它利用小波分析来检测质谱中的质谱峰以进行质心转换。尽管目前的数据分析工具已经开发了各种策略,但似乎还没有优化质心转换对下游数据分析步骤的影响,如eic构建、色谱峰提取等。总之,在复杂的样品分析中,开发高质量的数据分析工具以有效处理uhplc-hrms profile模式的数据集仍然是有意义的。

技术实现思路

1、针对现有技术的不足,本发明提供一种uhplc-hrms profile模式数据质心化转换方法,该方法能有效实现uhplc-hrms profile模式数据的质心化转换,改善对下游数据分析步骤的影响,如eic构建、色谱峰提取等。

2、为实现上述目的,本发明提供了一种uhplc-hrms profile模式数据质心化转换方法,包括以下步骤:

3、(1)基于uhplc-hrms采集得到profile模式数据,基于所述profile模式数据中的各质谱数据提取局部最大值向量:将获得的质谱用高斯函数进行卷积平滑,获得卷积质谱信号;根据所述卷积质谱信号提取局部最大值,获得局部最大值向量;

4、(2)基于所述局部最大值向量,通过离群检测获得离群向量和候选峰向量:利用移动窗口策略进行离群检测,同时利用一阶导数和稳健统计的方法对处于窗口中心的局部最大值向量中的元素进行信噪比的计算,并将信噪比超过第一阈值的视为离群元素,其余则为候选峰元素,重复上述步骤,直至窗口历遍卷积质谱信号,获得离群向量和候选峰向量;

5、(3)基于所述离群向量和候选峰向量估计仪器噪声:利用所述离群向量中的原始位置在原始质谱中进行检索,并标记为固定点,利用线性插值策略估计两个固定点之间的缺失值,构建profile模式质谱中每个点下的仪器噪声;

6、(4)基于所述仪器噪声和候选峰向量进行质心离子提取,完成uhplc-hrmsprofile模式数据质心化转换:将候选峰向量中的元素的离子丰度除以相应的估计仪器噪声计算各元素的信噪比;保留信噪比高于第二阈值的候选峰向量中的元素,并对其中相邻两个元素m/z差值在允差范围内的进行m/z值和离子丰度校正,最终完成质心离子的提取,实现质心化转换。

7、进一步地,所述步骤(1)中,所述卷积平滑使用的高斯函数为5点高斯函数。

8、进一步地,所述步骤(1)中,所述局部最大值提取的方法为:对任一卷积质谱信号s,通过si-1>si&si<si+1进行局部最大值提取;其中,si是质谱中的第i个数据点,si-1和si+1分别是第i-1和第i+1个数据点。

9、进一步地,所述步骤(2)中,所述移动窗口策略中,窗口大小为30。

10、进一步地,所述步骤(2)中,所述利用移动窗口策略进行离群检测中,信噪比第一阈值为2.5。

11、进一步地,所述步骤(4)中,所述仪器噪声和候选峰向量进行质心离子提取的方法中,信噪比第二阈值为1.5,相邻两个元素m/z允差为0.015。

12、与现有技术相比,本发明具有如下优点和技术效果:

13、本发明提供一种uhplc-hrms profile模式数据质心化转换方法,该方法是基于最大值的质心转换(maximum value-based centroiding transformation,mvct)策略实现的,其基本原理是在profile模式质谱中对应于化合物的离子应该是局部的最大值。该方法先将获得的质谱用高斯函数进行卷积平滑,后对最大值进行提取,获得局部最大值向量;利用移动窗口策略进行离群检测,同时利用一阶导数和稳健统计的方法进行信噪比的计算,获得所述离群向量和候选峰向量;根据离群向量,利用线性插值策略估计质谱仪器噪声;根据信噪比对候选峰向量中的元素的离子进行筛选,并对相邻两个元素m/z差值在允差范围内的进行m/z值和离子丰度校正,最终完成质心离子的提取,实现质心化转换。该方法转换获得质心化数据能够有效将每个质谱图内的代谢物的信息从背景噪声的信息中清楚地分离出来,并降低化合物信息丢失的风险。

技术特征:

1.一种uhplc-hrms profile模式数据质心化转换方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的uhplc-hrms profile模式数据质心化转换方法,其特征在于,所述步骤(1)中,所述卷积平滑使用的高斯函数为5点高斯函数。

3.根据权利要求1所述的uhplc-hrms profile模式数据质心化转换方法,其特征在于,所述步骤(1)中,所述局部最大值提取的方法为:对任一卷积质谱信号s,通过si-1>si&si<si+1进行局部最大值提取;其中,si是质谱中的第i个数据点,si-1和si+1分别是第i-1和第i+1个数据点。

4.根据权利要求1所述的uhplc-hrms profile模式数据质心化转换方法,其特征在于,所述步骤(2)中,所述移动窗口策略中,窗口大小为30。

5.根据权利要求1所述的uhplc-hrms profile模式数据质心化转换方法,其特征在于,所述步骤(2)中,所述利用移动窗口策略进行离群检测中,信噪比第一阈值为2.5。

6.根据权利要求1所述的uhplc-hrms profile模式数据质心化转换方法,其特征在于,所述步骤(4)中,所述仪器噪声和候选峰向量进行质心离子提取的方法中,信噪比第二阈值为1.5,相邻两个元素m/z允差为0.015。

技术总结本发明公开了一种UHPLC‑HRMS profile模式数据质心化转换方法,包括以下步骤:基于UHPLC‑HRMS采集得到profile模式数据,基于所述profile模式数据中的各质谱数据提取局部最大值向量;基于所述局部最大值向量,通过离群检测获得离群向量和候选峰向量;基于所述离群向量和候选峰向量估计仪器噪声;基于所述仪器噪声和候选峰向量进行质心离子提取,完成UHPLC‑HRMS profile模式数据质心化转换。本发明能够有效将每个质谱图内的代谢物的信息从背景噪声的信息中清楚地分离出来,并降低化合物信息丢失的风险,实现UHPLC‑HRMS profile模式数据的有效转换。技术研发人员:佘远斌,汪兴财,付海燕,于永杰受保护的技术使用者:浙江工业大学技术研发日:技术公布日:2025/1/6

本文地址:https://www.jishuxx.com/zhuanli/20250110/352536.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。