技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种Bulk转录组数据增强空间基因表达分辨率的方法  >  正文

一种Bulk转录组数据增强空间基因表达分辨率的方法

  • 国知局
  • 2024-10-15 10:05:20

本发明涉及生物信息,具体涉及一种bulk转录组数据增强空间基因表达分辨率的方法。

背景技术:

1、rna测序(rna-seq)提供了一种揭示基因表达多样性的强大工具,从而能够绘制出比dna测序更全面的遗传信息图谱。当前,空间转录组(spatially transcriptomes,st)测序技术是生命科学领域的革命性工具,它能够同时捕获细胞或组织内基因表达的空间分布信息与转录本序列,极大地推进了我们对生物体发育、疾病发生以及组织功能的理解。

2、目前,最普遍使用的测序方法是混样转录组(bulk rna-seq)测序,其作为一种成熟的基因表达分析技术,允许研究人员快速准确地量化大量转录本的表达水平。bulk转录组的主要优势在于其相对较低的成本和高效率,以及能够处理大bulk转录组样本的能力,这些优势使得它成为进行大规模的基因表达研究的理想选择。此外,bulk转录组能够提供非常高的读取深度,这对于捕获低丰度基因和进行全面的基因表达分析至关重要。

3、然而,bulk转录组也存在着一些局限性,包括不能提供单细胞水平的表达数据,以及缺乏空间表达信息,这限制了其在细胞异质性和组织结构复杂性研究中的应用。这种局限性意味着在研究复杂生物过程、疾病的空间异质性以及单细胞水平的基因表达动态时,bulk转录组的应用受到了一定的制约。

技术实现思路

1、本发明的目的在于提供一种bulk转录组数据增强空间基因表达分辨率的方法,可以提供单细胞水平的表达数据,经济高效地提升空间转录组数据的分辨率和全面性。

2、为实现上述目的,本发明通过以下技术方案实现:

3、一种bulk转录组数据增强空间基因表达分辨率的方法,包括以下步骤:

4、s1:整合与优化数据输入:获取组织切片的空间转录组数据和bulk转录组数据进行数据预处理,筛选bulk转录组数据提供的基因表达;对整体转录组数据和空间转录组数据中的高度表达基因进行解卷积,得到其在空间聚类上的丰度矩阵。

5、s2:生成与校正表达矩阵:利用s1得到的bulk聚类丰度矩阵与空间转录组的聚类表达矩阵相乘,生成一个“伪bulk”基因表达矩阵,通过“伪bulk”基因表达矩阵对比真实bulk数据,调整空间转录组的表达估计;

6、s3:通过自定义局部到整体循环算法优化空间转录组数据:设计并实施循环算法,逐步优化各空间点的基因表达估计,得到每个空间点上基因表达的增强重构数据,通过增强重构数据得出更为准确和细致的细胞空间表达模式。

7、进一步地:步骤s1中筛选bulk转录组数据提供的基因表达,具体包括以下步骤:从空间转录组数据和bulk转录组数据中选出共同高度表达的基因,并排除表达模式差异显著的基因,确保后续分析的准确性;接着,将bulk数据映射到空间转录组的物理坐标体系上,实现数据的整合与对齐。

8、进一步地:步骤s1中利用music软件整体转录组数据和空间转录组数据中的高度表达基因进行解卷积操作。

9、进一步地:s2中通过“伪bulk”基因表达矩阵对比真实bulk数据,调整空间转录组的表达估计的具体步骤是:用bulk数据除以伪bulk数据获得变量因子矩阵,所述变量因子矩阵与空间聚类矩阵相乘即可获得调整后的空间聚类基因表达矩阵。

10、进一步地:s3中所述循环算法包括以下步骤:

11、在局部区域内根据聚类信息平滑基因表达;基于整体与局部的比较调整各点的基因表达水平,得到精细化增强的数据。

12、进一步地:s3中,通过增强重构数据得出更为准确和细致的细胞空间表达模式,具体操作是,对增强重构数据进行平滑处理、插补和放大,得到空间异质性的表达模式。

13、本发明还提供一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述任一所述的方法的步骤。

14、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行上述任一所述的方法的步骤。

15、相对原技术,本发明具有以下有益效果:

16、本发明方法通过整合空间转录组和bulk转录组数据,运用先进的算法分析,实现了空间基因表达分辨率的显著增强。具体而言,它借助bulk数据的丰度信息,计算其聚类丰度,结合空间转录组的物理分布,生成调整后的表达矩阵,并通过自定义循环算法迭代优化各空间点的基因表达估计,提供单细胞水平的表达数据,最终获得更为精确和高分辨率的细胞空间表达模式。

技术特征:

1.一种bulk转录组数据增强空间基因表达分辨率的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种bulk转录组数据增强空间基因表达分辨率的方法,其特征在于:步骤s1中筛选bulk转录组数据提供的基因表达,具体包括以下步骤:从空间转录组数据和bulk转录组数据中选出共同高度表达的基因,并排除表达模式差异显著的基因,确保后续分析的准确性;接着,将bulk数据映射到空间转录组的物理坐标体系上,实现数据的整合与对齐。

3.根据权利要求1所述的一种bulk转录组数据增强空间基因表达分辨率的方法,其特征在于:步骤s1中利用music软件整体转录组数据和空间转录组数据中的高度表达基因进行解卷积操作。

4.根据权利要求1所述的一种bulk转录组数据增强空间基因表达分辨率的方法,其特征在于:s2中通过“伪bulk”基因表达矩阵对比真实bulk数据,调整空间转录组的表达估计的具体步骤是:用bulk数据除以伪bulk数据获得变量因子矩阵,所述变量因子矩阵与空间聚类矩阵相乘即可获得调整后的空间聚类基因表达矩阵。

5.根据权利要求1所述的一种bulk转录组数据增强空间基因表达分辨率的方法,其特征在于:s3中所述循环算法包括以下步骤:

6.根据权利要求1所述的一种bulk转录组数据增强空间基因表达分辨率的方法,其特征在于:s3中,通过增强重构数据得出更为准确和细致的细胞空间表达模式,具体操作是,对增强重构数据进行平滑处理、插补和放大,得到空间异质性的表达模式。

7.一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-6任一所述的方法的步骤。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行上述权利要求1-6任一所述的方法的步骤。

技术总结本发明提供了一种Bulk转录组数据增强空间基因表达分辨率的方法,涉及生物信息技术领域,该方法分三步实施:首先,整合与优化数据输入,涉及Bulk与空间转录组数据的预处理、共同高度表达基因的选择以及通过MuSiC软件进行的解卷积操作,产出基因在空间聚类上的丰度矩阵。其次,通过构建“伪Bulk”基因表达矩阵并与实际Bulk数据对比,调整空间转录组的表达估算,此过程利用变量因子矩阵实现精确调整。相比现有技术,本发明显著增强了空间基因表达的解析能力,为生物医学研究提供了强大的工具,促进了对复杂组织结构中基因表达模式的深入理解。技术研发人员:廖杰,沈敏杰,程涛,董洋,吕天航受保护的技术使用者:浙江大学长三角智慧绿洲创新中心技术研发日:技术公布日:2024/10/10

本文地址:https://www.jishuxx.com/zhuanli/20241015/316395.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。