技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 鉴定细胞类型的系统、方法和相关计算机设备、存储介质与流程  >  正文

鉴定细胞类型的系统、方法和相关计算机设备、存储介质与流程

  • 国知局
  • 2024-07-12 10:37:24

本发明涉及生物,更具体而言,提供了一种鉴定细胞类型的方法、系统和相关计算机设备、存储介质。

背景技术:

1、时空转录组技术是在近三年发展起来的基于单细胞组学的新兴领域,被《naturemethod》杂志评为2020年年度技术。目前,华大基因的时空转录组学技术是世界上唯一能同时实现“亚细胞级分辨率“和“厘米级全景视场”的技术。这项技术首次实现了高精度生命全景时空分子图谱,可以解析时间和空间维度上单个细胞的基因表达模式,以及细胞类群的空间位置关系及生物学特征。时空转录组技术有助于刻画特定组织位置上细胞层面的异质性,因特定的细胞类型及其特定组织与生物学活性至关重要,可以填补组织和器官水平上位置与功能关系研究的空白,为进一步探索细胞功能和内在作用机制等奠定了基础。对于理解细胞生物学、发育生物学、神经生物学、肿瘤生物学等的关键信息至关重要。

2、在时空转录组测序数据的分析过程中,细胞类型鉴定是必须且重要的一步。常规的细胞类型鉴定依赖于细胞类型标记基因,这种方法费时、费力且不稳定,可重复性差,且易导致不同实验室的鉴定结果之间不可比较。随着时空转录组技术快速发展,相关的测序数据的规模爆炸性增长,研究方向的类型愈发丰富,而这些数据所蕴含的信息,随着研究应用的不断深入,无疑是进行深入研究的重要资源。多名科学家联名在2017年提出人类细胞图谱计划,又于2020年提出了人类癌症图谱计划。在2021年,国内学者建立了植物单细胞rna(scrna)分析数据库“plantscrnadb”,该数据库目前涵盖了已开展单细胞研究的4个模式植物(拟南芥、水稻、番茄和玉米),提供了多种来源的细胞类型标记基因信息,如早期实验、rna-seq和scrna-seq等途径获得的标记基因。海量的已标注细胞类型的单细胞转录组测序数据越来越多,那么如何利用这些参考数据集(reference)来鉴定新测序的细胞,是进行细胞注释的新挑战。

技术实现思路

1、本发明的目的在于提供一种具有广泛应用性、能够实现在物种没有参考基因组的情况下,鉴定细胞类型的方法、系统和相关计算机设备、存储介质。

2、因此,在第一方面,本发明提供了一种鉴定细胞类型的方法,所述方法包括如下步骤:

3、1)获取多个细胞对应的核酸序列测序数据;

4、2)根据所述多个细胞的核酸序列测序数据确定多个核酸子序列;

5、3)计算所述多个核酸子序列在所述多个细胞中的丰度;

6、4)根据所述多个核酸子序列在所述多个细胞中的丰度对所述多个核酸子序列进行聚类,得到多个核酸子序列簇;

7、5)根据所述多个核酸子序列簇确定所述多个细胞的细胞类型。

8、在一个实施方案中,在1)中,所述核酸序列测序数据是时空转录组数据。

9、在一个实施方案中,所述方法还包括:6)根据所述多个细胞的类型信息和时空转录组中细胞的位置信息绘制细胞图谱。

10、在一个实施方案中,在4)中,基于所述多个细胞的核酸子序列丰度数据进行聚类,将在所述多个细胞中的丰度相似的核酸子序列聚成类。

11、在一个实施方案中,将聚类细胞的核酸子序列丰度与已知的细胞类型的基因表达向量确定细胞类型;或根据聚类细胞的核酸子序列确定细胞类型。

12、在一个实施方案中,在3)中,所述多个核酸子序列在所述多个细胞中的丰度数据是过滤异常核酸子序列丰度数据后的核酸子序列丰度数据。

13、在一个实施方案中,过滤掉仅在少数的细胞中出现的核酸子序列,如小于5%。

14、在一个实施方案中,过滤掉在所有的细胞中存在且丰度较为接近的核酸子序列,如偏差小于5%。在一个实施方案中,在1)中,基于测序数据的核苷酸序列或测序数据转换的氨基酸序列进行核酸子序列转化。

15、在一个实施方案中,所述氨基酸序列为简化氨基酸。

16、在一个实施方案中,在3)中,所述核酸子序列及其丰度数据以二进制表示,优选经过降维处理。

17、在一个实施方案中,将核酸子序列丰度进行simhash算法处理。

18、在一个实施方案中,在5)中,最多共有核酸子序列作为相应核酸子序列的来源基因。

19、在一个实施方案中,在4)中,将聚类的核酸子序列的每一类的所有核酸子序列丰度求取平均值,得到简化的核酸子序列丰度矩阵。

20、在第二方面,本发明提供了一种鉴定细胞类型的系统,包括:存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致本发明第一方面的鉴定细胞类型的方法的步骤被执行。

21、在第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致本发明第一方面的鉴定细胞类型的方法的步骤被执行。

22、在第四方面,本发明提供了一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有计算机指令,所述计算机指令在由处理器执行时导致本发明第一方面的鉴定细胞类型的方法的步骤被执行。

23、在第五方面,本发明提供了一种鉴定细胞类型的方法,所述方法包括向本发明第二方面的系统或第三方面的计算机设备输入多个细胞对应的核酸序列测序数据。

24、在一个实施方案中,所述测序数据是过滤异常核酸子序列丰度数据后的核酸子序列丰度数据。

25、在一个实施方案中,过滤掉仅在少数的测序单位中出现的核酸子序列,如小于5%。

26、在一个实施方案中,过滤掉在所有的细胞中存在且丰度较为接近的核酸子序列,如偏差小于5%。

27、本发明将读段执行核酸、氨基酸和/或简化氨基酸三种水平上的核酸子序列转化,并可以将其进一步转化二进制的方式储存,降低计算时的内存需求。本发明在对每个样品/芯片进行分析时,并不需要执行比对,只需要读取测序数据,没有过多的中间文件输出,减少数据存储需求。本发明的系统和方法可以用于并行和多线程的方式分析每个样品/芯片,减少任务运行的时间。

技术特征:

1.一种鉴定细胞类型的方法,所述方法包括如下步骤:

2.根据权利要求1所述的方法,在1)中,所述核酸序列测序数据是时空转录组数据。

3.根据权利要求2所述的方法,所述方法还包括:6)根据所述多个细胞的类型信息和时空转录组中细胞的位置信息绘制细胞图谱。

4.根据权利要求1-3任一项所述的方法,在4)中,基于所述多个细胞的核酸子序列丰度数据进行聚类,将在所述多个细胞中的丰度相似的核酸子序列聚成类。

5.根据权利要求1-3任一项所述的方法,在5)中,将聚类细胞的核酸子序列丰度与已知的细胞类型的基因表达向量确定细胞类型;或根据聚类细胞的核酸子序列确定细胞类型。

6.根据权利要求1-3任一项所述的方法,在3)中,所述多个核酸子序列在所述多个细胞中的丰度数据是过滤异常核酸子序列丰度数据后的核酸子序列丰度数据。

7.根据权利要求6所述的方法,过滤掉仅在少数的细胞中出现的核酸子序列,如小于5%。

8.根据权利要求6所述的方法,过滤掉在所有的细胞中存在且丰度较为接近的核酸子序列,如偏差小于5%。

9.根据权利要求1-3任一项所述的方法,在1)中,基于测序数据的核苷酸序列或测序数据转换的氨基酸序列进行核酸子序列转化。

10.根据权利要求9所述的方法,所述氨基酸序列为简化氨基酸。

11.根据权利要求1-3任一项所述的方法,在3)中,所述核酸子序列及其丰度数据以二进制表示,优选经过降维处理。

12.根据权利要求11所述的方法,将核酸子序列丰度进行simhash算法处理。

13.根据权利要求1-3任一项所述的方法,在5)中,最多共有核酸子序列作为相应核酸子序列的来源基因。

14.根据权利要求1-3任一项所述的方法,在4)中,将聚类的核酸子序列的每一类的所有核酸子序列丰度求取平均值,得到简化的核酸子序列丰度矩阵。

15.一种鉴定细胞类型的系统,包括:存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致权利要求1-14任一项的方法的步骤被执行。

16.一种计算机设备,包括:存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致权利要求1-14任一项的方法的步骤被执行。

17.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有计算机指令,所述计算机指令在由处理器执行时导致权利要求1-14任一项的方法的步骤被执行。

18.一种鉴定细胞类型的方法,所述方法包括向权利要求15的系统或16的计算机设备输入多个细胞对应的核酸序列测序数据。

技术总结本发明属于生物技术领域,公开了一种鉴定细胞类型的方法、系统和相关计算机设备、存储介质。所述方法包括如下步骤:1)获取多个细胞对应的核酸序列测序数据;2)根据所述多个细胞的核酸序列测序数据确定多个核酸子序列;3)计算所述多个核酸子序列在所述多个细胞中的丰度;根据所述多个核酸子序列在所述多个细胞中的丰度对所述多个核酸子序列进行聚类,得到多个核酸子序列簇;5)根据所述多个核酸子序列簇确定所述多个细胞的细胞类型。本发明将读段执行核酸、氨基酸和/或简化氨基酸三种水平上的核酸子转化,并可以将其进一步转化二进制的方式储存,降低计算时的内存需求。技术研发人员:方东明,陈晓丽,郭兴,刘欢受保护的技术使用者:深圳华大生命科学研究院技术研发日:技术公布日:2024/6/13

本文地址:https://www.jishuxx.com/zhuanli/20240614/88107.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。