一种单细胞多组学数据跨模态生成方法及系统
- 国知局
- 2024-07-12 10:35:35
本发明属于单细胞多组学数据分析,尤其涉及一种单细胞多组学数据跨模态生成方法及系统。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、单细胞测序技术使科学家能够以前所未有的细节消除细胞异质性,这种粒度揭示了无数生物过程中复杂的细胞动力学。为了充分利用单细胞测序数据,现有的单细胞测序数据分析工具多数都是针对特定的数据模式量身定制的,如scrna-seq或scatac-seq,通常提供细胞景观的单一视图。
3、在现有的单细胞多组学数据分析技术中,存在对一单细胞多组学数据进行集成的方法,如seurat专注于寻找模态之间的共性,而另一些人则探索非线性转换或倾向于深度学习。但是,发明人发现,目前的单细胞多组学数据分析技术都面临着从信息丢失到噪声敏感性的问题。此外,由于实验的成本和难度,通常缺乏全面描述细胞状态的匹配单细胞多组学数据,多个组学数据之间的跨模态扰动变化也很难通过实验进行,关键基因的识别也局限在单一模态视角中。
技术实现思路
1、为了解决上述背景技术中存在的技术问题,本发明提供一种单细胞多组学数据跨模态生成方法及系统,其能够生成全面描述细胞状态的匹配单细胞多组学数据,使得单细胞多组学数据在跨模态生成过程中保持跨模态前的扰动,提高关键基因识别的准确性。
2、为了实现上述目的,本发明采用如下技术方案:
3、本发明的第一个方面提供一种单细胞多组学数据跨模态生成方法。
4、一种单细胞多组学数据跨模态生成方法,其包括:
5、获取至少两个单细胞多组学数据,生成对应当前各自模态的细胞-特征矩阵;
6、利用训练好的深度学习模型对所有单细胞多组学数据对应模态的细胞-特征矩阵进行处理,生成对应待转换的设定模态的单细胞多组学数据;
7、其中,利用训练好的深度学习模型对所有单细胞多组学数据对应模态的细胞-特征矩阵进行处理的过程为:
8、利用基因集组件从预设数据库中查找与所有单细胞多组学数据对应模态的细胞-基因矩阵各自相关联的基因集特征并补入至对应单细胞多组学数据中,得到补全后的单细胞多组学数据;
9、利用带gcn的变分自编码器提取补全后的单细胞多组学数据的潜在空间嵌入特征;
10、利用双向对齐器对初步对齐的潜在空间嵌入特征再进行跨模式双向对齐,从而生成对应待转换的设定模态的单细胞多组学数据。
11、作为一种实施方式,训练深度学习模型中的带gcn的变分自编码器的过程为:
12、利用带gcn的变分自编码器提取补全后的训练样本的潜在空间嵌入特征,同时利用共同基因相互最近邻先验方法对所提取的潜在空间嵌入特征进行初步对齐;
13、将初步对齐的潜在空间嵌入特征经过与变分自编码器相对应的解码器进行解码重构,再利用第一对抗学习器来优化带gcn的变分自编码器,直至达到设定要求。
14、作为一种实施方式,训练深度学习模型中的双向对齐器的过程为:
15、利用双向对齐器对初步对齐的潜在空间嵌入特征再进行跨模式双向对齐;
16、将跨模式双向对齐的潜在空间嵌入特征经过与双向对齐器相对应的解码器进行解码重构,再利用第二对抗学习器来优化双向对齐器,直至达到设定要求。
17、作为一种实施方式,所述双向对齐器由多层感知器构成,每层感知器用于将对应组学层的潜在空间嵌入特征转换为集体潜在空间特征。
18、本发明的第二个方面提供一种单细胞多组学数据跨模态生成方法系统。
19、一种单细胞多组学数据跨模态生成方法系统,其包括:
20、数据获取模块,其用于获取至少两个单细胞多组学数据,生成对应当前各自模态的细胞-特征矩阵;
21、跨模态生成模块,其利用训练好的深度学习模型对所有单细胞多组学数据对应模态的细胞-特征矩阵进行处理,生成对应待转换的设定模态的单细胞多组学数据;
22、其中,利用训练好的深度学习模型对所有单细胞多组学数据对应模态的细胞-特征矩阵进行处理的过程为:
23、利用基因集组件从预设数据库中查找与所有单细胞多组学数据对应模态的细胞-基因矩阵各自相关联的基因集特征并补入至对应单细胞多组学数据中,得到补全后的单细胞多组学数据;
24、利用带gcn的变分自编码器提取补全后的单细胞多组学数据的潜在空间嵌入特征;
25、利用双向对齐器对初步对齐的潜在空间嵌入特征再进行跨模式双向对齐,从而生成对应待转换的设定模态的单细胞多组学数据。
26、作为一种实施方式,训练深度学习模型中的带gcn的变分自编码器的过程为:
27、利用带gcn的变分自编码器提取补全后的训练样本的潜在空间嵌入特征,同时利用共同基因相互最近邻先验方法对所提取的潜在空间嵌入特征进行初步对齐;
28、将初步对齐的潜在空间嵌入特征经过与变分自编码器相对应的解码器进行解码重构,再利用第一对抗学习器来优化带gcn的变分自编码器,直至达到设定要求。
29、作为一种实施方式,训练深度学习模型中的双向对齐器的过程为:
30、利用双向对齐器对初步对齐的潜在空间嵌入特征再进行跨模式双向对齐;
31、将跨模式双向对齐的潜在空间嵌入特征经过与双向对齐器相对应的解码器进行解码重构,再利用第二对抗学习器来优化双向对齐器,直至达到设定要求。
32、作为一种实施方式,所述双向对齐器由多层感知器构成,每层感知器用于将对应组学层的潜在空间嵌入特征转换为集体潜在空间特征。
33、本发明的第三个方面提供一种计算机可读存储介质。
34、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的单细胞多组学数据跨模态生成方法中的步骤。
35、本发明的第四个方面提供一种电子设备。
36、一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的单细胞多组学数据跨模态生成方法中的步骤。
37、与现有技术相比,本发明的有益效果是:
38、本发明利用利用基因集组件补全后的单细胞多组学数据,再依次利用带gcn的变分自编码器提取补全后的单细胞多组学数据的潜在空间嵌入特征,以及利用双向对齐器对初步对齐的潜在空间嵌入特征再进行跨模式双向对齐,生成对应待转换的设定模态的单细胞多组学数据,实现了全面描述细胞状态的匹配单细胞多组学数据,使得单细胞多组学数据在跨模态生成过程中保持跨模态前的扰动,提高了关键基因识别的准确性。
39、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
技术特征:1.一种单细胞多组学数据跨模态生成方法,其特征在于,包括:
2.如权利要求1所述的单细胞多组学数据跨模态生成方法,其特征在于,训练深度学习模型中的带gcn的变分自编码器的过程为:
3.如权利要求1所述的单细胞多组学数据跨模态生成方法,其特征在于,训练深度学习模型中的双向对齐器的过程为:
4.如权利要求1所述的单细胞多组学数据跨模态生成方法,其特征在于,所述双向对齐器由多层感知器构成,每层感知器用于将对应组学层的潜在空间嵌入特征转换为集体潜在空间特征。
5.一种单细胞多组学数据跨模态生成系统,其特征在于,包括:
6.如权利要求5所述的单细胞多组学数据跨模态生成系统,其特征在于,训练深度学习模型中的带gcn的变分自编码器的过程为:
7.如权利要求5所述的单细胞多组学数据跨模态生成系统,其特征在于,训练深度学习模型中的双向对齐器的过程为:
8.如权利要求5所述的单细胞多组学数据跨模态生成系统,其特征在于,所述双向对齐器由多层感知器构成,每层感知器用于将对应组学层的潜在空间嵌入特征转换为集体潜在空间特征。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的单细胞多组学数据跨模态生成方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一项所述的单细胞多组学数据跨模态生成方法中的步骤。
技术总结本发明属于单细胞多组学数据分析技术领域,提供了一种单细胞多组学数据跨模态生成方法及系统。其中,单细胞多组学数据跨模态生成方法包括获取至少两个单细胞多组学数据,生成对应当前各自模态的细胞‑特征矩阵;利用训练好的深度学习模型对所有单细胞多组学数据对应模态的细胞‑特征矩阵进行处理,生成对应待转换的设定模态的单细胞多组学数据,其能够生成全面描述细胞状态的匹配单细胞多组学数据,使得单细胞多组学数据在跨模态生成过程中保持跨模态前的扰动,提高关键基因识别的准确性。技术研发人员:吴昊,杨秀辉,丁俊受保护的技术使用者:山东大学技术研发日:技术公布日:2024/6/13本文地址:https://www.jishuxx.com/zhuanli/20240614/87909.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表