一种单细胞转录组分析系统
- 国知局
- 2024-07-12 10:38:57
本发明涉及细胞,具体涉及一种单细胞转录组分析系统。
背景技术:
1、单细胞组学数据具有分析难度大、多样性强、灵活程度高等特点。不仅相关生物信息学算法种类繁多,而且随着样本性质和状态的不同、研究人员研究目的的不同、研究人员个人习惯和偏好的不同,分析流程中涉及的方法选择、分析顺序和参数选择通常会产生巨大的变化。这些困难和特性导致了单细胞研究领域的几个问题:1.单细胞软件通常发布在c++、r语言、python、matlab等不同的计算机语言平台,它们的下载安装流程不同,使用方法、数据的输入输出格式也不同,学习成本和使用难度较高;2.分析流程中涉及大量的方法、参数的组合,而发表的文章通常仅在附文部分描述用到的主要方法和参数,但大量的细节参数通常被隐去,而且即使是同样的方法,不同的运行顺序有时也会产生不同分析结果,这就导致目前发表的文献可重复性较低;3.对并行计算的适应性差、大量的无效内存占用和无效硬盘读写;4.非编程人员不友好,单细胞分析工具的开发者往往默认其用户也能够熟练使用各类编程语言,因此没有适配图形界面。然而单细胞技术正在成为一种研究各类生物问题的常规工具,需要分析单细胞数据的学者已经囊括大量非编程专业人士,提高这部分人对分析算法的可及性能使更多人参与单细胞数据的生产,也会大大助力已发表数据的再挖掘。
2、已经存在r语言的seurat、python语言的scanpy等平台,也已经被领域内的学者广泛使用,但它们仍然存在包含的方法较少、用户自主纳入新方法的开发成本较高等问题。
技术实现思路
1、针对现有技术中的问题,本发明实施例提供一种单细胞转录组分析系统,能够至少部分地解决现有技术中存在的问题。
2、一方面,本发明提出一种单细胞转录组分析系统,包括:
3、数据管理模块、动态内存调用模块、自动分析模块和格式转换模块;
4、其中,所述数据管理模块与所述动态内存调用模块、所述自动分析模块和所述格式转换模块分别连接,用于管理所述单细胞转录组分析系统中的单细胞组学原始数据、管理分析过程中的中间数据、管理分析方案输出的结果文件和管理分析算法的调用日志文件;
5、所述动态内存调用模块与所述自动分析模块相连接,用于管理数据在计算机内存中的载入和清出;
6、所述自动分析模块用于自动构建可视化和可交互的单细胞分析流程,并根据分析流程执行分析算法;
7、所述格式转换模块用于将所述单细胞转录组分析系统的数据格式与其他外部系统的数据格式进行互相转换。
8、其中,所述数据管理模块包括数据写入接口、数据读取接口和数据存储单元;
9、其中,所述数据存储单元与所述数据写入接口和所述数据读取接口分别连接;所述数据存储单元用于接收由所述数据写入接口发送的数据,并存储数据至存储单元;
10、所述数据管理模块通过所述数据写入接口与所述格式转换模块相连接,用于接收所述格式转换模块转换得到的输入数据;
11、所述数据管理模块通过所述数据写入接口与所述自动分析模块相连接,用于接收所述自动分析模块通过分析算法输出的数据;
12、所述数据管理模块通过所述数据读取接口与所述格式转换模块相连接,用于发送输出数据至所述格式转换模块;
13、所述数据管理模块通过所述数据读取接口与所述动态内存调用模块相连接,用于转发从所述数据存储单元获取的数据至所述动态内存调用模块。
14、其中,所述动态内存调用模块包括内存请求接口、内存管理中心和内存池子模块;
15、其中,所述内存请求接口、所述内存管理中心和所述内存池子模块依次相连接;
16、所述动态内存调用模块通过所述内存请求接口与所述自动分析模块相连接,用于在获取分析算法输入数据时,转发从所述内存管理中心获取的数据至所述自动分析模块;
17、所述内存管理中心用于首先在内存池中寻找所需数据,如果找到即返回该数据,并更新该数据的最后使用时间;如果没有找到,则向所述数据读取接口发送读取请求,并检查内存池限额剩余情况;
18、所述内存池子模块用于管理读入内存的数据以及每项数据的最后使用时间,配合所述内存管理中心执行数据的载入和清出操作。
19、其中,所述数据管理模块通过所述数据读取接口与所述动态内存调用模块相连接,包括:
20、通过所述数据读取接口与所述内存管理中心相连接实现所述数据管理模块与所述动态内存调用模块相连接。
21、其中,所述内存管理中心还用于:
22、如果即将读入数据的大小大于内存池限额剩余大小,则按照最后使用时间的先后顺序将长期未使用的数据清出内存,直至限额满足读入数据的要求。
23、其中,所述自动分析模块包括计算图构建子模块、可视化交互子模块、分析算法池和并行计算子模块;
24、其中,所述计算图构建子模块与所述可视化交互子模块和所述分析算法池分别连接,用于接收用户输入的分析需求信息,在所述分析算法池中搜索生成对应分析结果所需的算法,获取算法需求的输入数据,构建计算图以拓扑排序转换为线性的算法序列,按照顺序运行获得用户所需的分析结果;
25、所述可视化交互子模块用于编辑计算图数据对分析算法的依赖关系以及分析算法对输入数据的依赖关系;
26、所述分析算法池用于向所述内存请求接口请求所需的输入数据,在进行运算分析后将分析结果传输至所述数据写入接口;
27、所述并行计算子模块用于将计算图批量应用到多个分析项目上,并在分析算法运行的过程中控制并行线程的启动和终止。
28、其中,所述数据管理模块通过所述数据写入接口与所述自动分析模块相连接,包括:
29、通过所述数据写入接口与所述分析算法池相连接实现所述数据管理模块与所述自动分析模块相连接。
30、其中,所述动态内存调用模块通过所述内存请求接口与所述自动分析模块相连接,包括:
31、通过所述内存请求接口与所述分析算法池相连接实现所述动态内存调用模块与所述自动分析模块相连接。
32、其中,所述计算图构建子模块还具体用于:
33、在所述分析算法池中搜索生成对应分析结果所需的算法,并根据算法需求的输入继续向前搜索,直到所有依赖数据都已在所述数据管理模块中存在,或没有更进一步的上游算法为止。
34、其中,所述格式转换模块包括输入接口和输出接口;其中:
35、所述输入接口用于发送转换得到的输入数据至所述数据写入接口;
36、所述输出接口用于接收由所述数据读取接口发送的输出数据。
37、本发明实施例提供的单细胞转录组分析系统包括数据管理模块、动态内存调用模块、自动分析模块和格式转换模块;其中,所述数据管理模块与所述动态内存调用模块、所述自动分析模块和所述格式转换模块分别连接,用于管理所述单细胞转录组分析系统中的单细胞组学原始数据、管理分析过程中的中间数据、管理分析方案输出的结果文件和管理分析算法的调用日志文件;所述动态内存调用模块与所述自动分析模块相连接,用于管理数据在计算机内存中的载入和清出;所述自动分析模块用于自动构建可视化和可交互的单细胞分析流程,并根据分析流程执行分析算法;所述格式转换模块用于将所述单细胞转录组分析系统的数据格式与其他外部系统的数据格式进行互相转换,能够兼顾自动化程度和分析流程的灵活性,保证分析易于复现,并在现有平台的基础上优化分析工具的多样性、计算效率和人机交互逻辑。
本文地址:https://www.jishuxx.com/zhuanli/20240614/88277.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表