技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种非小细胞肺癌基因检测结果的传输方法及系统  >  正文

一种非小细胞肺癌基因检测结果的传输方法及系统

  • 国知局
  • 2024-12-26 15:07:04

本发明涉及数据传输,具体涉及一种非小细胞肺癌基因检测结果的传输方法及系统。

背景技术:

1、非小细胞肺癌ctdna,即循环肿瘤dna,是指由肿瘤细胞释放到血液循环系统中的dna片段。在非小细胞肺癌等实体肿瘤中,ctdna携带了肿瘤的基因变异信息,如点突变、基因扩增、基因缺失、基因重排等,因此,通过血液样本进行ctdna基因检测,可以实现对肿瘤细胞的病变检测。基因检测结果的生物学信息中包含有大量的生物学数据指标,数据内容较多,且存在大量的冗余信息,这使得检测结果的传输变得缓慢。

2、非小细胞肺癌基因检测的数据较多,涉及到大量的生物学指标,数据内容多,因其通过专业的医学设备进行医学检测的结果,检测的相关基因都较为重要,现有的传输方法是通过对数据进行压缩后减小数据的容量来进行数据的传输,以提高数据传输效率。但是因为非小细胞肺癌基因复杂多变,基因检测结果中数据类型较多,检测结果数据量较大,采用传统的压缩算法构建字典时,字典编码量较大,压缩效率降低,信息的传输量较大,非小细胞肺癌基因检测数据的传输效率较低。

技术实现思路

1、为了解决现有方法在对非小细胞肺癌基因检测数据进行传输时存在传输效率较低的问题,本发明的目的在于提供一种非小细胞肺癌基因检测结果的传输方法及系统,所采用的技术方案具体如下:

2、第一方面,本发明提供了一种非小细胞肺癌基因检测结果的传输方法,该方法包括以下步骤:

3、获取目标人员的非小细胞肺癌基因检测序列;

4、分别以不同的预设长度对目标基因序列进行子序列段的划分,所述目标基因序列是基于碱基对的排列组合特点从基因检测序列中提取到的;根据每个子序列段在目标基因序列中出现的情况,获得每个子序列段的重复度;利用每种预设长度的单个子序列段的重复度与所有子序列段的重复度之间的大小关系,筛选第一子序列段;

5、综合不同长度的第一子序列段之间的重复情况以及对应的所述重复度,筛选目标子序列段;利用所述目标子序列段构建字典,基于所述字典对目标基因序列进行压缩传输。

6、优选的,所述目标基因序列的获取,包括:

7、提取目标人员的非小细胞肺癌基因检测序列中所有奇数位置的碱基或者所有偶数位置的碱基,构成目标基因序列。

8、优选的,所述根据每个子序列段在目标基因序列中出现的情况,获得每个子序列段的重复度,包括:

9、统计候选子序列段在所述目标基因序列中出现的次数;将所述次数作为候选子序列段的重复度;所述候选子序列段为所有预设长度的所有子序列段中的任一子序列段。

10、优选的,所述利用每种预设长度的单个子序列段的重复度与所有子序列段的重复度之间的大小关系,筛选第一子序列段,包括:

11、对于任意一种预设长度:

12、计算该预设长度的所有子序列段的平均重复度;

13、对于该种预设长度的任一子序列段,计算该子序列段的重复度与所述平均重复度之间的差值,基于所述差值判断该子序列段是否为第一子序列段。

14、优选的,所述基于所述差值判断该子序列段是否为第一子序列段,包括:

15、若所述差值大于预设差异阈值,则判定该子序列段为第一子序列段;所述预设差异阈值大于等于0。

16、优选的,所述综合不同长度的第一子序列段之间的重复情况以及对应的所述重复度,筛选目标子序列段,包括:

17、计算待分析子序列段对应的参考子序列段的重复度与待分析子序列段的重复度之间的第一比值;根据待分析子序列段与其对应的参考子序列段的重复度之间的差异、以及待分析子序列段对应的所有第一比值,得到待分析子序列段的保留指标;所述待分析子序列段为任一第一子序列段;

18、所述参考子序列段为所有第一子序列段中包含待分析子序列段且长度大于待分析子序列段的第一子序列段;

19、基于所述保留指标判断待分析子序列段是否为目标子序列段;所述待分析子序列段为任一第一子序列段。

20、优选的,所述根据待分析子序列段与其对应的参考子序列段的重复度之间的差异、以及待分析子序列段对应的所有第一比值,得到待分析子序列段的保留指标,包括:

21、计算待分析子序列段与其对应的所有参考子序列段的重复度之间的整体差异;

22、计算待分析子序列段对应的所有第一比值的平均值;

23、将所述整体差异与所述平均值之差的归一化结果,确定为待分析子序列段的保留指标。

24、优选的,所述基于所述保留指标判断待分析子序列段是否为目标子序列段,包括:

25、若所述保留指标大于预设保留阈值,则将待分析子序列段作为目标子序列段。

26、优选的,采用lzw算法对基因检测序列进行压缩。

27、第二方面,本发明提供了一种非小细胞肺癌基因检测结果的传输系统,该系统包括:

28、数据采集模块,用于获取目标人员的非小细胞肺癌基因检测序列;

29、第一子序列段筛选模块,用于分别以不同的预设长度对目标基因序列进行子序列段的划分,所述目标基因序列是基于碱基对的排列组合特点从基因检测序列中提取到的;根据每个子序列段在目标基因序列中出现的情况,获得每个子序列段的重复度;利用每种预设长度的单个子序列段的重复度与所有子序列段的重复度之间的大小关系,筛选第一子序列段;

30、数据传输模块,用于综合不同长度的第一子序列段之间的重复情况以及对应的所述重复度,筛选目标子序列段;利用所述目标子序列段构建字典,基于所述字典对目标基因序列进行压缩传输。

31、本发明至少具有如下有益效果:

32、本发明首先对目标人员进行非小细胞肺癌基因检测获得基因检测序列,然后根据碱基对的排列组合特点从基因检测序列中提取出了目标基因序列,在保留原基因检测序列的重要信息的同时,整体数据量减少了一半,使得压缩传输效率能够得以提升,进一步地,分别以不同的预设长度对目标基因序列进行多次划分,获得不同预设长度的子序列段,分别对每个子序列段在目标基因序列中出现的情况进行分析,获得每个子序列段的重复度,对每种预设长度的单个子序列段的重复度与所有子序列段的重复度之间的大小进行比较,筛选出第一子序列段,第一子序列段编入字典的可选性较高,综合不同长度的第一子序列段之间的重复情况以及对应的重复度,从第一子序列段中筛选目标子序列段,目标子序列段用于字典的构建,进而对目标基因序列进行压缩传输,本发明提供的方法根据不同的基因片段进行差异化的压缩,确保了压缩率的同时对于关键的dna数据信息也能更好地进行传输,提高了非小细胞肺癌基因检测结果的传输效率,通过安全、快速地传输非小细胞肺癌基因检测结果,临床医生能够及时获取患者的基因变异信息,为患者提供个性化的治疗方案。

技术特征:

1.一种非小细胞肺癌基因检测结果的传输方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述目标基因序列的获取,包括:

3.根据权利要求1所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述根据每个子序列段在目标基因序列中出现的情况,获得每个子序列段的重复度,包括:

4.根据权利要求1所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述利用每种预设长度的单个子序列段的重复度与所有子序列段的重复度之间的大小关系,筛选第一子序列段,包括:

5.根据权利要求4所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述基于所述差值判断该子序列段是否为第一子序列段,包括:

6.根据权利要求2所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述综合不同长度的第一子序列段之间的重复情况以及对应的所述重复度,筛选目标子序列段,包括:

7.根据权利要求6所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述根据待分析子序列段与其对应的参考子序列段的重复度之间的差异、以及待分析子序列段对应的所有第一比值,得到待分析子序列段的保留指标,包括:

8.根据权利要求6所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,所述基于所述保留指标判断待分析子序列段是否为目标子序列段,包括:

9.根据权利要求1所述的一种非小细胞肺癌基因检测结果的传输方法,其特征在于,采用lzw算法对基因检测序列进行压缩。

10.一种非小细胞肺癌基因检测结果的传输系统,其特征在于,该系统包括:

技术总结本发明涉及数据传输技术领域,具体涉及一种非小细胞肺癌基因检测结果的传输方法及系统。方法包括:获取目标基因序列,以不同的预设长度对目标基因序列进行子序列段的划分,利用每种预设长度的单个子序列段的重复度与所有子序列段的重复度之间的大小关系,筛选第一子序列段;综合不同长度的第一子序列段之间的重复情况以及对应的所述重复度,筛选目标子序列段;利用所述目标子序列段构建字典,基于所述字典对目标基因序列进行压缩传输。本发明提高了非小细胞肺癌基因检测结果的传输效率。技术研发人员:张文龙,蔡婧,丛丹,朱镇星,赵亚男受保护的技术使用者:吉林大学技术研发日:技术公布日:2024/12/23

本文地址:https://www.jishuxx.com/zhuanli/20241226/344572.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。