游离DNA标志物的筛选方法、DNA标志物及其应用与流程
- 国知局
- 2024-06-20 10:55:43
本发明涉及基因检测,具体涉及一种游离dna标志物的筛选方法、dna标志物及其应用。
背景技术:
1、痴呆是困扰我国老年人大脑健康的重要原因,直接危害着人民健康福祉。阿尔茨海默病(alzheimer's disease,ad)是造成老年痴呆的最主要原因(65%以上)。截至2021年底,我国60岁及以上老年人口达2.67亿,占总人口的18.9%。预计在2035年左右,60岁及以上老年人口将突破4亿,在总人口中的占比将超过30%,进入重度老龄化阶段。我国目前约有4700万ad临床前阶段病人、3900万mci病人、1500万痴呆患者。病人产生认知障碍后无法被逆转,因此“早发现、早诊断、早治疗”是ad防治关键。
2、神经元胞外的淀粉样蛋白斑块(β-amyloid(aβ)plaques)和胞内的神经元纤维tau缠结(neurofibrillary tau tangles)是ad的两个主要病理特征,也是区别ad痴呆与非ad痴呆的依据。目前较为成熟的ad诊断方法主要是通过正电子发射断层成像(positronemission tomography,pet)直接检测活体大脑aβ斑块和tau缠结,或者间接地通过检测脑脊液(cerebrospinal fluid,csf)中aβ42和p-tau等ad相关的病理蛋白浓度。但是,pet成像具有放射性、价格昂贵而且并非所有医院都具有成像设备,脑脊液的抽取也非常繁琐和痛苦。近年来,基于血液的疾病早期诊断技术开始兴起,其对患者创伤小、可以多次收取,在实施上具有很大的优势。疾病的血液标志物有重要临床价值,但是目前很多疾病都缺乏有效的诊断、监控标志物,尤其是在早期疾病诊断方面。标志物的鉴定包括生物学原理挖掘、生化实验、以及生物信息学计算方法等方面。敏感度高、灵活的疾病标志物鉴定方法有较大需求。在ad领域,目前血液检测技术的关注点几乎全在血浆蛋白标志物上,而探测这些血浆蛋白标志物大多需要借助超灵敏生物标志物检测系统(如simoa)或者质谱测量等平台开展,耗材和价格偏高,并且检测灵敏度和准确性也不够理想;综上,这些缺陷导致血浆蛋白生物标志物无法满足在我国社区大面积开展ad早期检测的需求。
3、外周血游离dna是一种自然存在的dna片段,大多是人体内细胞死亡后释放进外周血。在健康人群中,游离dna主要来自血细胞和肝脏,但是在疾病患者中,由于病变组织会释放游离dna、引发免疫反应,导致游离dna发生变化,因此游离dna分析可以用于疾病的诊断、检测等等。此外,游离dna的代谢半衰期约6个小时,因此游离dna分析可实现人体的实时监控。目前,游离dna分析多集中在癌症、孕产、感染性疾病等领域。dna甲基化(dnamethylation)是一种重要的dna表观遗传修饰。一种常见的dna甲基化类型为5-甲基胞嘧啶(5mc),即胞嘧啶(c)上增加了一个甲基。在人类中,5mc绝大多数发生在cpg二核苷酸(即由磷酸酯连接的胞嘧啶和鸟嘌呤)中的胞嘧啶上,可影响基因组的稳定性、调节基因的表达,具有较强的细胞、组织特异性。人体内存在功能各异的组织器官,如肝、肺、肾、脑等,它们之间的基因组几乎完全一样,但是dna甲基化修饰却有较大的差异;当人体内某个组织因处于病理状态而导致其细胞死亡并释放dna进入外周血时,可以通过鉴定其组织特异性的dna甲基化或位点,对该病理状态进行检测、诊断。此外,病理状态下机体产生的免疫反应也会导致游离dna甲基化的异常变化。游离dna甲基化检测在产前诊断、癌症诊断中已经获得了广泛应用,并取得了巨大的成功。但是,大多数游离dna甲基化的疾病标志物的鉴定,需要收集疾病相关组织的甲基化数据(或者收集相关组织,自行通过实验获得),通过与外周血、或者正常组织进行比对来鉴定疾病标志物,然后在外周血中进行验证。甲基化数据获得方式的不同,对后续标志物鉴定有显著影响。
4、比如基于dna甲基化芯片(常见的有illumina humanmethylation450beadchip、illumina infinium methylation epic beadchip等),其覆盖了固定数目、特定序列的cpg位点,实验数据中每个cpg位点的捕获深度高、同时相邻cpg位点距离较远,因此一般都是每个cpg位点单独分析。基于特异性识别酶进行富集的方法,如medip-seq,其分辨率较低,在疾病诊断中使用较少。目前的主流是基于测序的方法,比如wgbs、rrbs、em-seq、taps等技术,可以覆盖几乎所有cpg位点,但是由于测序深度的限制,单个cpg位点的甲基化水平定量偏差较大,同时考虑到相邻cpg之间甲基化状态具有相关性,因此会将多个相邻的cpg位点作为一个标志物,而如何对cpg位点进行分段非常重要。主流做法有多种,比如基于已知的cpg岛(cpg island)、cpg岛岸(cpg island shore)、基因启动子等调控元素(regulatoryelement),将单个元素或者其部分序列作为一个分段,但这些方式仍有不足。此外,由于游离dna浓度很低(每毫升血浆中仅含有约7ng的游离dna),而传统的wgbs实验中的亚硫酸盐对dna的伤害很大,导致游离dna甲基化实验非常困难;与疾病相关的cpg位点仅占基因组的极少部分,导致检测成本高昂。综上,开发基于游离dna甲基化的疾病早期诊断技术,在实验、计算方法两个方面都需要优化。
技术实现思路
1、有鉴于此,本发明的主要目的在于提供一种游离dna标志物的筛选方法、dna标志物及其应用,以期至少部分地解决上述技术问题。
2、为了实现上述目的,作为本发明的第一个方面,提供了一种游离dna标志物的筛选方法,包括以下步骤:
3、选取人类任一段基因序列,将其第一个cpg位点作为一候选分段;对于任意一候选分段,考察其相邻的下一cpg位点,若所述cpg位点与所述候选分段中最后一cpg间隔小于等于第一预设阈值di,则将所述cpg位点合并到当前候选分段,并继续考察更后面的cpg位点,直到不符合间隔条件;
4、考察当前候选分段,若其包含的cpg位点数目达到第二预设阈值num,则将所述候选分段标记为正式分段,否则丢弃所述候选分段;
5、候选分段考察完毕后,将其相邻的下一个cpg位点作为一个新的候选分段起始,重复上述过程,直至达到预设的结束条件;
6、采集经过验证的正实验样本和对照组样本;
7、通过dna甲基化测定方法对所述正实验样本和对照组样本进行核苷酸测序:
8、对所有样本,对上述确定的所有正式分段,将其包含的所有cpg位点的甲基化定量值取平均作为所述正式分段的甲基化水平;
9、对于每个正式分段,若其对照组样本的甲基化水平小于预设阈值a的样本个数或比例不低于x,而在正实验样本中大于另一预设阈值b的样本个数或比例大于预设阈值y,则将所述正式分段作为一候选标志物;或者
10、对于每个正式分段,若其对照组样本的甲基化水平大于预设阈值aa的样本个数或比例不低于预设阈值xx,而在正实验样本中小于另一预设阈值bb的样本个数或比例大于预设阈值yy,则也将所述正式分段作为一候选标志物。
11、作为本发明的第二个方面,还提供了一种根据如上所述的筛选方法筛选得到的候选标志物;
12、作为优选,所述候选标志物包括如seq id no.1~seq id no.513所述的核苷酸序列。
13、作为本发明的第三个方面,还提供了一种基于如上所述的候选标志物进行pcr扩增、复制、转化和/或变换而得到的引物、引物扩增链或样品组合物。
14、作为本发明的第四个方面,还提供了一种甲基化机器测序系统,所述甲基化机器测序系统包含如上所述的候选标志物的核酸文库。
15、基于上述技术方案可知,本发明的标志物筛选方法、dna标志物及其应用相对于现有技术至少具有如下有益效果之一:
16、1、本发明无需组织样本,克服了脑组织较难获取,尤其是早期ad患者的脑组织更是几乎无法获得的技术难题;
17、2、本发明的筛选方法中,采用全基因组测序,结合cpg对基因组进行分段方法的自由度高,有效基因分段可以允许最短只有10bp(即10个碱基)长、只包含3个cpg位点;
18、3、采用本发明筛选的标志物组合物进行检测的噪音容忍度高,对照组信号干净;
19、4、采用本发明筛选的标志物组合物的检测方法的敏感度高,其不要求单个标志物的准确率很高,而是将有潜力的标志物都选出来;
20、5、本发明的检测方法只采集外周血,对人体无创伤、可反复采集;
21、6、癌症诊断相关领域的研究表明,血液中疾病相关的游离dna标志物早于蛋白质出现,因此游离dna相关标志物在早期诊断中的应用前景更好;同时,游离dna大多为双链dna,稳定性高、可重复性强;
22、7、游离dna的代谢半衰期短,只有6个小时,因此可以对疾病进行实时监控;游离dna甲基化检测技术成熟、可一次性检测多个位点,适合大范围推广使用;
23、8、本发明的标志物鉴定参数不基于统计检验,统计上有差异的位点作为标志物效果往往不好;本发明也不追求单个标志物能达到很好的效果,而是鉴定出一定量有潜力的标志物,抗干扰能力强,将这些标志物的全部或部分联合使用(如使用平均值、结合机器学习技术)可以达到较好的诊断效果。
本文地址:https://www.jishuxx.com/zhuanli/20240619/666.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。