技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 基于多视图和双重融合框架的circRNA-疾病关联预测方法  >  正文

基于多视图和双重融合框架的circRNA-疾病关联预测方法

  • 国知局
  • 2024-07-12 10:33:45

本发明涉及生物信息预测领域,具体地涉及基于多视图和双重融合框架预测circrna和疾病关联的方法和装置。背景技术:::1、circrna是一类没有5’端帽和3’端尾的非编码rna分子。它们形成具有共价键的环状结构,广泛存在于真核细胞中。1976年,在电子显微镜的帮助下,观察到真核细胞细胞质中存在环状rna分子。但多年来,它被认为是编译过程中产生的一种错误分子,直到2013年,circrna才被证明在生物活性中发挥着重要的调节作用。circrna最重要的功能被发现是作为mirna和蛋白质的海绵,因此涉及许多不同的人类癌症。2、2013年后,对circrna的研究开始升温,研究人员探索发现了更多的circrna-疾病关联。尽管研究人员已经尽可能多地进行了探索,但仍存在大量未知的circrna-疾病关联。由于生物学湿实验成本高,耗时长,因此,计算机方法开始广泛用于未知circrna-疾病关联的预测,并创建了一些公共数据库来促进研究,如circr2disease、circ2disease和circrnadisease。3、主要的计算方法可分为以下两类。第一类是基于网络传播的方法,它通过构建异构图,并从图中学习拓扑关系。例如fan等人提出了一种集成不同相似性核并使用katz度量来计算circrna-疾病关联的方法。peng等人提出了一种具有鲁棒非负矩阵分解和标签传播的rnmflp模型。xiao等人提出了nsl2cd,通过学习网络嵌入的低维节点表示来预测未知关联。第二类是基于机器学习的方法。图神经网络和transformer模块在预测任务中得到了广泛的应用。peng等人提出了gatcl2cd来推断由多头动态注意力机制进行的潜在连接。ignscda是lan等人提出的一种基于改进的图卷积网络(gcn)和负采样方法的模型。4、然而,目前circrna-疾病关联预测方法的研究仍存在以下缺陷:一是样本数量有限,相比大量的未知关联,正样本数量非常少,因此对负样本的选择造成了极大困扰;二是现有方法可能会对相似网络的拓扑特征提取不充分,导致预测范围受限。技术实现思路1、本发明的目的在于克服上述现有技术的不足,提出一种基于多视图和双重融合框架的circrna-疾病关联预测方法(mdfcda),旨在解决现有技术中存在的预测精度较低和预测范围较窄的技术问题。具体地,本发明包括以下内容:2、本发明的第一方面,提供一种基于多视图和双重融合框架的circrna-疾病关联预测的方法,包括:3、基于已知的circrna-疾病关联,构建邻接矩阵a,若circrna ci和疾病 dj存在关联,则,否则。4、计算疾病语义相似性、疾病余弦相似性、疾病jaccard相似性。5、计算circrna功能相似性、circrna余弦相似性和jaccard相似性6、基于已知的circrna-疾病关联和计算出的多种相似性核,构建多视图异构网络(由疾病语义相似性和circrna功能相似性构成)、(由二者的余弦相似性构成)、(由二者的jaccard相似性构成)。7、<mstyledisplaystyle="true"mathcolor="#000000"><mtablecolumnalign="left"><mtr><mtd><mi>dsscfs</mi><mi>=</mi><mrow><mo>[</mo><mtable><mtr><mtd><mi>cfs</mi></mtd><mtd><mi>a</mi></mtd></mtr><mtr><mtd><msup><mi>a</mi><mi>t</mi></msup></mtd><mtd><mi>dss</mi></mtd></mtr></mtable><mo>]</mo></mrow><mi>,</mi></mtd></mtr><mtr><mtd><mi>dcsccs</mi><mi>=</mi><mrow><mo>[</mo><mtable><mtr><mtd><mi>cjs</mi></mtd><mtd><mi>a</mi></mtd></mtr><mtr><mtd><msup><mi>a</mi><mi>t</mi></msup></mtd><mtd><mi>djs</mi></mtd></mtr></mtable><mo>]</mo></mrow><mi>,</mi></mtd></mtr><mtr><mtd><mi>djscjs</mi><mi>=</mi><mrow><mo>[</mo><mtable><mtr><mtd><mi>ccs</mi></mtd><mtd><mi>a</mi></mtd></mtr><mtr><mtd><msup><mi>a</mi><mi>t</mi></msup></mtd><mtd><mi>dcs</mi></mtd></mtr></mtable><mo>]</mo></mrow><mi>.</mi></mtd></mtr></mtable></mstyle>8、然后,对于每个视图,使用深度图库来构建由circrna和疾病特征组成的异构图,并使用多头动态注意力机制计算节点之间的权重,聚合来自相邻节点的信息。多头动态注意力的计算公式如下:9、<mstyledisplaystyle="true"mathcolor="#000000"><mi>s</mi><mi>(</mi><msub><mi>x</mi><msub><mi>c</mi><mi>i</mi></msub></msub><mi>,</mi><msub><mi>x</mi><msub><mi>d</mi><mi>j</mi></msub></msub><mi>)</mi><mi>=</mi><mi>leakyrelu</mi><mrow><mo>(</mo><mrow><mrow><mo>[</mo><mrow><msub><mi>x</mi><msub><mi>c</mi><mi>i</mi></msub></msub><mi>||</mi><msub><mi>x</mi><msub><mi>d</mi><mi>j</mi></msub></msub></mrow><mo>]</mo></mrow><mi>w</mi></mrow><mo>)</mo></mrow><mi>⋅</mi><mi>a</mi><mi>.</mi></mstyle>10、双重融合框架:核融合算法分为前融合和后融合。在特征提取之前对多源数据进行融合的过程称为前融合,而在特征提取之后的过程则称为后融合。本文采用后融合方法。在特征聚合步骤之后,使用视图级注意力模块和highway模块对三个视图的特征进行综合处理,有效地捕捉了不同视图的特征。将三个视图的特征分别水平和垂直堆叠,可以使网络在比特和向量级别进行学习,从而能够完全学习不同的依赖关系。如下面的公式所示,三个视图的特征被组合为两个模块的输入,这两个模块产生两个输出和。11、12、最后,将和的总和作为下一预测步骤的最终特征:13、14、多层感知机预测潜在关联:最后的特征嵌入被馈送到由4个线性层组成的多层感知机(mlp)中。mlp学习节点的潜在特征和互连,以预测每对circrna疾病的关联得分。mlp的预测过程可以表示为:15、16、其中表示从预测的关联矩阵。根据中的概率值判断是否有关联。17、本发明的优点和积极效果:18、从上述技术方案可以看出,本发明提供的技术方案通过首先对circrna和疾病计算多种相似性网络,构建多个异构图,然后利用多头动态图注意力机制进行特征提取,得到每个视图的特征矩阵。多个视图的特征通过双重融合框架,从向量维度和位维度进行融合,得到最终的特征嵌入,最后通过多层感知机获得最终的关联预测得分。本发明针对所有mirna与疾病对构建超图,并非单纯依靠已知关联关系,这对发掘潜在的mirna与疾病关联关系是十分有意义的,对于实际疾病诊断与治疗以及后续药物的研发存在一定价值。当前第1页12当前第1页12

本文地址:https://www.jishuxx.com/zhuanli/20240614/87734.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。