技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 基于多尺度药物信息生成的强负样本预测药物对相互作用的方法  >  正文

基于多尺度药物信息生成的强负样本预测药物对相互作用的方法

  • 国知局
  • 2024-11-06 14:25:20

涉及生物信息,具体涉及一种用于预测药物与药物交互关系模型训练的强负样本的构建及应用。

背景技术:

1、药物-药物相互作用(drug-drug interaction,ddi)是指两种或多种药物在给药过程中发生的相互作用,包括药理学变化和毒副作用。预测药物对的相互作用在药物发现过程中具有重要作用,了解给药过程中药物对的药理学变化有助于理解药物联合治疗的作用机制;而了解药物对的毒副作用,对患者采用药物联合治疗时避免不良反应至关重要。药物联合治疗在治疗如癌症、糖尿病、细菌感染等各种复杂疾病方面发挥着关键作用,能够在提高治疗效果的同时降低毒性。许多ddi在临床试验阶段无法确定,因此在药物批准给药之前预测未知的ddi非常重要。然而,通过生物或药理学方法检测ddi的成本高,耗时长。ddi预测的计算方法提供了一种经济高效的替代方法,有助于在临床试验阶段前识别潜在的ddi。在过去的二十多年间,涌现了众多药物相关数据库,如drugbank、twosides和ddinter等,为预测ddi提供了丰富的数据资源。目前的ddi预测计算方法主要分为四类:基于相似性的方法,基于知识图谱的方法和基于机器学习的方法。然而,这些ddi预测计算方法面临两个主要问题。首先,现有的方法主要通过随机负采样来训练模型,将已知的ddi设为正样本,所有未知的ddi标记为负样本。由于已知和未知ddi的数量及其分布存在不均衡性,需要进行负采样。然而,大多数方法从所有未知ddi中随机选取与正样本数量相等的负样本,可能会误选潜在的正样本,即生成弱负样本,从而导致模型在这些弱负样本上训练时表现出较差的鲁棒性和预测性能。其次,由于ddi数据的偏态分布,大多数ddi预测方法在冷启动设置下某些相互作用类别的预测精度较差。通过利用药物与知识图谱中其他类型实体(如疾病、靶点和基因)之间的关系可以改善预测性能。然而,如果过度依赖药物知识图谱信息,可能会忽略药物的结构和物理化学属性信息,因此需要确保模型能够充分学习药物的多尺度信息表示。

技术实现思路

1、为解决现有技术中,药物相互作用判断仅仅依赖已有的经过实验的数据,在随机负采样选择的弱负样本上训练模型时表现出较差的鲁棒性和预测性能,受限于数据的偏态分布,大多数ddi预测方法在冷启动设置下某些相互作用类别的预测精度较差,无法满足目前科研需要的技术问题,本发明提供的技术方案为:

2、基于多尺度药物信息生成的强负样本预测药物对相互作用的模型构建方法,所述方法包括:

3、学习药物知识图谱、药物结构和药物物理化学属性信息表示的步骤;

4、根据所述药物知识图谱、药物结构和药物物理化学属性信息表示,得到药物相似性矩阵的步骤;

5、根据所述药物相似性矩阵,得到药物相似性网络的步骤;

6、对所述药物相似性网络进行融合的步骤。

7、进一步,提供一个优选实施方式,所述药物知识图谱嵌入表示通过生物医药知识图谱中涵盖的药物-靶点、药物-疾病和药物-副作用等实体与关系交互信息,利用知识图谱嵌入表示学习大模型进行学习。

8、进一步,提供一个优选实施方式,所述药物结构信息表示,通过基于字典的分子指纹表示。

9、进一步,提供一个优选实施方式,所述药物物理化学属性包括药物相似性定量估计(qed)、合成可及性(sa)、脂水分配系数(logp)、分子量(mw)、拓扑极性表面积(tpsa)、氢键受体数量(hba)和氢键供体数量(hbd)。

10、进一步,提供一个优选实施方式,使用cosine相似性和jaccard相似性计算药物相似性矩阵,并进行归一化,用于构建药物相似性网络。

11、基于同一发明构思,本发明还提供了基于多尺度药物信息生成的强负样本预测药物对相互作用的模型构建装置,所述装置包括:

12、学习药物知识图谱、药物结构和药物物理化学属性信息表示的模块;

13、根据所述药物知识图谱、药物结构和药物物理化学属性信息表示,得到药物相似性矩阵的模块;

14、根据所述药物相似性矩阵,得到药物相似性网络的模块;

15、对所述药物相似性网络进行融合的模块。

16、基于同一发明构思,本发明还提供了基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,所述方法包括:

17、根据所述的方法构建的模型,对目标药物相互作用数据集生成强负样本的步骤。

18、基于同一发明构思,本发明还提供了基于多尺度药物信息生成的强负样本预测药物对相互作用的装置,所述装置包括:

19、根据所述的装置构建的模型,对目标药物相互作用数据集生成强负样本的模块。

20、基于同一发明构思,本发明还提供了计算机储存介质,用于储存计算机程序,当所述计算机程序被计算机读取时,所述计算机执行所述的方法。

21、基于同一发明构思,本发明还提供了计算机,包括处理器和储存介质,当所述处理器读取所述储存介质中储存的计算机程序时,所述计算机执行所述的方法。

22、基于同一发明构思,本发明还提供了计算机程序产品,作为计算机程序,当所述计算机程序被读取时,实现所述的方法。

23、与现有技术相比,本发明提供的技术方案的有益之处在于:

24、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,通过生物医药知识图谱中涵盖的药物-靶点、药物-疾病和药物-副作用等实体与关系交互信息,并利用知识图谱嵌入表示学习大模型学习药物实体的表示,这种方法显著提升了药物表征的准确性和丰富性,增强了药物相互作用预测的准确性。

25、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,通过药物分子指纹图谱表征药物结构信息,细致地反映了药物分子的亚结构,有助于更精确地计算药物间的相似性。

26、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,包括药物相似性定量估计(qed)、合成可及性(sa)等物理化学属性,提供了药物在物理和化学层面的详细表征,进一步提高了药物相似性的计算精度。

27、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,分别基于知识图谱表示、结构表示和物理化学属性表示计算药物相似性矩阵,并进行min-max归一化。这一过程综合考虑药物的多方面特征,有效计算了不同尺度的药物信息,使相似性计算更为全面和准确。

28、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,采用非线性组合的方法,将三种相似性网络融合,经过多次迭代后,得到更为准确的融合相似度矩阵simf。这种方式能够有效解决信息孤岛问题,将不同数据源的信息融合在一起,大幅提高了预测模型的性能。

29、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,根据药物融合相似性矩阵,对于每个正样本三元组(da,db,ri),药物间关系类型保持不变,以一定概率选择被替换药物,替换药物保证与剩余药物之间的融合相似性最小,生成与正样本不重复且关系类型分布相同的强负样本。此方法不仅解决了正负样本采样不均衡的问题,还能够生成更加多样化和具有挑战性的负样本,显著提升了药物-药物相互作用预测模型的训练效果。

30、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,通过融合多尺度药物信息,系统化地构建和融合药物相似性网络,并创新性地生成强负样本,从根本上改进了药物-药物相互作用预测的准确性和鲁棒性。现有方法中,通常仅考虑单一尺度的信息,或在负样本生成上存在不足,而本发明则通过综合利用多种数据源的信息,全面提升了预测效果。

31、本发明提供的基于多尺度药物信息生成的强负样本预测药物对相互作用的方法,适合应用于药物与药物关系预测的工作中。

本文地址:https://www.jishuxx.com/zhuanli/20241106/321974.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。