技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 抗体序列的获取与抗体设计模型的训练方法、装置与流程  >  正文

抗体序列的获取与抗体设计模型的训练方法、装置与流程

  • 国知局
  • 2024-09-05 14:28:05

本公开涉及人工智能,具体涉及生物计算,尤其设计一种抗体序列的获取与抗体设计模型的训练方法、装置、电子设备与可读存储介质。

背景技术:

1、大分子药物具有高度的靶向性和特异性,大分子药物设计旨在开发具有治疗潜力的生物大分子,如蛋白质、抗体、核酸等。但目前对于抗体药物的设计依赖于湿实验发,研发成本较高,且效率低下。

技术实现思路

1、根据本公开的第一方面,提供了一种抗体序列的获取方法,包括:分别对抗原序列与初始抗体序列进行多序列比对msa,得到抗原msa序列与抗体msa序列;将所述抗原msa序列与所述抗体msa序列进行拼接,根据拼接序列、所述抗原msa序列与所述抗体msa序列中各氨基酸的属性特征,得到所述拼接序列中不同序列位置处的氨基酸的第一特征;根据参考抗原抗体复合体中的氨基酸与氨基酸之间的连接关系构建图graph,根据所述graph中各氨基酸的属性特征,得到所述参考抗原抗体复合体中不同三维坐标处的氨基酸的第二特征;将不同序列位置处的氨基酸的第一特征与对应不同序列位置的三维坐标处的氨基酸的第二特征进行融合,根据融合特征得到每个氨基酸在抗体序列中不同位置处的概率信息;根据氨基酸以及氨基酸在抗体序列中不同位置处的概率信息,得到目标抗体序列能。

2、根据本公开的第二方法,提供了一种抗体设计模型的训练方法,包括:获取多个数据样本,每个数据样本包含样本抗原msa序列、样本抗体msa序列、样本抗原抗体复合体与标注抗体序列;构建包含第一特征提取模块、第二特征提取模块与特征融合模块的神经网络模型;将所述样本抗原msa序列、所述样本抗体msa序列、所述样本抗原抗体复合体输入所述神经网络模型,根据所述神经网络模型的输出结果,得到预测抗体序列;根据所述预测抗体序列与所述标注抗体序列计算损失函数值,使用所述损失函数值调整所述神经网络模型的参数,得到抗体设计模型。

3、根据本公开的第三方面,提供了一种抗体序列的获取装置,包括:处理单元,用于分别对抗原序列与初始抗体序列进行多序列比对msa,得到抗原msa序列与抗体msa序列;第一特征提取单元,用于将所述抗原msa序列与所述抗体msa序列进行拼接,根据拼接序列、所述抗原msa序列与所述抗体msa序列中各氨基酸的属性特征,得到所述拼接序列中不同序列位置处的氨基酸的第一特征;第二特征提取单元,用于根据参考抗原抗体复合体中的氨基酸与氨基酸之间的连接关系构建图graph,根据所述graph中各氨基酸的属性特征,得到所述参考抗原抗体复合体中不同三维坐标处的氨基酸的第二特征;融合单元,用于将不同序列位置处的氨基酸的第一特征与对应不同序列位置的三维坐标处的氨基酸的第二特征进行融合,根据融合特征得到每个氨基酸在抗体序列中不同位置处的概率信息;生成单元,用于根据氨基酸以及氨基酸在抗体序列中不同位置处的概率信息,得到目标抗体序列。

4、根据本公开的第四方法,提供了一种抗体设计模型的训练装置,包括:获取单元,用于获取多个数据样本,每个数据样本包含样本抗原msa序列、样本抗体msa序列、样本抗原抗体复合体与标注抗体序列;构建单元,用于构建包含第一特征提取模块、第二特征提取模块与特征融合模块的神经网络模型;预测单元,用于将所述样本抗原msa序列、所述样本抗体msa序列、所述样本抗原抗体复合体输入所述神经网络模型,根据所述神经网络模型的输出结果,得到预测抗体序列;训练单元,用于根据所述预测抗体序列与所述标注抗体序列计算损失函数值,使用所述损失函数值调整所述神经网络模型的参数,得到抗体设计模型。

5、根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。

6、根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。

7、根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。

8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种抗体序列的获取方法,包括:

2.根据权利要求1所述的方法,其中,所述根据拼接序列、所述抗原msa序列与所述抗体msa序列中各氨基酸的属性特征,得到所述拼接序列中不同序列位置处的氨基酸的第一特征包括:

3.根据权利要求1所述的方法,其中,所述根据所述graph中各氨基酸的属性特征,得到所述参考抗原抗体复合体中不同三维坐标处的氨基酸的第二特征包括:

4.根据权利要求1所述的方法,其中,所述根据氨基酸以及氨基酸在抗体序列中不同位置处的概率信息,得到目标抗体序列包括:

5.根据权利要求1所述的方法,其中,所述将所述抗原msa序列与所述抗体msa序列进行拼接,根据拼接序列、所述抗原msa序列与所述抗体msa序列中各氨基酸的属性特征,得到所述拼接序列中不同序列位置处的氨基酸的第一特征包括:

6.根据权利要求1所述的方法,其中,所述根据参考抗原抗体复合体中的氨基酸与氨基酸之间的连接关系构建图graph,根据所述graph中各氨基酸的属性特征,得到所述参考抗原抗体复合体中不同三维坐标处的氨基酸的第二特征包括:

7.根据权利要求1所述的方法,其中,所述将不同序列位置处的氨基酸的第一特征与对应不同序列位置的三维坐标处的氨基酸的第二特征进行融合,根据融合特征得到每个氨基酸在抗体序列中不同位置处的概率信息包括:

8.一种抗体设计模型的训练方法,包括:

9.根据权利要求8所述的方法,其中,所述将所述样本抗原msa序列、所述样本抗体msa序列、所述样本抗原抗体复合体输入所述神经网络模型,根据所述神经网络模型的输出结果,得到预测抗体序列包括:

10.一种抗体序列的获取装置,包括:

11.根据权利要求10所述的装置,其中,所述第一特征提取单元在根据拼接序列、所述抗原msa序列与所述抗体msa序列中各氨基酸的属性特征,得到所述拼接序列中不同序列位置处的氨基酸的第一特征时,具体执行:

12.根据权利要求10所述的装置,其中,所述第二特征提取单元在根据所述graph中各氨基酸的属性特征,得到所述参考抗原抗体复合体中不同三维坐标处的氨基酸的第二特征时,具体执行:

13.根据权利要求10所述的装置,其中,所述生成单元在根据氨基酸以及氨基酸在抗体序列中不同位置处的概率信息,得到目标抗体序列时,具体执行:

14.根据权利要求10所述的装置,其中,所述第一特征提取单元在将所述抗原msa序列与所述抗体msa序列进行拼接,根据拼接序列、所述抗原msa序列与所述抗体msa序列中各氨基酸的属性特征,得到所述拼接序列中不同序列位置处的氨基酸的第一特征时,具体执行:

15.根据权利要求10所述的装置,其中,所述第二特征提取单元在根据参考抗原抗体复合体中的氨基酸与氨基酸之间的连接关系构建图graph,根据所述graph中各氨基酸的属性特征,得到所述参考抗原抗体复合体中不同三维坐标处的氨基酸的第二特征时,具体执行:

16.根据权利要求10所述的装置,其中,所述融合单元在将不同序列位置处的氨基酸的第一特征与对应不同序列位置的三维坐标处的氨基酸的第二特征进行融合,根据融合特征得到每个氨基酸在抗体序列中不同位置处的概率信息时,具体执行:

17.一种抗体设计模型的训练装置,包括:

18.根据权利要求17所述的装置,其中,所述预测单元在将所述样本抗原msa序列、所述样本抗体msa序列、所述样本抗原抗体复合体输入所述神经网络模型,根据所述神经网络模型的输出结果,得到预测抗体序列时,具体执行:

19.一种电子设备,包括:

20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。

21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。

技术总结本公开提供一种抗体序列的获取与抗体设计模型的训练方法。获取方法包括:根据抗原MSA序列与抗体MSA序列的拼接序列、抗原MSA序列与抗体MSA序列,得到不同序列位置处的氨基酸的第一特征;根据参考抗原抗体复合体所构建的图Graph,得到不同三维坐标处的氨基酸的第二特征;将不同序列位置处的氨基酸的第一特征与对应不同序列位置的三维坐标处的氨基酸的第二特征融合,根据融合特征得到每个氨基酸在不同位置处的概率信息;根据氨基酸与氨基酸在同位置处的概率信息得到目标抗体序列。训练方法包括:获取多个数据样本;构建包含第一特征提取模块、第二特征提取模块与特征融合模块的神经网络模型;使用多个数据样本对神经网络模型进行训练,得到抗体设计模型。技术研发人员:郜杰,胡靖,方晓敏,张肖男受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/9/2

本文地址:https://www.jishuxx.com/zhuanli/20240905/286580.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。