技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > B细胞表位预测方法及装置  >  正文

B细胞表位预测方法及装置

  • 国知局
  • 2024-07-11 17:42:23

本发明涉及机器学习,具体而言,涉及一种b细胞表位预测方法及装置。

背景技术:

1、b细胞(也称为b淋巴细胞)是人体免疫系统中的一类重要细胞,它们的任务是识别和中和入侵机体的病原体,如病毒、细菌和其他微生物。b细胞通过其表面上的抗体分子来实现这一任务,每个抗体分子都具有特定的结构。抗体分子上一个关键的组成部分是抗体的表位,也称为抗原结合部位或抗原决定簇。表位是能够被特异性b细胞受体识别的部分。b细胞表位的准确预测不仅有助于基础免疫学研究,而且也有助于疫苗和抗体的研究与开发,有助于疾病的预防与诊断。

2、随着计算机技术的发展,基于机器学习方法在表位预测中也得到了应用,例如支持向量机和随机森林等。基于机器学习的b细胞抗原表位预测是确定抗原表位的一个重要技术路线,能够处理更复杂的数据。相比其他技术路线具有大幅节省时间、金钱、人力成本的优势。但是,基于机器学习的表位预测在应对蛋白质时存在预测准确率低的问题,使得适用性和灵活性受到限制,难以达到理想的预测效果。

技术实现思路

1、有鉴于此,本发明提供一种b细胞表位预测方法及装置,用于解决现有技术中基于机器学习的表位预测准确率低的问题,

2、第一方面,本发明提供了一种b细胞表位预测方法,该方法包括:

3、获取b细胞的蛋白质序列并将所述蛋白质序列进行滑窗分割处理得到所述蛋白质对应的多肽序列;

4、将所述多肽序列输入预设的编码模型进行模型编码处理以及对所述多肽序列进行独热编码处理,得到模型编码处理对应的第一编码序列和独热编码处理对应的第二编码序列;

5、采用卷积神经网络分别对所述第一编码序列和所述第二编码序列进行特征提取处理得到第一特征序列和第二特征序列,采用长短期记忆网络对所述第一特征序列和所述第二特征序列进行依赖关系捕获处理得到第一全局序列信息和第二全局序列信息;

6、将所述第一全局序列信息和所述第二全局序列信息进行融合处理并对融合处理后的序列信息进行降低维度处理,得到表位预测结果。

7、第二方面,本发明提供了一种b细胞表位预测装置,该装置包括:

8、分割单元,用于获取b细胞的蛋白质序列并将所述蛋白质序列进行滑窗分割处理得到所述蛋白质对应的多肽序列;

9、编码单元,用于将所述多肽序列输入预设的编码模型进行模型编码处理以及对所述多肽序列进行独热编码处理,得到模型编码处理对应的第一编码序列和独热编码处理对应的第二编码序列;

10、提取单元,用于采用卷积神经网络分别对所述第一编码序列和所述第二编码序列进行特征提取处理得到第一特征序列和第二特征序列,采用长短期记忆网络对所述第一特征序列和所述第二特征序列进行依赖关系捕获处理得到第一全局序列信息和第二全局序列信息;

11、预测单元,用于将所述第一全局序列信息和所述第二全局序列信息进行融合处理并对融合处理后的序列信息进行降低维度处理,得到表位预测结果。

12、第三方面,本发明提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线;其中,

13、处理器、通信接口和存储器通过通信总线完成相互间的通信;

14、处理器用于调用存储器中的计算机指令,以执行上述的b细胞表位预测方法的步骤。

15、第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令被执行时使所述计算机执行上述的b细胞表位预测方法的步骤。

16、本发明提出的b细胞表位预测方法及装置,通过对蛋白质序列进行滑窗分割转换为多肽序列并对多肽序列进行编码处理,使蛋白质序列能够转换为适合机器学习模型的输入格式;通过卷积神经网络对编码序列进行特征提取,能够从蛋白质序列中提取出识别表位的特征序列,结合长短期记忆网络对特征序列的依赖关系进行捕获,不仅能够得到蛋白质序列的特征序列还能确定蛋白质序列的动态变化,这种卷积神经网络和长短期记忆网络结合的方式能够大幅提高了表位预测的准确性。通过将第一全局序列信息和第二全局序列信息融合,相比较单一的序列信息更加能够提高表位预测的准确性。

17、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

技术特征:

1.一种b细胞表位预测方法,其特征在于,包括:

2.根据权利要求1所述的b细胞表位预测方法,其特征在于,所述将所述多肽序列输入预设的编码模型进行模型编码处理,包括:

3.根据权利要求1所述的b细胞表位预测方法,其特征在于,所述对所述多肽序列进行独热编码处理,包括:

4.根据权利要求1所述的b细胞表位预测方法,其特征在于,所述采用卷积神经网络分别对所述第一编码序列和所述第二编码序列进行特征提取处理得到第一特征序列和第二特征序列,包括:

5.根据权利要求1所述的b细胞表位预测方法,其特征在于,所述采用长短期记忆网络对所述第一特征序列和所述第二特征序列进行依赖关系捕获处理,包括:

6.根据权利要求1所述的b细胞表位预测方法,其特征在于,所述将所述第一全局序列信息和所述第二全局序列信息进行融合处理,包括:

7.根据权利要求1所述的b细胞表位预测方法,其特征在于,所述对融合处理后的序列信息进行降低维度处理包括:

8.一种b细胞表位预测装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:处理器、存储器、通信接口和通信总线;其中,

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令被执行时使所述计算机执行权利要求1-7任一项所述的b细胞表位预测方法的步骤。

技术总结本发明提供了一种B细胞表位预测方法及装置。涉及机器学习技术领域。本发明提供的一种B细胞表位预测方法及装置,通过对蛋白质序列进行滑窗分割转换为多肽序列并对多肽序列进行编码处理,使蛋白质序列能够转换为适合机器学习模型的输入格式;通过卷积神经网络对编码序列进行特征提取,能够从蛋白质序列中提取出识别表位的特征序列,结合长短期记忆网络对特征序列的依赖关系进行捕获,不仅能够得到蛋白质序列的特征序列还能确定蛋白质序列的动态变化,这种卷积神经网络和长短期记忆网络结合的方式能够大幅提高了表位预测的准确性。通过将第一全局序列信息和第二全局序列信息融合,相比较单一的序列信息更加能够提高表位预测的精准度。技术研发人员:张靖,樊瑜波,邰呈正受保护的技术使用者:北京航空航天大学技术研发日:技术公布日:2024/6/11

本文地址:https://www.jishuxx.com/zhuanli/20240615/85723.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。