一种基于胶囊神经的转录因子预测方法
- 国知局
- 2024-07-12 10:23:14
本发明涉及计算生物分子学领域,特别是涉及利用人工智能理论和方法计算预测转录因子。
背景技术:
1、转录因子是一种特别的蛋白质,与rna聚合酶共同参与dna特定位点的绑定,从而控制着靶标基因的表达。转录因子分布广泛,其数量随着基因组大小而变化。基因组越大,转录因子的数量可能就越多。保守估计,人类基因中有10%的基因负责编码转录因子。转录因子在生物体内参与许多重要的细胞过程,包括控制转录调控、负责细胞分化、对细胞间信号做出反应等。
2、确定蛋白质是否为转录因子是探索其调控功能十分关键的一步。传统的生物医学技术主要采用物理或化学方法也称为湿实验。湿实验包括基于selex、mitomi和chip的方法。通过湿实验可以鉴别大多数的转录因子,然而湿实验耗费大量的时间和金钱。目前也存在机器学习预测方法(li et al.和liu et al.),但其预测精度上仍可以提高。所以本发明提出了一种基于胶囊神经网络的转录因子预测方法,所提出的方法在预测性能上更加优越。
技术实现思路
1、本发明主要解决的技术问题是,针对现有方法的不足,提供了一种基于胶囊神经网络的转录因子预测方法,通过学习现有转录因子数据的潜在模式,该发明可以有效的识别转录因子。
2、为解决上述技术问题,本发明提供了一种基于胶囊网络的转录因子预测方法,步骤如下:
3、步骤1:对转录因子蛋白质序列进行预处理;
4、步骤2:构建一种基于胶囊网络的深度神经网络模型;
5、步骤3:利用已知转录因子数据,训练深度神经网络模型;
6、步骤4:利用训练好的深度神经网络模型,对未知的蛋白质序列进行转录因子预测。
7、其中步骤1包含以下内容:截取蛋白质序列前500个氨基酸残基作为序列样本,对于序列长度小于500的蛋白质序列使用字符‘x’进行填充。21个氨基酸字符对应0,1,2,…,20等21个整数,将字符序列映射为整数序列。
8、其中步骤2包含以下内容:构建基于胶囊网络的深度神经网络模型,其结构包括嵌入层、双向长短时记忆网络层、胶囊网络层、扁平化层和全连接层。
9、其中步骤3包含以下内容:对正样本标注为1,对负样本标注为0,利用训练集对深度学习神经网络模型进行有监督训练,并将训练完后的模型进行保存。
10、其中步骤4包含以下内容:对未知蛋白质序列经过步骤1中数据预处理得到数值化序列,紧接着送入训练后的深度神经网络模型。若深度神经网络模型输出为1,则预测蛋白质为转录因子;否则不是转录因子。
11、有益结果。
12、本发明主要利用双向长短时记忆网络和胶囊网络发明了一种转录因子预测方法;通过双向长短时记忆网络对蛋白质序列进行语义信息提取,并加上胶囊网络对语义信息进一步提炼,该方法能够很好的提取到转录因子序列信息。通过实验结果表明,使用本发明方法能够有效且高通量地预测转录因子。
技术特征:1.一种基于胶囊网络的转录因子预测方法,其特征在于,包括以下步骤:
2.根据权力要求书1所述的一种基于胶囊网络的转录因子预测方法,其特征在于,在所述步骤1中包括以下内容:截取蛋白质序列前500个氨基酸残基作为序列样本,对于序列长度小于500的蛋白质序列使用字符‘x‘进行填充;21个氨基酸字符对应0,1,2,…,20等21个整数,将字符序列映射为整数序列。
3.根据权力要求书1所述的一种基于胶囊网络的转录因子预测方法,其特征在于,在所述步骤2中包括以下内容:
4.根据权力要求书1所述的一种基于胶囊网络的转录因子预测方法,其特征在于,在所述步骤3中包括以下内容:对正样本标注为1,对负样本标注为0,利用训练集对深度神经网络模型进行有监督训练。
5.根据权力要求书1所述的一种基于胶囊网络的转录因子预测方法,其特征在于,在所述步骤4中包括以下内容:将未知蛋白质序列经过步骤1中数据预处理得到数值化序列,紧接着送入训练后的深度神经网络模型。
6.若深度神经网络模型输出为1,则预测蛋白质为转录因子;否则不是转录因子。
技术总结本发明公开了一种基于胶囊网络的转录因子预测方法,包括:对蛋白质序列定长和数字化预处理;构建有Embedding层、双向长短时记忆层、胶囊网络层和三层全连接层依次连接的深度神经网络模型;对深度神经网络模型进行有监督训练;未知蛋白质序列经过序列定长和数字化预处理后,输入训练后的深度神经网络模型得到0或1的输出结果,1表示预测为转录因子,0表示预测不是转录因子。本发明专利将胶囊网络应用到转录因子预测,极大地提高了转录因子预测准确率,降低了转录因子筛选和识别的成本。技术研发人员:黄国华,郑佩杰,齐月受保护的技术使用者:邵阳学院技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240614/86610.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。