一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息获取方法、存储介质和电子设备与流程

2022-11-19 09:28:00 来源:中国专利 TAG:


1.本技术涉及计算机领域,具体而言,涉及一种信息获取方法、装置和存储介质及电子设备。


背景技术:

2.在单级结构对象的信息获取场景中,可以采用单一维度下的结构以获取信息;但对于由多级结构构成的多级结构对象来说,其复杂度远大于单级结构对象,如此若还采用单一维度下的结构进行相关信息的获取,通常会缺失对另一或多维度下的结构分析,进而影响获取到的信息的准确性。因此,存在信息获取的准确性较低的问题。
3.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本技术实施例提供了一种信息获取方法、装置和存储介质及电子设备,以至少解决信息获取的准确性较低的技术问题。
5.根据本技术实施例的一个方面,提供了一种信息获取方法,包括:获取多级结构对象的目标组成结构对应的第一级特征,其中,上述多级结构对象是多个目标组成结构连接构成,上述第一级特征为上述目标组成结构在第一维度下的特征;对上述多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到上述目标组成结构对应的第二级特征,其中,上述第二级特征为上述目标组成结构在第二维度下的特征,上述目标组成结构由多个上述第二维度下的目标组成结构构成,上述第二维度下的目标组成结构由多个上述第一维度下的目标组成结构构成;基于上述第二级特征,获取上述多级结构对象对应的交互属性信息,其中,上述交互属性信息用于预测上述多级结构对象在与其他结构对象进行交互时的表现。
6.根据本技术实施例的另一方面,还提供了一种信息获取装置,包括:第一获取单元,用于获取多级结构对象的目标组成结构对应的第一级特征,其中,上述多级结构对象是多个目标组成结构连接构成,上述第一级特征为上述目标组成结构在第一维度下的特征;聚合单元,用于对上述多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到上述目标组成结构对应的第二级特征,其中,上述第二级特征为上述目标组成结构在第二维度下的特征,上述目标组成结构由多个上述第二维度下的目标组成结构构成,上述第二维度下的目标组成结构由多个上述第一维度下的目标组成结构构成;第二获取单元,用于基于上述第二级特征,获取上述多级结构对象对应的交互属性信息,其中,上述交互属性信息用于预测上述多级结构对象在与其他结构对象进行交互时的表现。
7.作为一种可选的方案,上述第一获取单元,包括:提取模块,用于提取上述多级结构对象对应的目标图像中的图像特征;第一获取模块,用于基于上述图像特征得到多个上述第一维度下的目标组成结构中各个第一组成结构对应的初始第一级特征;第二获取模块,用于基于上述初始第一级特征,获取上述各个第一组成结构对应的第一级特征。
8.作为一种可选的方案,上述第二获取模块,包括:第一获取子模块,用于获取由上述各个第一组成结构构成的多个第一组成结构对;计算子模块,用于计算上述多个第一组成结构对中各个第一组成结构对的第一结构对特征,其中,上述第一结构对特征包括上述第一组成结构对中每个第一组成结构对应的结构特征、以及上述每个第一组成结构之间的相对距离特征;第二获取子模块,用于基于上述第一结构对特征,获取上述各个第一组成结构对应的第一级特征。
9.作为一种可选的方案,上述第二获取子模块,包括:执行子单元,用于执行以下步骤,直至达到收敛条件:对上述各个第一组成结构对的第一结构对特征进行聚合处理,得到目标结构对特征;合并上述目标结构对特征与上述各个第一组成结构对应的结构特征,得到上述各个第一组成结构对应的新的结构特征;在达到上述收敛条件的情况下,将上述各个第一组成结构对应的新的结构特征确定为上述各个第一组成结构对应的第一级特征;在未达到上述收敛条件的情况下,利用上述各个第一组成结构对应的新的结构特征重新计算上述第一结构对特征,得到上述各个第一组成结构对的新的第一结构对特征,并将上述各个第一组成结构对的新的第一结构对特征确定为上述各个第一组成结构对的第一结构对特征,以及将上述各个第一组成结构对应的新的原子特征确定为上述各个第一组成结构对应的结构特征。
10.作为一种可选的方案,上述第一获取模块,包括:第三获取子模块,用于基于上述图像特征得到上述各个第一组成结构对应的第一结构特征、以及上述各个第一组成结构所在的上述第二维度下的目标组成结构对应的目标结构特征;拼接子模块,用于对上述第一结构特征以及上述目标结构特征进行拼接处理,得到上述各个第一组成结构对应的第二结构特征,其中,上述初始第一级特征包括上述第二结构特征。
11.作为一种可选的方案,上述第二获取单元,包括以下至少之一:第三获取模块,用于获取由上述多个上述第二维度下的目标组成结构中各个第二组成结构构成的多个第二组成结构对;基于上述第二级特征,计算上述多个第二组成结构对中各个第二组成结构对的第一目标结构特征,其中,上述第一目标结构特征用于表示上述第二组成结构对中每个第二组成结构之间的特征内积相似性;基于上述第一目标结构特征获取上述交互属性信息;第四获取模块,用于获取上述多个第二组成结构对;基于上述第二级特征,计算上述各个第二组成结构对的第二目标结构特征,其中,上述第二目标结构特征用于表示上述每个第二组成结构之间通过线性映射在序列上时呈现的相对距离;基于上述第二目标结构特征获取上述交互属性信息;第五获取模块,用于获取上述多个第二组成结构对;基于上述第二级特征,计算上述各个第二组成结构对的第三目标结构特征,其中,上述第三目标结构特征用于表示上述每个第二组成结构之间的碳原子距离;基于上述第三目标结构特征获取上述交互属性信息。
12.作为一种可选的方案,上述第二获取单元,包括:第一聚合模块,用于在获取到上述第一目标结构特征、上述第二目标结构特征、以及上述第三目标结构特征的情况下,对上述第一目标结构特征、上述第二目标结构特征、以及上述第三目标结构特征进行聚合处理,得到聚合结构特征;合并模块,用于通过向量拼接,对上述聚合结构特征与上述第二级特征进行合并处理,得到输出结构特征;第六获取模块,用于基于上述输出结构特征获取上述交互属性信息。
13.作为一种可选的方案,上述第二获取模块,包括:第一输入子模块,用于将上述初始第一级特征输入第一目标模型,通过上述第一目标模型中的第一子结构进行信息传递,得到上述各个第一组成结构对应的第一级特征,其中,上述第一目标模型为利用第一样本训练得到的、用于特征处理的神经网络模型;上述聚合单元,包括:第二聚合模块,用于通过上述第一目标模型中的第二子结构,对上述各个第一组成结构对应的第一级特征进行聚合处理,得到上述目标组成结构对应的第二级特征。
14.作为一种可选的方案,上述第二获取单元,包括:输入模块,用于将上述第二级特征输入第二目标模型,通过上述第二目标模型的第三子结构进行信息传递,得到上述各个第二组成结构对应的输入结构特征,其中,上述第二目标模型为利用第二样本训练得到的、用于特征处理的神经网络模型;输出模块,用于通过上述第二目标模型的第四子结构,对上述各个第二组成结构对应的输入结构特征进行预测输出,得到上述交互属性信息。
15.作为一种可选的方案,上述装置包括:第三获取单元,用于在上述获取多级结构对象的目标组成结构对应的第一级特征之前,获取上述多级结构对象的目标结构数量,其中,上述目标结构数量包括以下至少之一:上述多个目标组成结构中的目标组成结构对应的第一数量、上述多个上述第二维度下的目标组成结构中的第二组成结构对应的第二数量、上述多个上述第一维度下的目标组成结构中的第一组成结构对应的第三数量;计算单元,用于基于上述目标结构数量,计算上述交互属性信息的获取复杂度,其中,上述获取复杂度用于表示获取上述交互属性信息时所要执行的操作的复杂度。
16.作为一种可选的方案,上述第二获取单元,包括:第七获取模块,用于基于上述第二级特征与上述多个上述第一维度下的目标组成结构中的各个第一组成结构对应的理化特征,获取上述交互属性信息,其中,上述理化特征包括以下至少之一:用于表示上述第一组成结构中未参与脱水成键的目标子结构的亲水性的第一特征、用于表示上述目标子结构的疏水性的第二特征,用于表示上述目标子结构所带的电荷的第三特征。
17.作为一种可选的方案,上述第一获取单元,包括:第八获取模块,用于获取待检测的蛋白质中的氨基酸对应的分子特征;上述聚合单元,包括:第三聚合模块,用于对上述分子特征进行聚合处理,得到上述氨基酸对应的原子特征;上述第二获取单元,包括:第九获取模块,用于基于上述原子特征,获取上述待检测的蛋白质对应的交互属性信息。
18.根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上信息获取方法。
19.根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的信息获取方法。
20.在本技术实施例中,获取多级结构对象的目标组成结构对应的第一级特征,其中,上述多级结构对象是多个目标组成结构连接构成,上述第一级特征为上述目标组成结构在第一维度下的特征;对上述多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到上述目标组成结构对应的第二级特征,其中,上述第二级特征为上述目标组成结构在第二维度下的特征,上述目标组成结构由多个上述第二维度下的目标组成结构构
成,上述第二维度下的目标组成结构由多个上述第一维度下的目标组成结构构成;基于上述第二级特征,获取上述多级结构对象对应的交互属性信息,其中,上述交互属性信息用于预测上述多级结构对象在与其他结构对象进行交互时的表现,利用先获取一个维度下的特征、再利用该一个维度下的特征获取下一个维度下的特征的方式,为交互属性信息的获取提供多维度的参考特征,进而达到了采用多维度的参考特征以获取复杂场景下的交互属性信息的目的,从而实现了提高信息获取准确性的技术效果,进而解决了信息获取的准确性较低的技术问题。
附图说明
21.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
22.图1是根据本技术实施例的一种可选的信息获取方法的应用环境的示意图;
23.图2是根据本技术实施例的一种可选的信息获取方法的流程的示意图;
24.图3是根据本技术实施例的一种可选的信息获取方法的示意图;
25.图4是根据本技术实施例的另一种可选的信息获取方法的示意图;
26.图5是根据本技术实施例的另一种可选的信息获取方法的示意图;
27.图6是根据本技术实施例的另一种可选的信息获取方法的示意图;
28.图7是根据本技术实施例的另一种可选的信息获取方法的示意图;
29.图8是根据本技术实施例的另一种可选的信息获取方法的示意图;
30.图9是根据本技术实施例的另一种可选的信息获取方法的示意图;
31.图10是根据本技术实施例的一种可选的信息获取装置的示意图;
32.图11是根据本技术实施例的一种可选的电子设备的结构示意图。
具体实施方式
33.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
34.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
35.人工智能(artificial intelligence,简称ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了
解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
36.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
37.计算机视觉技术(computer vision,简称cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
38.机器学习(machine learning,简称ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
39.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
40.本技术实施例提供的方案涉及人工智能的计算机视觉技术、机器学习等技术,具体通过如下实施例进行说明:
41.根据本技术实施例的一个方面,提供了一种信息获取方法,可选地,作为一种可选的实施方式,上述信息获取方法可以但不限于应用于如图1所示的环境中。其中,可以但不限于包括用户设备102以及服务器112,该用户设备102上可以但不限于包括显示器108、处理器106及存储器1004,该服务器112包括数据库114以及处理引擎116。
42.具体过程可如下步骤:
43.步骤s102,用户设备102获取多级结构对象的目标组成结构对应的第一级特征;
44.步骤s104-s106,通过网络110将第一级特征发送至服务器112;
45.步骤s108,服务器112通过处理引擎116对第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,并进一步基于第二级特征,获取多级结构对象对应的交互属性信息;
46.步骤s110-s112,通过网络110将交互属性信息发送至用户设备102,用户设备102通过处理器106将交互属性信息显示在显示器108,并将上述交互属性信息存储在存储器104。
47.除图1示出的示例之外,上述步骤可以由服务器辅助完成,即由服务器执行对第一级特征进行聚合处理、获取多级结构对象对应的交互属性信息等步骤,从而减轻服务器的处理压力。该用户设备102包括但不限于手持设备(如手机)、笔记本电脑、台式电脑、车载设备等,本技术并不限制用户设备102的具体实现方式。
48.可选地,作为一种可选的实施方式,如图2所示,信息获取方法包括:
49.s202,获取多级结构对象的目标组成结构对应的第一级特征,其中,多级结构对象是多个目标组成结构连接构成,第一级特征为目标组成结构在第一维度下的特征;
50.s204,对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,其中,第二级特征为目标组成结构在第二维度下的特征,目标组成结构由多个第二维度下的目标组成结构构成,第二维度下的目标组成结构由多个第一维度下的目标组成结构构成;
51.s206,基于第二级特征,获取多级结构对象对应的交互属性信息,其中,交互属性信息用于预测多级结构对象在与其他结构对象进行交互时的表现。
52.可选地,在本实施例中,上述信息获取方法可以但不限于应用在蛋白质交互的多种预测任务,如先将蛋白质表示为3d空间中的点云或k近邻图,再利用几何神经网络或图神经网络将点云或图表示成特征向量,进一步基于特征向量获取蛋白质的交互属性信息;得到蛋白质的交互属性信息,还可以但不限于应用于涉及到蛋白质较为快速、低成本的药物分析和筛选等具体落地场景。
53.可选地,在本实施例中,多级结构对象可以但不限于理解为由多级结构共同组成的结构对象,如由氨基酸组成的蛋白质、由视频帧构成的媒体视频、由多个结构层搭建的神经网络等,且多级结构对象还可以但不限理解为存在与其他结构对象进行交互的应用场景的对象,预测对象在交互时的表现是对信息准确性的挑战,进而也产生了需要信息保证一定的信息准确性的需求。
54.可选地,在本实施例中,多级结构对象、目标组成结构、第二维度下的目标组成结构和第一维度下的目标组成结构之间的关系可以但不限于包括:多级结构对象是多个目标组成结构连接构成,目标组成结构由多个第二维度下的目标组成结构构成,第二维度下的目标组成结构由多个第一维度下的目标组成结构构成;
55.如蛋白质由多条氨基酸构成,氨基酸由多个分子构成,分子由原子构成,具体地,在蛋白质中,氨基酸分子经化学成键,以残基的形式存在,从而氨基酸分子也可理解为氨基酸残基;进一步进假设将蛋白质作为多级结构对象,则氨基酸可以但不限于理解为目标组成结构、氨基酸的分子可以但不限于理解为第一维度(分子维度)下的目标组成结构、氨基酸的原子可以但不限于理解为第二维度(原子维度)下的目标组成结构;
56.再如一段视频由多帧视频构成,一帧视频由多张图像构成,一张图像由多个像素点构成,进而假设将一段视频作为多级结构对象,则视频帧可以但不限于理解为目标组成结构、图像可以但不限于理解为第一维度(图像维度)下的目标组成结构、像素点可以但不限于理解为第二维度(像素维度)下的目标组成结构;
57.进一步举例说明,可选地将本实施例应用在视频处理的场景下,例如线获取一段视频a(多级结构对象)的视频帧(目标组成结构)对应的像素级特征(第一级特征);对各个帧级特征进行聚合处理,得到视频帧(目标组成结构)对应的帧级特征(第二级特征);基于
帧级特征(第二级特征),获取一段视频(多级结构对象)对应的交互属性信息,其中,交互属性信息用于预测一段视频a(多级结构对象)在与其他视频进行交互(如视频融合、ai换脸等交互)时的表现(如视频融合时的匹配程度、ai换脸时的真实程度等)。
58.可选地,在本实施例中,由于第二维度下的目标组成结构由多个第一维度下的目标组成结构构成,进而可通过先获取目标组成结构在第一维度下的特征,再进一步由目标组成结构在第一维度下的特征推算出目标组成结构在第二维度下的特征,以此获得多个维度下的不同特征,并进一步利用上述多个维度下的不同特征,获取准确性更高的交互属性信息;
59.进一步在本实施例中,对所述多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到所述目标组成结构对应的第二级特征可以但不限于理解为,通过聚合处理的方式,基于各个目标组成结构在第一维度下的特征处理推算出各个目标组成结构在第二维度下的特征;其中,聚合处理可以但不限理解为将分散的对象聚集到一起的操作,还可以但不限于将多个对象以预设的条件进行聚集,以得到集合形式的目标对象,例如连锁聚合、逐步聚合、本体聚合、悬浮聚合等。
60.可选地,在本实施例中,第一维度、第二维度可以但不限理解为单位层级,例如蛋白质在分子层级表现为氨基酸的分子,或者说分子维度下的蛋白质为氨基酸的分子;同理,蛋白质在原子层级表现为氨基酸的原子,或者说原子维度下的蛋白质为氨基酸的原子。
61.可选地,在本实施例中,交互属性信息用于预测多级结构对象在与其他结构对象进行交互时的表现,或可理解为限定多级结构对象为需要与其他结构对象进行交互的结构对象;在本实施例中,旨于解决对结构对象对应的信息的获取准确性较低的技术问题,但并不是所有的结构对象都存在上述技术问题,因此本实施例实际针对的可以但不限于理解为是多级结构对象对应的交互属性信息的获取准确性较低的技术问题。即,多级的结构对象存在更多维度的特征因素,若在信息获取过程中忽略部分维度,则会进一步导致获取到的信息缺失对应维度下的分析,降低信息的获取准确性;而对于交互属性信息,相比于结构对象静态存在时候的信息表现,交互时所产生的、动态表现的信息复杂度更高,而更难保证信息的准确性。
62.需要说明的是,利用先获取一个维度下的特征、再利用该一个维度下的特征获取下一个维度下的特征的方式,为交互属性信息的获取提供多维度的参考特征,并通过采用多维度的参考特征以获取复杂场景下的交互属性信息,进而提高了交互属性信息的获取准确性。
63.进一步举例说明,可选的例如图3所示,第二组成结构304(第二维度下的目标组成结构)由多个第一组成结构302(第一维度下的目标组成结构)构成,目标组成结构306由多个第二组成结构304(第二维度下的目标组成结构)构成,多级结构对象308是多个目标组成结构306连接构成;
64.具体的,在本实施例中,获取多级结构对象308的目标组成结构306对应的第一级特征,其中,第一级特征也可以但不限于理解为多级结构对象308的第一组成结构302的特征;对各个目标组成结构306对应的第一级特征进行聚合处理,得到目标组成结构306对应的第二级特征,其中,第二级特征也可以但不限于理解为多级结构对象308的第二组成结构304的特征;基于第二级特征,获取多级结构对象308对应的交互属性信息,其中,交互属性
信息用于预测多级结构对象308在与其他结构对象进行交互时的表现。
65.通过本技术提供的实施例,获取多级结构对象的目标组成结构对应的第一级特征,其中,多级结构对象是多个目标组成结构连接构成,第一级特征为目标组成结构在第一维度下的特征;对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,其中,第二级特征为目标组成结构在第二维度下的特征,目标组成结构由多个第二维度下的目标组成结构构成,第二维度下的目标组成结构由多个第一维度下的目标组成结构构成;基于第二级特征,获取多级结构对象对应的交互属性信息,其中,交互属性信息用于预测多级结构对象在与其他结构对象进行交互时的表现,利用先获取一个维度下的特征、再利用该一个维度下的特征获取下一个维度下的特征的方式,为交互属性信息的获取提供多维度的参考特征,进而达到了采用多维度的参考特征以获取复杂场景下的交互属性信息的目的,从而实现了提高信息获取准确性的技术效果。
66.作为一种可选的方案,获取多级结构对象的目标组成结构对应的第一级特征,包括:
67.s1,提取多级结构对象对应的目标图像中的图像特征;
68.s2,基于图像特征得到多个第一维度下的目标组成结构中各个第一组成结构对应的初始第一级特征;
69.s3,基于初始第一级特征,获取各个第一组成结构对应的第一级特征。
70.可选地,在本实施例中,初始第一级特征可以但不限于能从图像特征中直接得到的各个第一组成结构对应的独立特征,该独立特征可以但不限于仅用于表示第一组成结构自身的结构特征,而不涉及不同第一组成结构之间的相对特征。
71.可选地,在本实施例中,可以但不限于基于图(graph)的表示学习方式,采用图的建模方式深入多级结构对象的结构特性,如将多级结构对象表示为3d空间中的点云或k近邻图,再利用几何神经网络或图神经网络将点云或图表示成向量;
72.进一步举例说明,可选地例如将一个目标组成结构作为图的节点,目标组成结构之间的距离表示为边;或,将第二维度下的目标组成结构表示为图的节点,第二维度下的目标组成结构之间的距离表示为边;或,将第一维度下的目标组成结构表示为图的节点,第一维度下的目标组成结构之间的距离表示为边。
73.需要说明的是,无论是基于目标组成结构为核心的建模方式、还是基于第二维度下的目标组成结构为核心的建模方式,或是基于第一维度下的目标组成结构为核心的建模方式,往往都无法很好地表示出多级结构对象在多级维度的丰富内容,因此在本实施例中,从第一维度下的目标组成结构、以及第二维度下的目标组成结构两个维度,层次化地表示第一维度下的目标组成结构、与第二维度下的目标组成结构在多级结构对象中相互作用。
74.通过本技术提供的实施例,提取多级结构对象对应的目标图像中的图像特征;基于图像特征得到多个第一维度下的目标组成结构中各个第一组成结构对应的初始第一级特征;基于初始第一级特征,获取各个第一组成结构对应的第一级特征,进而达到了利用图像形式实现对第一级特征的获取的目的,从而实现了提高第一级特征的获取准确性的技术效果。
75.作为一种可选的方案,基于初始第一级特征,获取各个第一组成结构对应的第一
级特征,包括:
76.s1,获取由各个第一组成结构构成的多个第一组成结构对;
77.s2,计算多个第一组成结构对中各个第一组成结构对的第一结构对特征,其中,第一结构对特征包括第一组成结构对中每个第一组成结构对应的结构特征、以及每个第一组成结构之间的相对距离特征;
78.s3,基于第一结构对特征,获取各个第一组成结构对应的第一级特征。
79.可选地,在本实施例中,多个第一组成结构对可以但不限于理解为各个第一组成结构所能构成的、不重复的组合,例如假设第一组成结构a、第一组成结构b、与第一组成结构c之间,所能构成的组合(第一组成结构对)至少包括第一组成结构a与第一组成结构b、第一组成结构b与第一组成结构c、第一组成结构a与第一组成结构c。
80.可选地,在本实施例中,每个第一组成结构对应的结构特征可以但不限用于表示每个第一组成结构自身独立的结构属性,而每个第一组成结构之间的相对距离特征可以但不限用于表示每两个第一组成结构之间相对的距离属性。
81.需要说明的是,获取由各个第一组成结构构成的多个第一组成结构对;计算多个第一组成结构对中各个第一组成结构对的第一结构对特征,其中,第一结构对特征包括第一组成结构对中每个第一组成结构对应的结构特征、以及每个第一组成结构之间的相对距离特征;基于第一结构对特征,获取各个第一组成结构对应的第一级特征。
82.进一步举例说明,可选的假设给定当前的m个结构特征,,且如下述公式(1)所示,m
ij
(第一结构对特征)构造了第一组成结构的边特征,作为传递给第一组成结构ai的消息,其中,m
ij
包含了各个第一组成结构对的结构特征,如(ai,aj),及各个第一组成结构对的相对距离特征,如距离平方|c
i-cj|2。
[0083][0084]
作为一种可选的方案,基于第一结构对特征,获取各个第一组成结构对应的第一级特征,包括:
[0085]
执行以下步骤,直至达到收敛条件:
[0086]
s1,对各个第一组成结构对的第一结构对特征进行聚合处理,得到目标结构对特征;
[0087]
s2,合并目标结构对特征与各个第一组成结构对应的结构特征,得到各个第一组成结构对应的新的结构特征;
[0088]
s3-1,在达到收敛条件的情况下,将各个第一组成结构对应的新的结构特征确定为各个第一组成结构对应的第一级特征;
[0089]
s3-2,在未达到收敛条件的情况下,利用各个第一组成结构对应的新的结构特征重新计算第一结构对特征,得到各个第一组成结构对的新的第一结构对特征,并将各个第一组成结构对的新的第一结构对特征确定为各个第一组成结构对的第一结构对特征,以及将各个第一组成结构对应的新的原子特征确定为各个第一组成结构对应的结构特征。
[0090]
可选地,在本实施例中,收敛条件可以但不限于与新的结构特征相关,如新的结构特征满足特征条件,则表示满足收敛条件;收敛条件还可以但不限于与时间、次数等因素相关,如收敛次数达到3次则表示满足收敛条件。
[0091]
需要说明的是,执行以下步骤,直至达到收敛条件:对各个第一组成结构对的第一结构对特征进行聚合处理,得到目标结构对特征;合并目标结构对特征与各个第一组成结构对应的结构特征,得到各个第一组成结构对应的新的结构特征;在达到收敛条件的情况下,将各个第一组成结构对应的新的结构特征确定为各个第一组成结构对应的第一级特征;在未达到收敛条件的情况下,利用各个第一组成结构对应的新的结构特征重新计算第一结构对特征,得到各个第一组成结构对的新的第一结构对特征,并将各个第一组成结构对的新的第一结构对特征确定为各个第一组成结构对的第一结构对特征,以及将各个第一组成结构对应的新的原子特征确定为各个第一组成结构对应的结构特征;
[0092]
可选的,在本实施例中,如图4所示,对各个第一组成结构对的第一结构对特征进行聚合处理,得到目标结构对特征404;合并目标结构对特征404与各个第一组成结构对应的结构特征,得到各个第一组成结构对应的新的结构特征,以第一组成结构对402为例说明,合并目标结构对特征404与第一组成结构a1对应的结构特征,得到新的结构特征a2、以及合并目标结构对特征404与第一组成结构b1对应的结构特征,得到新的结构特征b2;
[0093]
在达到收敛条件的情况下,将新的结构特征a2确定为第一组成结构a1对应的第一级特征、以及将新的结构特征b2确定为第一组成结构b1对应的第一级特征;而在未达到收敛条件的情况下,将新的结构特征a2作为第一组成结构a1对应的结构特征、以及将新的结构特征b2作为第一组成结构a1对应的结构特征,重新计算并得到新的目标结构对特征,再合并新的目标结构对特征与新的结构特征a2,得到新的结构特征a3、以及合并新的目标结构对特征与新的结构特征b2,得到新的结构特征b3,并再次判断是否达到收敛条件。
[0094]
进一步举例说明,可选的基于上述公式(1),如公式(2)和公式(3)所示,具体的通过对各个第一组成结构对的第一结构对特征的聚合,得到第一层的结构特征;在收敛条件未满足的情况下,基于第一层的结构特征再对各个第一组成结构对的第一结构对特征进行聚合,并合并上一层的结构特征(即第一层的结构特征)以产生新一层的结构特征若此时收敛条件结束,则输出生新一层的原子特征作为各个第一组成结构对应的第一级特征。
[0095][0096][0097]
作为一种可选的方案,基于图像特征得到多个第一维度下的目标组成结构中各个第一组成结构对应的初始第一级特征,包括:
[0098]
s1,基于图像特征得到各个第一组成结构对应的第一结构特征、以及各个第一组成结构所在的第二维度下的目标组成结构对应的目标结构特征;
[0099]
s2,对第一结构特征以及目标结构特征进行拼接处理,得到各个第一组成结构对应的第二结构特征,其中,初始第一级特征包括第二结构特征。
[0100]
可选地,在本实施例中,如下述公式(4)所示,每个初始第一级特征由其结构
特征和所在的第二维度下的目标组成结构决定。
[0101][0102]
其中,ig(ai)和ia(ai)分别为one-hot表示下的第一组成结构ai的第一组成结构类型和第二组成结构类型,第二组成结构可以但不限于为第二维度下的目标组成结构,为向量拼接操作。
[0103]
作为一种可选的方案,基于第二级特征,获取多级结构对象对应的交互属性信息,包括:
[0104]
对多个目标组成结构中各个目标组成结构对应的第二级特征进行求和处理,可选地基于上述公式(1)、公式(2)、公式(3)以及公式(4),继续如下述公式(5)所示,得到最新的第二级特征
[0105][0106]
其中,可以但不限于根据不同的预测任务优化初始表示的生成方法,如只聚合第二组成结构(第二维度下的目标组成结构)中的骨架第一组成结构(第一维度下的目标组成结构)的表示,利用自注意力机制学习每个第一组成结构(第一维度下的目标组成结构)的聚合权重,或利用自注意力机制选择top-k个重要第一组成结构(第一维度下的目标组成结构)聚合。
[0107]
作为一种可选的方案,基于第二级特征,获取多级结构对象对应的交互属性信息,包括以下至少之一:
[0108]
s1,获取由多个第二维度下的目标组成结构中各个第二组成结构构成的多个第二组成结构对;基于第二级特征,计算多个第二组成结构对中各个第二组成结构对的第一目标结构特征,其中,第一目标结构特征用于表示第二组成结构对中每个第二组成结构之间的特征内积相似性;基于第一目标结构特征获取交互属性信息;
[0109]
s2,获取多个第二组成结构对;基于第二级特征,计算各个第二组成结构对的第二目标结构特征,其中,第二目标结构特征用于表示每个第二组成结构之间通过线性映射在序列上时呈现的相对距离;基于第二目标结构特征获取交互属性信息;
[0110]
s3,获取多个第二组成结构对;基于第二级特征,计算各个第二组成结构对的第三目标结构特征,其中,第三目标结构特征用于表示每个第二组成结构之间的碳原子距离;基于第三目标结构特征获取交互属性信息。
[0111]
需要说明的是,获取由多个第二维度下的目标组成结构中各个第二组成结构构成的多个第二组成结构对;基于第二级特征,计算多个第二组成结构对中各个第二组成结构对的第一目标结构特征,其中,第一目标结构特征用于表示第二组成结构对中每个第二组成结构之间的特征内积相似性;基于第一目标结构特征获取交互属性信息;
[0112]
进一步举例说明,可选的例如假设第二组成结构对gi,gj,进而gi,gj之间的特征相似性bias由下述公式(6)计算得到:
[0113]
[0114]
其中,β
ij
通过计算gi,gj的特征内积相似性得到。
[0115]
需要说明的是,获取多个第二组成结构对;基于第二级特征,计算各个第二组成结构对的第二目标结构特征,其中,第二目标结构特征用于表示每个第二组成结构之间通过线性映射在序列上时呈现的相对距离;基于第二目标结构特征获取交互属性信息;
[0116]
进一步举例说明,可选的例如假设第二组成结构对gi,gj,进而gi,gj之间通过线性映射后的序列上的相对距离由下述公式(7)计算得到:
[0117][0118]
其中,z
ij
为gi,gj通过线性映射后的序列上的相对距离。
[0119]
需要说明的是,获取多个第二组成结构对;基于第二级特征,计算各个第二组成结构对的第三目标结构特征,其中,第三目标结构特征用于表示每个第二组成结构之间的碳原子距离;基于第三目标结构特征获取交互属性信息;
[0120]
进一步举例说明,可选的例如假设第二组成结构对gi,gj,进而gi,gj之间通beta碳原子的距离由下述公式(8)计算得到:
[0121][0122]
其中,为gi,gj之间beta碳原子的距离。
[0123]
作为一种可选的方案,基于第二级特征,获取多级结构对象对应的交互属性信息,包括:
[0124]
s1,在获取到第一目标结构特征、第二目标结构特征、以及第三目标结构特征的情况下,对第一目标结构特征、第二目标结构特征、以及第三目标结构特征进行聚合处理,得到聚合结构特征;
[0125]
s2,通过向量拼接,对聚合结构特征与第二级特征进行合并处理,得到输出结构特征;
[0126]
s3,基于输出结构特征获取交互属性信息。
[0127]
可选地,为考虑多方面特性,在本实施例中,基于上述公式(6)、公式(7)以及公式(8),进一步如下述公式(9)所示,综合特征相似性bias,空间距离相似性bias,和序列相对距离bias这三个特性,并通过softmax函数计算出最终的传播注意力权重α
ij
,再利用传播注意力权重α
ij
输出交互属性信息:
[0128][0129]
可选地,在本实施例中,为提高交互属性信息的输出准确性,可以但不限于利用图注意力机制,在交互属性信息的获取过程中加入学习到的权重,具体的利用attention bias机制,将多种相似性作为bias加入attention模块;
[0130]
进一步举例说明,可选地基于上述公式(9),继续例如下述公式(10)、公式(11)、公式(12)、以及公式(13)所示,k层消息传递将第一目标结构特征、第二目标结构特征、以及第三目标结构特征以传播注意力权重α
ij
为权重分别聚合,产生对应的聚合结构特征,如ui,
vi,wi;再通过向量拼接与当前层的结构特征合并,通过网络φ3产生输出特征
[0131][0132][0133][0134][0135]
其中,在上述公式(12)中计算空间特征的聚合时,用到gi的定向矩阵oi,可以但不限于由下列公式(13)以及公式(14)计算得出,
×
为向量外积:
[0136][0137][0138]
作为一种可选的方案,基于初始第一级特征,获取各个第一组成结构对应的第一级特征,包括:将初始第一级特征输入第一目标模型,通过第一目标模型中的第一子结构进行信息传递,得到各个第一组成结构对应的第一级特征,其中,第一目标模型为利用第一样本训练得到的、用于特征处理的神经网络模型;
[0139]
作为一种可选的方案,述对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,包括:通过第一目标模型中的第二子结构,对各个第一组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征。
[0140]
作为一种可选的方案,基于第二级特征,获取多级结构对象对应的交互属性信息,包括:
[0141]
s1,将第二级特征输入第二目标模型,通过第二目标模型的第三子结构进行信息传递,得到各个第二组成结构对应的输入结构特征,其中,第二目标模型为利用第二样本训练得到的、用于特征处理的神经网络模型;
[0142]
s2,通过第二目标模型的第四子结构,对各个第二组成结构对应的输入结构特征进行预测输出,得到交互属性信息。
[0143]
可选地,在本实施例中,为提高信息的获取效率,可以但不限于采用神经网络模型参与流程;
[0144]
进一步举例说明,可选地例如图5所示,第一目标模型502为等变神经网络(equivalent graph neural network,简称egnn),第二目标模型504为几何注意力网络(geometric attention network,简称gan),其中,egnn接受两个输入,全部第一组成结构的特征和对应的坐标c,如第一级特征和坐标;通过k层消息传递获得第一级特征
如更新后的第一级特征;其次,由求和readout层,将每个更新后的第一级特征分别聚合,产生对应的第二级特征如第二级特征1、第二级特征2、第三级特征等。最后,gan接受聚合后的第二级特征征第二组成结构对在序列中的相对距离z
ij
,第二组成结构的β碳原子的坐标作为输入,通过k层消息传递获得更新后的第二级特征其中,更新后的第二级特征可经由下游的readout层用于特定任务的预测,得到预测结果;
[0145]
具体的,在本实施例中,基于图5所示场景,继续例如图6所示,第一目标模型502为一个三层的egnn神经网络架构,对输入的坐标和特征1做特征提取出来,得到相对距离、src(稀疏表达)、dst(组合表达),并将特征提取结果输入第一个mlp,得到多个边信息;对上述多个边信息进行聚合处理,得到聚合信息,再输入第二个mlp,得到特征2;进一步通过聚合等处理方式,得到特征3,并在当前未满足迭代结束条件的情况下,从头开始迭代执行,其中,两个mlp可以但不限于理解为上述公式(1)中的φe和上述公式(3)中的φh。
[0146]
可选地,在本实施例中,基于图5所示场景,继续例如图7所示,第二目标模型504为一个三层gan的神经网络架构,首先获取特征、距离、序列等输入信息,综合上述多种输入信息的相似性,并通过softmax函数计算出对应的传播注意力权重;再利用该传播注意力权重对每一种输入信息进行权重分配处理,得到新的输入信息,如特征*、距离*、序列*等;进一步,对特征*、距离*、序列*等新的输入信息做合并处理,得到目标特征,并基于目标特征判断是否达到收敛条件,若否,则继续迭代执行上述步骤,若是,则输出目标特征。
[0147]
作为一种可选的方案,在获取多级结构对象的目标组成结构对应的第一级特征之前,方法包括:
[0148]
s1,获取多级结构对象的目标结构数量,其中,目标结构数量包括以下至少之一:多个目标组成结构中的目标组成结构对应的第一数量、多个第二维度下的目标组成结构中的第二组成结构对应的第二数量、多个第一维度下的目标组成结构中的第一组成结构对应的第三数量;
[0149]
s2,基于目标结构数量,计算交互属性信息的获取复杂度,其中,获取复杂度用于表示获取交互属性信息时所要执行的操作的复杂度。
[0150]
可选地,在本实施例中,假设多级结构对象中包含l个第二维度下的目标组成结构,m个第一维度下的目标组成结构,且假设采用神经网络模型参与流程,以及神经网络模型中固定维度的向量加、乘、拼接和内积计算的复杂度为常数。进一步对于第一维度下的特征表示学习,上述公式(1)、公式(2)以及公式(3)的计算复杂度为o(m2),k1层迭代的复杂度为o(k1m2),上述公式(5)的聚合复杂度为o(m)。相似地,在上述公式(6)、公式(7)、公式(8)、公式(9)、公式(10)、公式(11)、以及公式(12)中第二维度下的聚合计算中,k2层迭代的复杂度为o(k2l2),最终,总的计算复杂度为o(k1m2 k2l2);
[0151]
可选地,在本实施例中,在egnn模型参与的过程中,计算交互复杂度较高(o(k1m2))时,可考虑只计算k近邻原子的消息传递,权衡模型时空复杂度建模效果,以提高信息的获取效率。
[0152]
作为一种可选的方案,基于第二级特征,获取多级结构对象对应的交互属性信息,
包括:
[0153]
基于第二级特征与多个第一维度下的目标组成结构中的各个第一组成结构对应的理化特征,获取交互属性信息,其中,理化特征包括以下至少之一:用于表示第一组成结构中未参与脱水成键的目标子结构的亲水性的第一特征、用于表示目标子结构的疏水性的第二特征,用于表示目标子结构所带的电荷的第三特征。
[0154]
可选地,在本实施例中,以目标组成结构包括氨基酸为例说明,在原子粒度和氨基酸粒度的建模中,可额外考虑加入氨基酸的理化特征,如残基的亲水、疏水性,残基所带电荷。
[0155]
作为一种可选的方案,获取多级结构对象的目标组成结构对应的第一级特征,包括:获取待检测的蛋白质中的氨基酸对应的分子特征;
[0156]
作为一种可选的方案,对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,包括:对分子特征进行聚合处理,得到氨基酸对应的原子特征;
[0157]
作为一种可选的方案,基于第二级特征,获取多级结构对象对应的交互属性信息,包括:基于原子特征,获取待检测的蛋白质对应的交互属性信息。
[0158]
可选地,在本实施例中,将上述信息获取方法应用在蛋白质交互的多种预测任务,如先将蛋白质表示为3d空间中的点云或k近邻图,再利用几何神经网络或图神经网络将点云或图表示成特征向量,进一步基于特征向量获取蛋白质的交互属性信息;得到蛋白质的交互属性信息,还可以但不限于应用于涉及到蛋白质较为快速、低成本的药物分析和筛选等具体落地场景。
[0159]
可选地,在本实施例中,多级结构对象可以但不限于理解为由多级结构共同组成的结构对象,如由氨基酸组成的蛋白质、由视频帧构成的媒体视频、由多个结构层搭建的神经网络等,且多级结构对象还可以但不限理解为存在与其他结构对象进行交互的应用场景的对象,预测对象在交互时的表现是对信息准确性的挑战,进而也产生了需要信息保证一定的信息准确性的需求;
[0160]
进一步举例说明,可选地蛋白质由多条氨基酸构成,氨基酸由多个分子构成,分子由原子构成,进而假设将蛋白质作为多级结构对象,则氨基酸可以但不限于理解为目标组成结构、氨基酸的分子可以但不限于理解为第一维度(分子维度)下的目标组成结构、氨基酸的原子可以但不限于理解为第二维度(原子维度)下的目标组成结构。
[0161]
可选地,在本实施例中,氨基酸是蛋白质的基本组成单元,假设将一个氨基酸分子gi表示为3d点云,即gi=(ai,ci)。其中,ai={a1,a2,
…am
}为氨基酸中的原子,ci={c1,c2,
…cm
}为原子的三维坐标;
[0162]
可选地,在本实施例中,蛋白质由一条或多条氨基酸序列组成,假设用列表表示一条氨基酸序列组成的蛋白质,或由多条氨基酸序列拼接成的一个蛋白质;
[0163]
进一步如图8所示,一个蛋白质其可以表示成两个层级的3d点云:第一个层级是由全部氨基酸中的全部原子组成的原子级点云。第二个层级是由氨基酸组成的点云,其中氨基酸空间位置由骨架碳原子的坐标定向。
[0164]
需要说明的是,本实施例提出利用图神经网络从原子和氨基酸两个粒度层次化地
表示蛋白质结构中原子、氨基酸的相互作用,具体可参考图9所示。其中,建模流程主要由以下步骤组成:
[0165]
步骤s1,建模蛋白质中的每个原子,利用等变图神经网络建模全部原子间的相互作用,最终为每个原子产生其各自的表示。步骤s1旨在编码全部原子间的相互作用和空间关系,如可能的作用力和成键、空间中的距离,包括组成同一个氨基酸的原子和不同氨基酸中的原子;
[0166]
步骤s2,将原子交互后的表示聚合,产生氨基酸分子的初始表示;
[0167]
步骤s3,结合氨基酸在链上的相对距离,在三维空间中的距离,利用几何注意力网络进一步表示氨基酸分子的相互作用和空间关系。最终产生(l,d)矩阵表示蛋白质,其中,l为氨基酸的数目,d为表示向量的维度。
[0168]
具体的,在本实施例中,神经网络架构主要的两个组件为egnn,和gan。首先,egnn接受两个输入,全部原子特征和对应的原子坐标c,通过k层消息传递获得更新后的原子特征其次,由求和readout层,将每个氨基酸中的原子特征分别聚合,产生对应的氨基酸特征最后,gan接受聚合的氨基酸特征氨基酸对在序列中的相对距离z
ij
,氨基酸的β碳原子的坐标作为输入,通过k层消息传递获得更新后的氨基酸特征全部的氨基酸特征可经由下游的readout层用于特定任务的预测;
[0169]
进一步,基于egnn的原子粒度表示学习在本实施例中,给定当前的m个原子特征m
ij
构造了边的特征(可参考上述公式1)作为传递给原子ai的消息。具体来说,m
ij
包含了蛋白质中任意原子对(ai,aj)的特征及原子对的距离平方|c
i-cj|2。通过对全部氨基酸中的全部原子聚合(可参考上述公式2)和合并上一层的原子特征(可参考上述公式3)产生新一层的原子特征
[0170]
每个原子的初始特征由其原子特征和所在的氨基酸特征决定(可参考上述公式4)。这里ig(ai)和ia(ai)分别为one-hot表示下的原子ai的氨基酸类型和原子类型,为向量拼接操作。
[0171]
在产生最终原子特征后,将每个氨基酸中的原子特征求和(可参考上述公式5),产生对应的氨基酸特征
[0172]
可选地,基于gan的氨基酸分子粒度表示学习在本实施例中,在获得了l个氨基酸的表示后需要进一步地表示氨基酸的相互作用。由于氨基酸是蛋白质的基本组成单元,需要更精细地编码氨基酸之间的特征相似性、空间距离和在蛋白质序列上的相对距离。本实施例利用图注意力机制,在氨基酸的消息传递-聚合机制中加入学习到的权重。由于需要考虑多方面的信息(氨基酸之间的特征相似性、空间距离和在蛋白质序列上的相对距离)利用attention bias机制,将多种相似性作为bias加入attention模
块。具体来说,氨基酸对gi,gj之间的特征相似性bias,空间距离相似性bias,和序列相对距离bias由β
ij
,γ
ij

ij
分别计算得出。其中β
ij
通过计算两个氨基酸的特征内积相似性得到,z
ij
为通过线性映射后的序列上的相对距离。为两个氨基酸beta碳原子的距离,进一步综合这三方面的相似性(可参考上述公式9),通过softmax函数计算出最终的传播注意力权重α
ij

[0173]
k层消息传递将氨基酸特征、空间距离特征、序列上的距离特征以α
ij
为权重分别聚合,产生对应的特征ui,vi,wi,通过向量拼接与当前层氨基酸特征合并,通过网络φ3产生输出特征(可参考上述公式13)。
[0174]
其中,在上述公式12中计算空间特征的聚合时,用到氨基酸gi的定向矩阵oi,可由下列公式计算得出,这里
×
为向量外积,具体可可参考上述公式14以及公式15。
[0175]
可选地,假设蛋白质中共有l个氨基酸,m个原子。为简明表示,假设神经网络中固定维度的向量加、乘、拼接和内积计算的复杂度为常数。对于原子粒度的表示学习,上述公式(1)到公式(3)的计算复杂度为o(m2),k1层迭代的复杂度为o(k1m2),上述公式(5)的聚合复杂度为o(m)。相似地,在上述公式(6)到公式(12)中氨基酸的聚合计算中,k2层迭代的复杂度为o(k2l2),最终,总的计算复杂度为o(k1m2 k2l2)。
[0176]
可选地,在本实施例中,基于图的表示学习方法或从原子的粒度建模,或从氨基酸的粒度建模。其中,原子粒度的方法旨在提取蛋白质交互面上原子间相互作用和空间关系的特征。相似地,氨基酸粒度的方法旨在提取蛋白质交互面上氨基酸间相互作用和空间关系的特征。然而,单一粒度的建模忽略了蛋白质本身的多级结构表示,不能够同时地捕捉多个粒度下、多级结构中的复杂特征;
[0177]
此外,基于图的建模方法使用传统的基于消息传递的图神经网络。一般来说,通过将原子或氨基酸的初始特征,包括原子或氨基酸类型、理化特征和3d坐标,通过神经网络变换和消息传递实现特征提取和融合。传统图神网络曾经被广泛地应用于一般的图数据,然而被直接应用于3d图数据时,一个重要的缺陷是对3d坐标的特征变换是可变的。即将原子坐标进行平移、旋转,重排列等变换后,模型产生的原子或氨基酸在欧式空间中的向量表示不能保证是不变的。这与建模蛋白质交互所需要的归纳先验不符,从而极大地影响了建模的效果;
[0178]
而在本实施例中,考虑到现有的基于图的表示学习方法的缺陷,本实施例旨在从原子和氨基酸两个粒度层次化地建模蛋白质结构中原子、氨基酸的相互作用,同时保证了产生的蛋白质表示在3d空间中平移、旋转、重排列的不变性,可作为深度神经网络中的基本组件,实现多种蛋白质交互的属性预测任务;
[0179]
进一步举例说明,可选的假设神经网络函数将空间中的输入x映射为空间中的输出y。对于x变换如果φ(tg(x))=φ(x),称φ对于变换tg保持不变性。对于n维欧式空间中的m个输入不变性。对于n维欧式空间中的m个输入本实施例旨在提出一种保持以下三种不变性的模型:
[0180]
1、平移不变性:tg是由任意n维平移向量指定,tg(x)={x1 g,

,xm g},简写为x g,平移不变性有φ(x g)=φ(x);
[0181]
2、旋转不变性:tg是由任意正交矩阵指定,tg(x)={qx1,

,qxm},简写为qx,平移不变性有φ(qx)=φ(x);
[0182]
3、排列不变性:tg是由任意长度为m的排列指定,即tg(x)=p(x),排列不变性有φ(p(x))=φ(x)。
[0183]
可选地,在本实施例中,对原子坐标平移和旋转具有不变性,对原子排列具有不变性,由于:
[0184]
|ci g-(cj g)|2=|c
i-cj|2[0185]
|qc
i-qcj|2=|c
i-cj|
tqt
q|c
i-cj|=|c
i-cj|2[0186]
其中,上述公式(1)中的m
ij
对原子坐标平移和旋转具有不变性,公式(4)中的求和操作对于原子的排列保持不变,因此产生的氨基酸初始表示对原子坐标平移和旋转具有不变性,对原子排列具有不变性。
[0187]
其次证明gan对原子原子坐标平移和旋转具有不变性。由于基向量(v1,v2)对原子坐标平移的不变性,定向矩阵o对平移保持不变。由于:
[0188][0189]
可知wi对平移变换保持不变性。而对于任意正交变换q,可证明定向矩阵o对旋转具有等变性:
[0190]
qc
n-qc=q(c
n-c)=qv1[0191]
qc
c-qc=q(c
c-c)=qv2[0192][0193]
因此,可得出wi对旋转变换保持不变性:
[0194][0195]
由此可得hgin最终输出,对原子坐标平移和旋转具有不变性,对原子排列具有不变性。
[0196]
通过本技术提供的实施例,获取待检测的蛋白质中的氨基酸对应的分子特征;对分子特征进行聚合处理,得到氨基酸对应的原子特征;基于原子特征,获取待检测的蛋白质对应的交互属性信息,通过将蛋白质表示为层次3d图对蛋白质分别进行原子和氨基酸两个层次的建模,产生的蛋白质表示向量对输入的原子坐标系的平移旋转和原子排列具有不变性,进而达到了将上述信息获取方法作为预测蛋白质交互属性(如亲和力)和交互属性变化的学习任务中的基本表示模块,嵌入更为复杂的神经网络的目的,从而实现了提高预测蛋白质交互属性的准确性的技术效果。
[0197]
可以理解的是,在本技术的具体实施方式中,涉及到用户信息等相关的数据,当本
申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0198]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0199]
根据本技术实施例的另一个方面,还提供了一种用于实施上述信息获取方法的信息获取装置。如图10所示,该装置包括:
[0200]
第一获取单元1002,用于获取多级结构对象的目标组成结构对应的第一级特征,其中,多级结构对象是多个目标组成结构连接构成,第一级特征为目标组成结构在第一维度下的特征;
[0201]
聚合单元1004,用于对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,其中,第二级特征为目标组成结构在第二维度下的特征,目标组成结构由多个第二维度下的目标组成结构构成,第二维度下的目标组成结构由多个第一维度下的目标组成结构构成;
[0202]
第二获取单元1006,用于基于第二级特征,获取多级结构对象对应的交互属性信息,其中,交互属性信息用于预测多级结构对象在与其他结构对象进行交互时的表现。
[0203]
具体实施例可以参考上述信息获取装置中所示示例,本示例中在此不再赘述。
[0204]
作为一种可选的方案,第一获取单元1002,包括:
[0205]
提取模块,用于提取多级结构对象对应的目标图像中的图像特征;
[0206]
第一获取模块,用于基于图像特征得到多个第一维度下的目标组成结构中各个第一组成结构对应的初始第一级特征;
[0207]
第二获取模块,用于基于初始第一级特征,获取各个第一组成结构对应的第一级特征。
[0208]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0209]
作为一种可选的方案,第二获取模块,包括:
[0210]
第一获取子模块,用于获取由各个第一组成结构构成的多个第一组成结构对;
[0211]
计算子模块,用于计算多个第一组成结构对中各个第一组成结构对的第一结构对特征,其中,第一结构对特征包括第一组成结构对中每个第一组成结构对应的结构特征、以及每个第一组成结构之间的相对距离特征;
[0212]
第二获取子模块,用于基于第一结构对特征,获取各个第一组成结构对应的第一级特征。
[0213]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0214]
作为一种可选的方案,第二获取子模块,包括:
[0215]
执行子单元,用于执行以下步骤,直至达到收敛条件:
[0216]
对各个第一组成结构对的第一结构对特征进行聚合处理,得到目标结构对特征;
[0217]
合并目标结构对特征与各个第一组成结构对应的结构特征,得到各个第一组成结构对应的新的结构特征;
[0218]
在达到收敛条件的情况下,将各个第一组成结构对应的新的结构特征确定为各个第一组成结构对应的第一级特征;
[0219]
在未达到收敛条件的情况下,利用各个第一组成结构对应的新的结构特征重新计算第一结构对特征,得到各个第一组成结构对的新的第一结构对特征,并将各个第一组成结构对的新的第一结构对特征确定为各个第一组成结构对的第一结构对特征,以及将各个第一组成结构对应的新的原子特征确定为各个第一组成结构对应的结构特征。
[0220]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0221]
作为一种可选的方案,第一获取模块,包括:
[0222]
第三获取子模块,用于基于图像特征得到各个第一组成结构对应的第一结构特征、以及各个第一组成结构所在的第二维度下的目标组成结构对应的目标结构特征;
[0223]
拼接子模块,用于对第一结构特征以及目标结构特征进行拼接处理,得到各个第一组成结构对应的第二结构特征,其中,初始第一级特征包括第二结构特征。
[0224]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0225]
作为一种可选的方案,第二获取单元1006,包括以下至少之一:
[0226]
第三获取模块,用于获取由多个第二维度下的目标组成结构中各个第二组成结构构成的多个第二组成结构对;基于第二级特征,计算多个第二组成结构对中各个第二组成结构对的第一目标结构特征,其中,第一目标结构特征用于表示第二组成结构对中每个第二组成结构之间的特征内积相似性;基于第一目标结构特征获取交互属性信息;
[0227]
第四获取模块,用于获取多个第二组成结构对;基于第二级特征,计算各个第二组成结构对的第二目标结构特征,其中,第二目标结构特征用于表示每个第二组成结构之间通过线性映射在序列上时呈现的相对距离;基于第二目标结构特征获取交互属性信息;
[0228]
第五获取模块,用于获取多个第二组成结构对;基于第二级特征,计算各个第二组成结构对的第三目标结构特征,其中,第三目标结构特征用于表示每个第二组成结构之间的碳原子距离;基于第三目标结构特征获取交互属性信息。
[0229]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0230]
作为一种可选的方案,第二获取单元1006,包括:
[0231]
第一聚合模块,用于在获取到第一目标结构特征、第二目标结构特征、以及第三目标结构特征的情况下,对第一目标结构特征、第二目标结构特征、以及第三目标结构特征进行聚合处理,得到聚合结构特征;
[0232]
合并模块,用于通过向量拼接,对聚合结构特征与第二级特征进行合并处理,得到输出结构特征;
[0233]
第六获取模块,用于基于输出结构特征获取交互属性信息。
[0234]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0235]
作为一种可选的方案,第二获取模块,包括:第一输入子模块,用于将初始第一级特征输入第一目标模型,通过第一目标模型中的第一子结构进行信息传递,得到各个第一组成结构对应的第一级特征,其中,第一目标模型为利用第一样本训练得到的、用于特征处理的神经网络模型;
[0236]
聚合单元1004,包括:第二聚合模块,用于通过第一目标模型中的第二子结构,对各个第一组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特
征。
[0237]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0238]
作为一种可选的方案,第二获取单元1006,包括:
[0239]
输入模块,用于将第二级特征输入第二目标模型,通过第二目标模型的第三子结构进行信息传递,得到各个第二组成结构对应的输入结构特征,其中,第二目标模型为利用第二样本训练得到的、用于特征处理的神经网络模型;
[0240]
输出模块,用于通过第二目标模型的第四子结构,对各个第二组成结构对应的输入结构特征进行预测输出,得到交互属性信息。
[0241]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0242]
作为一种可选的方案,装置包括:
[0243]
第三获取单元,用于在获取多级结构对象的目标组成结构对应的第一级特征之前,获取多级结构对象的目标结构数量,其中,目标结构数量包括以下至少之一:多个目标组成结构中的目标组成结构对应的第一数量、多个第二维度下的目标组成结构中的第二组成结构对应的第二数量、多个第一维度下的目标组成结构中的第一组成结构对应的第三数量;
[0244]
计算单元,用于基于目标结构数量,计算交互属性信息的获取复杂度,其中,获取复杂度用于表示获取交互属性信息时所要执行的操作的复杂度。
[0245]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0246]
作为一种可选的方案,第二获取单元1006,包括:
[0247]
第七获取模块,用于基于第二级特征与多个第一维度下的目标组成结构中的各个第一组成结构对应的理化特征,获取交互属性信息,其中,理化特征包括以下至少之一:用于表示第一组成结构中未参与脱水成键的目标子结构的亲水性的第一特征、用于表示目标子结构的疏水性的第二特征,用于表示目标子结构所带的电荷的第三特征。
[0248]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0249]
作为一种可选的方案,第一获取单元1002,包括:第八获取模块,用于获取待检测的蛋白质中的氨基酸对应的分子特征;
[0250]
聚合单元1004,包括:第三聚合模块,用于对分子特征进行聚合处理,得到氨基酸对应的原子特征;
[0251]
第二获取单元1006,包括:第九获取模块,用于基于原子特征,获取待检测的蛋白质对应的交互属性信息。
[0252]
具体实施例可以参考上述信息获取方法中所示示例,本示例中在此不再赘述。
[0253]
根据本技术实施例的又一个方面,还提供了一种用于实施上述信息获取方法的电子设备,如图11所示,该电子设备包括存储器1102和处理器1104,该存储器1102中存储有计算机程序,该处理器1104被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
[0254]
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
[0255]
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
[0256]
s1,获取多级结构对象的目标组成结构对应的第一级特征,其中,多级结构对象是多个目标组成结构连接构成,第一级特征为目标组成结构在第一维度下的特征;
[0257]
s2,对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,其中,第二级特征为目标组成结构在第二维度下的特征,目标组成结构由多个第二维度下的目标组成结构构成,第二维度下的目标组成结构由多个第一维度下的目标组成结构构成;
[0258]
s3,基于第二级特征,获取多级结构对象对应的交互属性信息,其中,交互属性信息用于预测多级结构对象在与其他结构对象进行交互时的表现。
[0259]
可选地,本领域普通技术人员可以理解,图11所示的结构仅为示意,电子设备也可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图11其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图11中所示更多或者更少的组件(如网络接口等),或者具有与图11所示不同的配置。
[0260]
其中,存储器1102可用于存储软件程序以及模块,如本技术实施例中的信息获取方法和装置对应的程序指令/模块,处理器1104通过运行存储在存储器1102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的信息获取方法。存储器1102可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1102可进一步包括相对于处理器1104远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1102具体可以但不限于用于存储多级结构对象、目标组成结构、第一级特征、第二级特征以及交互属性信息等信息。作为一种示例,如图11所示,上述存储器1102中可以但不限于包括上述信息获取装置中的第一获取单元1002、聚合单元1004及第二获取单元1006。此外,还可以包括但不限于上述信息获取装置中的其他模块单元,本示例中不再赘述。
[0261]
可选地,上述的传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1106包括一个网络适配器(network interface controller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1106为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0262]
此外,上述电子设备还包括:显示器1108,用于显示上述多级结构对象、目标组成结构、第一级特征、第二级特征以及交互属性信息等信息;和连接总线1110,用于连接上述电子设备中的各个模块部件。
[0263]
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(peer to peer,简称p2p)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
[0264]
根据本技术的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序/指令,该计算机程序/指令包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时,执行本技术实施例提供的各种功能。
[0265]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0266]
需要说明的是,电子设备的计算机系统仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0267]
计算机系统包括中央处理器(central processing unit,cpu),其可以根据存储在只读存储器(read-only memory,rom)中的程序或者从存储部分加载到随机访问存储器(random access memory,ram)中的程序而执行各种适当的动作和处理。在随机访问存储器中,还存储有系统操作所需的各种程序和数据。中央处理器、在只读存储器以及随机访问存储器通过总线彼此相连。输入/输出接口(input/output接口,即i/o接口)也连接至总线。
[0268]
以下部件连接至输入/输出接口:包括键盘、鼠标等的输入部分;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至输入/输出接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
[0269]
特别地,根据本技术的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时,执行本技术的系统中限定的各种功能。
[0270]
根据本技术的一个方面,提供了一种计算机可读存储介质,计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
[0271]
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
[0272]
s1,获取多级结构对象的目标组成结构对应的第一级特征,其中,多级结构对象是多个目标组成结构连接构成,第一级特征为目标组成结构在第一维度下的特征;
[0273]
s2,对多个目标组成结构中各个目标组成结构对应的第一级特征进行聚合处理,得到目标组成结构对应的第二级特征,其中,第二级特征为目标组成结构在第二维度下的特征,目标组成结构由多个第二维度下的目标组成结构构成,第二维度下的目标组成结构由多个第一维度下的目标组成结构构成;
[0274]
s3,基于第二级特征,获取多级结构对象对应的交互属性信息,其中,交互属性信息用于预测多级结构对象在与其他结构对象进行交互时的表现。
[0275]
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
[0276]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0277]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本技术的技
术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。
[0278]
在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0279]
在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0280]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0281]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0282]
以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献