技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于图结构学习的聚类模型构建方法及装置  >  正文

一种基于图结构学习的聚类模型构建方法及装置

  • 国知局
  • 2024-08-22 15:06:38

本申请涉及机器学习,具体的说是一种基于图结构学习的聚类模型构建方法及装置。

背景技术:

1、随着互联网的快速发展,大量的数据涌现出来。然而,其中很大一部分是非结构化数据,并且大多数没有明确的标签。在无监督学习中,聚类技术变得尤为重要。通过将相似的数据样本分组到相干的簇中,并突出不同簇之间的差异,聚类在揭示数据内在结构中起着关键作用。传统的聚类方法包括基于中心的技术(如k-means)、基于图拉普拉斯算子的谱聚类、基于密度的聚类算法和层次聚类方法。然而,这些方法对初始化较为敏感,并且由于模型的非凸性,其获得的解往往是次优的。更重要的是,大多数流行的聚类算法预先假定或估计簇的数量,而这在实际应用中往往是不切实际的。事实上,确定最佳簇的数量是一个与聚类任务本身一样具有挑战性的难题。

2、为了解决上述挑战,凸聚类模型引起了人们的注意,该模型通过求解一个强凸问题来学习每个数据点的近似质心,其中融合正则化项鼓励这些质心的合并。基于获得的质心,该模型将给定的数据点划分为不同的簇,其中簇的数量是可调的,并且通过调整惩罚参数可以生成聚类路径,通常惩罚参数越大,生成的簇越少。与k-means等方法相比,在这些方法中,不同簇数量的初始猜测可能导致不相关的结果,凸聚类模型的解决方案被证明是惩罚参数的连续函数。近年来,shah和koltun提出了一种基于凸聚类框架的鲁棒连续聚类(rcc)模型,通过在融合项中引入一个额外的惩罚函数,该惩罚旨在切断从输入数据构建的图中的虚假连接,从而增强模型的鲁棒性。

3、尽管凸聚类模型和rcc模型在解决未知类别数量的聚类任务方面取得了一些显著进展,但它们仍然存在一些局限性:低质量的特征表示,含噪声图结构和不准确的正则化权重。

技术实现思路

1、在本实施例中提供了基于图结构学习的聚类模型构建方法及装置,以解决目前聚类模型存在如低质量特征表示以及含噪声图结构和不准确的正则化权重的问题。

2、第一方面,本发明提供了一种基于图结构学习的聚类模型构建方法,聚类模型构建方法包括:

3、获取无结构数据集并对无结构数据集进行特征提取,得到原始特征,根据原始特征构建原始的图结构;

4、利用增强的自适应图神经网络编码器优化图结构,动态更新边权重;

5、利用多层图卷积网络作为编码器提取数据高阶特征表示;

6、基于优化后的图结构以及高阶特征表示构建聚类模型。

7、在一些可选的实施例中,获取无结构数据集并对无结构数据集进行特征提取,得到原始特征,根据原始特征构建原始的图结构包括:

8、获取无结构数据集,对无结构数据集中的数据清洗;

9、根据无结构数据集中的数据类型选取相应的模型对数据进行特征提取,得到原始特征;

10、选定原始特征,根据选定的原始特征构建原始图结构。

11、在一些可选的实施例中,利用增强的自适应图神经网络编码器优化图结构,动态更新边权重包括:

12、获取图结构的边权重以及图构建问题,将图构建问题建模成优化问题,得到优化函数;

13、基于优化函数,对图结构求解,得到图结构函数;

14、通过预设稀疏度参数,结合图结构函数更新原始图的边权重。

15、在一些可选的实施例中,原始图为有向图;

16、利用多层图卷积网络作为编码器提取数据高阶特征表示包括:

17、将有向图转化为无向图;

18、利用多层图卷积网络作为编码器提取图结构的高阶特征表示。

19、在一些可选的实施例中,在进行数据高阶特征提取之前对编码器进行对比学习训练,包括:

20、向每个原始特征添加高斯噪声创建每个原始特征的增强视图;

21、通过神经网络编码获取不同版本的表征;

22、将不同版本的表征通过线性方式融合为最终的表示。

23、在一些可选的实施例中,基于优化后的图结构以及高阶特征表示构建聚类模型包括:

24、根据优化后的图结构以及高阶特征表示,应用增强鲁棒连续聚类模型;

25、得到目标模型。

26、在一些可选的实施例中,得到目标模型后包括:

27、利用目标模型进行聚类分析,获得聚类结果;

28、通过负采样和图结构持续优化目标模型;

29、动态调整聚类结果。

30、与现有技术相比,本发明的基于图结构学习的聚类模型构建方法的有益效果如下:

31、本发明提出的基于图结构学习的聚类模型构建方法通过引入增强自适应图结构学习,实现了对数据结构的细粒度控制,从而在处理无结构数据时提供了更加精准的聚类结果。其次,在保持图神经网络对高阶结构信息捕捉能力的同时,通过自监督特征表示学习和对比学习显著提升了模型的鲁棒性。此外,理论分析揭示了增强自适应图神经网络与鲁棒连续聚类模型之间的深层联系,为理解图结构学习与聚类任务的结合提供了新的视角,并为进一步的改进和优化提供了理论基础。通过引入增强自适应图结构学习和自监督特征表示学习,仅需对聚类算法进行简单调整即可实现对无结构数据的高效聚类。

32、第二方面,本发明提供了一种基于图结构学习的聚类模型构建装置,包括:

33、初始化模块,用于获取无结构数据集并对无结构数据集进行特征提取,得到原始特征,根据原始特征构建原始的图结构;

34、自适应图结构权重更新模块,利用增强的自适应图神经网络编码器优化图结构,动态更新边权重;

35、高阶特征提取模块,用于利用多层图卷积网络作为编码器提取数据高阶特征表示;

36、构建模块,用于基于优化后的图结构以及高阶特征表示,采用聚类方法构建聚类模型。

37、第三方面,本发明提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述的基于图结构学习的聚类模型构建方法。

38、第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的基于图结构学习的聚类模型构建方法。

39、与现有技术相比,本发明的基于图结构学习的聚类模型构建装置、电子设备及存储介质的有益效果与第一方面的基于图结构学习的聚类模型构建方法相同,故此处不再赘述。

技术特征:

1.一种基于图结构学习的聚类模型构建方法,其特征在于,聚类模型构建方法包括:

2.根据权利要求1的基于图结构学习的聚类模型构建方法,其特征在于,获取无结构数据集并对无结构数据集进行特征提取,得到原始特征,根据原始特征构建原始的图结构包括:

3.根据权利要求1的基于图结构学习的聚类模型构建方法,其特征在于,利用增强的自适应图神经网络编码器优化图结构,动态更新边权重包括:

4.根据权利要求3的基于图结构学习的聚类模型构建方法,其特征在于,原始图为有向图;

5.根据权利要求4的基于图结构学习的聚类模型构建方法,其特征在于,在进行数据高阶特征提取之前对编码器进行对比学习训练,包括:

6.根据权利要求5的基于图结构学习的聚类模型构建方法,其特征在于,基于优化后的图结构以及高阶特征表示构建聚类模型包括:

7.根据权利要求6的基于图结构学习的聚类模型构建方法,其特征在于,得到目标模型后包括:

8.一种基于图结构学习的聚类模型构建装置,其特征在于,包括:

9.一种电子设备,包括存储器和处理器,其特征在于,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行权利要求1至7中任意一项所述的基于图结构学习的聚类模型构建方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现权利要求1至7中任意一项所述的基于图结构学习的聚类模型构建方法。

技术总结本发明公开了一种基于图结构学习的聚类模型构建方法及装置,聚类模型构建方法包括:获取无结构数据集并对无结构数据集进行特征提取,得到原始特征,根据原始特征构建原始的图结构;利用增强的自适应图神经网络编码器优化图结构,动态更新边权重;利用多层图卷积网络作为编码器提取数据高阶特征表示;基于优化后的图结构以及高阶特征表示构建聚类模型。通过引入增强自适应图结构学习,实现对数据结构的细粒度控制,从而在处理无结构数据时提供了更加精准的聚类结果。其次,在保持对高阶结构信息捕捉能力的同时,通过自监督特征表示学习和对比学习显著提升了模型的鲁棒性。此外,仅需对聚类算法进行简单调整即可实现对无结构数据的高效聚类。技术研发人员:吴剑灿,丁陈璐,袁雁城,王翔,何向南受保护的技术使用者:中国科学技术大学技术研发日:技术公布日:2024/8/20

本文地址:https://www.jishuxx.com/zhuanli/20240822/281194.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。