一种基于笔画交互的聚类引导与精炼方法
- 国知局
- 2024-08-22 14:53:02
本发明属于数据处理,尤其涉及一种基于笔画交互的聚类引导与精炼方法。
背景技术:
1、近些年,随着向量化技术和非线性降维算法的发展,将数据向量化为稠密高维向量再降维至二维平面形成散点图已经成为探索大规模数据的标准技术路径之一。具体的在发明专利cn202410114975.0《一种多能源配电网用户数据优化分类方法》中通过根据最终中心点对散点图进行聚类得到若干类簇,依据类簇对所有用户的用电量序列进行分类存储,但是理想情况下,聚类结果、降维结果、用户认知三者应对齐,即视觉上显著的团簇即为聚类得到的类别并符合人们对数据的认知,然而这在实际中常常难以做到。
2、针对上述技术问题,本发明提供了一种基于笔画交互的聚类引导与精炼方法。
技术实现思路
1、本发明的目的是提供一种基于笔画交互的聚类引导与精炼方法。
2、为了解决上述技术问题,本发明提供了一种基于笔画交互的聚类引导与精炼方法,其特征在于,具体包括:
3、获取散点图中的节点数量,并结合不同的节点之间的距离进行聚类算法的调整参数的确定;
4、以所述调整参数为调整阈值,基于mst聚类算法对所述散点图进行聚类分析将所述散点图的节点划分为不同的聚类群组;
5、获取不同的相邻的聚类群组之间的离散节点的数量,并进一步与离散节点与相邻的聚类群组的相邻节点的距离为基础,在不同的相邻的聚类群组间进行不同类型的连接线的自动生成;
6、基于自动生成的连接线以及人工交互的连接线的修改结果确定不同的相邻的聚类群组的连接线的修正类型,并根据不同的相邻的聚类群组的连接线的修正类型对所述散点图进行重新聚类分析处理。
7、进一步的技术方案在于,所述不同节点之间的距离根据欧式距离函数进行确定。
8、进一步的技术方案在于,所述聚类算法的调整参数的确定的方法为:
9、通过不同的节点与不同的相邻的节点之间的距离进行不同的节点的近距离节点的数量以及不同的近距离节点与所述节点的距离的确定,并结合所述节点与不同的相邻节点之间的平均距离确定不同的节点的聚集度评估量;
10、根据不同的聚集度评估量进行不同的节点类型的节点的数量的确定,并根据不同的节点类型的节点的数量以及聚集度评估量确定所述聚类算法的调整参数。
11、进一步的技术方案在于,当所述相邻的节点与所述节点的距离在预设距离之内时,则确定所述相邻的节点为近距离节点。
12、进一步的技术方案在于,根据不同的相邻的聚类群组的连接线的类型对所述散点图进行重新聚类分析处理,具体包括:
13、当所述相邻的聚类群组的连接线的类型为精炼式连接线时,则将所述相邻的聚类群组划分为同一个聚类群组;
14、当所述相邻的聚类群组的连接线的类型为精炼式分割线时,则不在对所述相邻的聚类群组进行进一步的划分。
15、本发明的有益效果在于:
16、1、交互效率高,可用于百万规模的数据:所提方法只有vp-tree构建和mst构建涉及大量计算,时间复杂是o(nlogn),然而它们是可以在预计算阶段完成的,与交互过程无关,并且只需要计算一次。在笔画交互过程涉及的四种笔画都是局部调整,并且涉及到的近邻查询和mst树合拆分和合并的时间复杂度分别是o(logn)、o(n)和o(1),因此交互是近乎实时完成的,即便是面对数百万规模的数据点。
17、2、兼具易用性和可靠性。方法提出的四种笔画具有明确且直接的目的,与聚类调优时的用户朴素意图一致,因此易于理解和掌握,即便是普通用户。其次,因为四种笔画皆是仅需勾勒目标区域而无需精确绘制闭合边界,因此相比于直接分配法在操作上更为简单方便。最后,四种笔画的交互结果具有可预测性,相比于人在回路方法在人机协作的意图一致性方面更为可靠,适合于非专业用户。
18、其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
19、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
技术特征:1.一种基于笔画交互的聚类引导与精炼方法,其特征在于,具体包括:
2.如权利要求1所述的基于笔画交互的聚类引导与精炼方法,其特征在于,所述不同节点之间的距离根据欧式距离函数进行确定。
3.如权利要求1所述的基于笔画交互的聚类引导与精炼方法,其特征在于,所述聚类算法的调整参数的确定的方法为:
4.如权利要求3所述的基于笔画交互的聚类引导与精炼方法,其特征在于,当所述相邻的节点与所述节点的距离在预设距离之内时,则确定所述相邻的节点为近距离节点。
5.如权利要求1所述的基于笔画交互的聚类引导与精炼方法,其特征在于,将所述散点图的节点划分为不同的聚类群组,具体包括:
6.如权利要求1所述的基于笔画交互的聚类引导与精炼方法,其特征在于,进行不同类型的连接线的自动生成,具体包括:
7.如权利要求1所述的基于笔画交互的聚类引导与精炼方法,其特征在于,所述连接线的类型包括引导式连接线和引导式分割线。
8.如权利要求1所述的基于笔画交互的聚类引导与精炼方法,其特征在于,根据不同的相邻的聚类群组的连接线的修正类型对所述散点图进行重新聚类分析处理,具体包括:
技术总结本发明提供一种基于笔画交互的聚类引导与精炼方法,属于数据处理技术领域,具体包括:以调整参数为调整阈值,基于MST聚类算法对散点图进行聚类分析将所述散点图的节点划分为不同的聚类群组,获取不同的相邻的聚类群组之间的离散节点的数量,并进一步与离散节点与相邻的聚类群组的相邻节点的距离为基础,在不同的相邻的聚类群组间进行不同类型的连接线的自动生成,基于自动生成的连接线以及人工交互的连接线的修改结果确定不同的相邻的聚类群组的连接线的类型,并根据不同的相邻的聚类群组的连接线的类型对散点图进行重新聚类分析处理,从而提升了散点图的聚类划分的准确性。技术研发人员:李泽宇,单中信,袁璐,李国强,韩文强受保护的技术使用者:中国传媒大学技术研发日:技术公布日:2024/8/20本文地址:https://www.jishuxx.com/zhuanli/20240822/280240.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表