针对数据治理过程管理的数据监管方法与流程
- 国知局
- 2024-07-31 22:45:28
本技术涉及数据处理,尤其涉及一种针对数据治理过程管理的数据监管方法。
背景技术:
1、数据治理是一个涉及到数据的全生命周期的管理过程,它包括了数据的收集、存储、处理、分析、共享以及销毁等各个环节。数据治理的目标是确保数据的质量、完整性、安全性、可用性和一致性,从而提高数据的价值和利用效率。
2、数据治理的主要内容包括:1.数据战略:制定数据的长期规划,明确数据的目标和价值,以及数据的分类和管理策略。2.数据架构:设计数据的存储和处理结构,确保数据的物理和逻辑结构符合业务需求。3.数据质量管理:确保数据的准确性、完整性、一致性、时效性和可用性。4.数据安全管理:制定数据安全政策和控制措施,保护数据免受未经授权的访问和滥用。5.数据访问管理:控制对数据的访问权限,确保只有授权用户才能访问数据。6.数据生命周期管理:管理数据从创建到销毁的整个生命周期,包括数据的备份、归档和销毁。
3、在数据治理的过程中,数据的安全性和质量是两个重要的方面。数据安全是保护数据不被未经授权的访问和滥用,而数据质量则是确保数据的准确性、完整性和一致性。恶意投毒错误数据是一种对数据质量的威胁,它可能会导致数据的不准确和不一致性,从而影响到数据的使用和决策。
4、因此,如何将这些恶意数据晒出,防止其对数据质量和业务决策造成影响,是目前数据治理需要解决的一个重要问题。
技术实现思路
1、本技术实施例提供一种针对数据治理过程管理的数据监管方法,用以通过向量的离散性分析的方式,将数据治理过程管理中的恶意数据筛选出来。
2、为达到上述目的,本技术采用如下技术方案:
3、第一方面,本技术实施例提供了一种针对数据治理过程管理的数据监管方法,应用于电子设备,该方法包括:在数据治理过程管理中,电子设备获取待监管分析的数据集合;电子设备将待监管分析的数据集合划分成多个数据子集,并将多个数据子集映射到向量空间,以分析待监管分析的数据集合的离散性,从而得到待监管分析的数据集合的分析结果;电子设备根据分析结果,确定待监管分析的数据集合中是否包含恶意数据。
4、可选地,电子设备将待监管分析的数据集合划分成多个数据子集,并将多个数据子集映射到向量空间,以分析待监管分析的数据集合的离散性,从而得到待监管分析的数据集合的分析结果,包括:电子设备将待监管分析的数据集合划分成m个数据子集,m为大于2的整数;电子设备将m个数据子集中每个数据子集映射到向量空间,得到向量空间中的一个向量子集,共得到m个向量子集;电子设备通过将m个向量子集进行组合,分析待监管分析的数据集合的离散性,得到待监管分析的数据集合的分析结果。
5、可选地,电子设备将待监管分析的数据集合划分成m个数据子集,包括:电子设备根据待监管分析的数据集合的数据量大小,将待监管分析的数据集合划分成m个数据子集;其中,m的取值大小与待监管分析的数据集合的数据量大小正相关。
6、可选地,电子设备将m个数据子集中每个数据子集映射到向量空间,得到向量空间中的一个向量子集,共得到m个向量子集,包括:电子设备根据m个数据子集中每个数据子集中每个数据的取值大小,将该数据映射为向量空间中的一个向量,得到向量空间中的一个向量子集,共得到m个向量子集;其中,该向量的第一端的坐标为向量空间中的坐标原点位置,该向量的第一端为与该向量的指向方向相反的一端,该向量的第二端的坐标在向量空间中的坐标位置与该数据的取值大小对应,该向量的第二端为与该向量的指向方向相同的一端。
7、可选地,电子设备通过将m个向量子集进行组合,分析待监管分析的数据集合的离散性,得到待监管分析的数据集合的分析结果,包括:电子设备以c(m,n)的方式对m个向量子集进行组合,n为大于或等于2且小于m的整数,得到m!/(n!*(m-n)!)种向量组合集,并分析m!/(n!*(m-n)!)种向量组合集中每种向量组合集中各向量各自的第二端的坐标的离散性,得到待监管分析的数据集合的分析结果;
8、在i为遍历1至m!/(n!*(m-n)!)的整数的情况下,对于m!/(n!*(m-n)!)种向量组合集中第i种向量组合集,若第i种向量组合集中存在坐标相互离散的至少两组向量集合,则表示第i种向量组合集对应的至少两个数据子集中存在恶意数据,分析结果指示该至少两个数据子集中存在恶意数据,否则,若第i种向量组合集中不存在坐标相互离散的至少两组向量集合,则表示第i种向量组合集对应的至少两个数据子集中不存在恶意数据。
9、可选地,n的取值变化为从大到小,在n的取值为n1,且n1大于2的情况下,若m!/(n1!*(m- n1)!)种向量组合集存在坐标相互离散的至少两组向量集合,则n的取值不再变化,否则,先n的取值从n1减1得到n2,再确定m!/(n2!*(m- n2)!)种向量组合集中是否存在坐标相互离散的至少两组向量集合,直至n=2。
10、可选地,在电子设备根据分析结果,确定待监管分析的数据集合中包含恶意数据的情况下,方法还包括:电子设备将恶意数据从待监管分析的数据集合中剔除。
11、可选地,待监管分析的数据集合中存在恶意数据为至少两个目标数据集合;电子设备将恶意数据从待监管分析的数据集合中剔除,包括:电子设备将至少两个目标数据集合划分成k个数据子集,k为大于2的整数,k个数据子集中每个数据子集小于m个数据子集中每个数据子集,k个数据子集在向量空间中对应k个向量子集;电子设备通过将k个向量子集进行组合,确定至少两个目标数据集合中存在恶意数据的目标数据集合;电子设备将存在恶意数据的目标数据集合剔除。
12、可选地,电子设备通过将k个向量子集进行组合,确定至少两个目标数据集合中存在恶意数据的目标数据集合,包括:电子设备以c(k,l)的方式对k个向量子集进行组合,l为大于或等于2且小于m的整数,得到k!/(l!*(k-l)!)种向量组合集,并分析k!/(l!*(k-l)!)种向量组合集中每种向量组合集中各向量各自的第二端的坐标的离散性,得到待监管分析的数据集合的分析结果;
13、在j为遍历1至k!/(l!*(k-l)!)的整数的情况下,对于k!/(l!*(k-l)!)种向量组合集中第j种向量组合集,若第j种向量组合集中存在坐标相互离散的至少两组向量集合,则表示第j种向量组合集对应的目标数据子集中存在恶意数据,否则,若第j种向量组合集中不存在坐标相互离散的至少两组向量集合,则表示第j种向量组合集对应的目标数据子集中不存在恶意数据。
14、第二方面,本技术实施例提供了一种针对数据治理过程管理的数据监管系统,系统应用电子设备,系统被配置为:在数据治理过程管理中,电子设备获取待监管分析的数据集合;电子设备以轮询迭代的方式,将待监管分析的数据集合划分成多个数据子集,并将多个数据子集映射到向量空间进行分析,得到待监管分析的数据集合的分析结果;电子设备根据分析结果,确定待监管分析的数据集合中是否包含恶意数据。
15、可选地,电子设备将待监管分析的数据集合划分成多个数据子集,并将多个数据子集映射到向量空间,以分析待监管分析的数据集合的离散性,从而得到待监管分析的数据集合的分析结果,包括:电子设备将待监管分析的数据集合划分成m个数据子集,m为大于2的整数;电子设备将m个数据子集中每个数据子集映射到向量空间,得到向量空间中的一个向量子集,共得到m个向量子集;电子设备通过将m个向量子集进行组合,分析待监管分析的数据集合的离散性,得到待监管分析的数据集合的分析结果。
16、可选地,电子设备将待监管分析的数据集合划分成m个数据子集,包括:电子设备根据待监管分析的数据集合的数据量大小,将待监管分析的数据集合划分成m个数据子集;其中,m的取值大小与待监管分析的数据集合的数据量大小正相关。
17、可选地,电子设备将m个数据子集中每个数据子集映射到向量空间,得到向量空间中的一个向量子集,共得到m个向量子集,包括:电子设备根据m个数据子集中每个数据子集中每个数据的取值大小,将该数据映射为向量空间中的一个向量,得到向量空间中的一个向量子集,共得到m个向量子集;其中,该向量的第一端的坐标为向量空间中的坐标原点位置,该向量的第一端为与该向量的指向方向相反的一端,该向量的第二端的坐标在向量空间中的坐标位置与该数据的取值大小对应,该向量的第二端为与该向量的指向方向相同的一端。
18、可选地,电子设备通过将m个向量子集进行组合,分析待监管分析的数据集合的离散性,得到待监管分析的数据集合的分析结果,包括:电子设备以c(m,n)的方式对m个向量子集进行组合,n为大于或等于2且小于m的整数,得到m!/(n!*(m-n)!)种向量组合集,并分析m!/(n!*(m-n)!)种向量组合集中每种向量组合集中各向量各自的第二端的坐标的离散性,得到待监管分析的数据集合的分析结果;
19、在i为遍历1至m!/(n!*(m-n)!)的整数的情况下,对于m!/(n!*(m-n)!)种向量组合集中第i种向量组合集,若第i种向量组合集中存在坐标相互离散的至少两组向量集合,则表示第i种向量组合集对应的至少两个数据子集中存在恶意数据,分析结果指示该至少两个数据子集中存在恶意数据,否则,若第i种向量组合集中不存在坐标相互离散的至少两组向量集合,则表示第i种向量组合集对应的至少两个数据子集中不存在恶意数据。
20、可选地,n的取值变化为从大到小,在n的取值为n1,且n1大于2的情况下,若m!/(n1!*(m- n1)!)种向量组合集存在坐标相互离散的至少两组向量集合,则n的取值不再变化,否则,先n的取值从n1减1得到n2,再确定m!/(n2!*(m- n2)!)种向量组合集中是否存在坐标相互离散的至少两组向量集合,直至n=2。
21、可选地,在电子设备根据分析结果,确定待监管分析的数据集合中包含恶意数据的情况下,系统还被配置为:电子设备将恶意数据从待监管分析的数据集合中剔除。
22、可选地,待监管分析的数据集合中存在恶意数据为至少两个目标数据集合;电子设备将恶意数据从待监管分析的数据集合中剔除,包括:电子设备将至少两个目标数据集合划分成k个数据子集,k为大于2的整数,k个数据子集中每个数据子集小于m个数据子集中每个数据子集,k个数据子集在向量空间中对应k个向量子集;电子设备通过将k个向量子集进行组合,确定至少两个目标数据集合中存在恶意数据的目标数据集合;电子设备将存在恶意数据的目标数据集合剔除。
23、可选地,电子设备通过将k个向量子集进行组合,确定至少两个目标数据集合中存在恶意数据的目标数据集合,包括:电子设备以c(k,l)的方式对k个向量子集进行组合,l为大于或等于2且小于m的整数,得到k!/(l!*(k-l)!)种向量组合集,并分析k!/(l!*(k-l)!)种向量组合集中每种向量组合集中各向量各自的第二端的坐标的离散性,得到待监管分析的数据集合的分析结果;
24、在j为遍历1至k!/(l!*(k-l)!)的整数的情况下,对于k!/(l!*(k-l)!)种向量组合集中第j种向量组合集,若第j种向量组合集中存在坐标相互离散的至少两组向量集合,则表示第j种向量组合集对应的目标数据子集中存在恶意数据,否则,若第j种向量组合集中不存在坐标相互离散的至少两组向量集合,则表示第j种向量组合集对应的目标数据子集中不存在恶意数据。
25、第三方面,本技术实施例提供了一种计算机可读存储介质,所述存储介质上存储有程序代码,当所述程序代码被所述计算机运行时,执行如第一方面所述的方法。
26、综上,上述方法及装置具有如下技术效果:
27、在数据治理过程管理中,电子设备可以将待监管分析的数据集合划分成多个数据子集,并将多个数据子集映射到向量空间,以分析待监管分析的数据集合的离散性,此时,由于大多恶意数据是批量,且与正常的数据的取值有所区别的数据,因此通过离散性分析就能够确定出批量数据之间的差异,从而确定待监管分析的数据集合中是否包含恶意数据。
本文地址:https://www.jishuxx.com/zhuanli/20240730/194441.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表