技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于大数据的认证分析系统及方法与流程  >  正文

一种基于大数据的认证分析系统及方法与流程

  • 国知局
  • 2024-09-11 14:54:41

本发明涉及数据认证,尤其涉及一种基于大数据的认证分析系统及方法。

背景技术:

1、数据认证技术领域,这一领域专注于利用大规模数据集进行身份验证、交易验证或内容真实性的确认。技术领域的核心在于结合先进的数据分析方法,如机器学习、统计分析和模式识别,以确保数据的完整性、安全性和可信度。这种技术在金融服务、网络安全、健康信息管理等领域尤为重要,因为在这些领域中,数据的真实性和准确性是至关重要的。

2、其中,基于大数据的认证分析系统是一种利用大数据技术来提高数据认证过程效率和准确性的系统。该系统的主要目的是通过分析庞大的数据集来验证数据的真实性、安全性和完整性。例如,在金融行业中,这种系统可以用来防止欺诈行为,通过分析交易模式来识别异常行为;在网络安全领域,它可以用于检测和防御网络攻击,通过分析网络流量和用户行为来识别潜在的安全威胁。

3、在传统认证分析系统中,时间序列数据的处理不够精准,难以捕捉细微的行为模式变化,导致对用户行为的分析不够深入。安全性方面,传统系统往往未能有效识别和预防安全异常行为,存在较大的安全隐患。信用风险评估只停留在表面,缺乏深层次的多维度分析,使风险评估结果不够全面和准确。用户行为的分析和预测也常受到技术限制,缺乏深入洞察和准确预测。认证结果的验证多依赖于单一方法,缺乏有效的交叉验证机制,导致认证结果的可靠性不足。数据安全和完整性方面,由于未采用高效的加密和链式记录技术,数据易受损坏或篡改,影响系统的整体安全性和可靠性。

技术实现思路

1、本发明的目的是解决现有技术中存在的缺点,而提出的一种基于大数据的认证分析系统及方法。

2、为了实现上述目的,本发明采用了如下技术方案:一种基于大数据的认证分析系统包括行为时间分析模块、安全异常识别模块、信用风险量化模块、用户行为挖掘模块、认证数据匹配模块、认证结果验证模块、链式数据完整性模块;

3、所述行为时间分析模块基于原始认证数据集,采用动态时间弯曲算法进行时间序列的形状匹配和对齐,同时应用序列聚类方法对时间序列数据进行分类和模式提取,分析用户行为的时间规律性,生成时间行为特征集;

4、所述安全异常识别模块基于时间行为特征集,采用孤立森林算法对特征集中的每个实例进行异常评分,识别与常规模式差异化的异常行为,生成安全异常指标;

5、所述信用风险量化模块基于安全异常指标,利用神经网络分析多维风险因子,通过支持向量机对风险等级进行分类和评分,并对信用风险进行综合量化评估,生成信用风险指数;

6、所述用户行为挖掘模块基于原始认证数据,利用数据预处理技术整理和标准化行为数据,同时应用前缀跨度算法对用户行为模式进行深度挖掘和分析,生成用户行为洞察;

7、所述认证数据匹配模块基于信用风险指数和用户行为洞察,使用隐马尔可夫模型对数据流的状态转换进行建模,同时根据模型结果更新动态贝叶斯网络,匹配当前数据模式,生成适应性认证模型;

8、所述认证结果验证模块基于适应性认证模型,应用随机森林算法对数据特征进行分析和分类,同时采用梯度提升机进行数据特征的深度学习和分析,再通过集成学习方法对认证结果进行交叉验证,生成认证综合评分;

9、所述链式数据完整性模块基于认证综合评分,利用区块链技术对认证数据进行加密处理,同时将加密后的数据存储于区块链网络中,进行持续的链式记录,进而生成链式完整性证明。

10、作为本发明的进一步方案,所述时间行为特征集包括用户行为的时间模式、关键行为时间点、时间序列的统计特征,所述安全异常指标包括异常行为评分、行为偏离度、异常行为的频率,所述信用风险指数包括风险等级、关键风险因素、风险趋势预测,所述用户行为洞察包括用户行为模式、关键行为特征、行为变化趋势,所述适应性认证模型包括网络结构调整参数、数据关系权重、模型适应性指标,所述认证综合评分包括数据一致性分数、认证准确度、验证效率指标,所述链式完整性证明包括区块链记录信息、数据完整性校验码、数据一致性证明。

11、作为本发明的进一步方案,所述行为时间分析模块包括时间依赖分析子模块、序列模式辨识子模块、行为特征提取子模块;

12、所述时间依赖分析子模块基于原始认证数据集,采用动态时间弯曲算法进行时间序列的形状匹配和对齐,通过计算每对时间点之间的距离,构建距离矩阵,同时使用动态规划技术捕捉最小累计距离的路径,进行序列间的最优匹配,生成时间序列对齐集;

13、所述序列模式辨识子模块基于时间序列对齐集,应用序列聚类方法对时间序列数据进行分类和模式提取,选择k-means或层次聚类,选定聚类的数量和距离度量标准,对时间序列数据进行分类,识别模式和规律,生成序列模式特征集;

14、所述行为特征提取子模块基于序列模式特征集,使用主成分分析方法对提取的特征进行降维处理,通过计算数据的协方差矩阵,提取主成分,然后根据主成分降低数据的维度,提取关键的行为特征,生成时间行为特征集。

15、作为本发明的进一步方案,所述安全异常识别模块包括行为安全分析子模块、异常模式识别子模块、安全指标生成子模块;

16、所述行为安全分析子模块基于时间行为特征集,使用孤立森林算法进行异常行为的评分和识别,通过随机选择特征并选择特征的切分值构建孤立树,构建树的数量设为100棵,每棵树随机选择的样本数设为256,计算样本点到达树叶的平均路径长度,路径长度较短的样本被视为异常,从而生成异常行为识别集;

17、所述异常模式识别子模块基于异常行为识别集,应用k-means聚类算法进行异常模式的识别和分类,设置聚类中心数目为5,使用欧氏距离作为相似度度量,通过迭代优化聚类中心位置,将异常行为分组到差异化的类别中,生成模式化异常分析集;

18、所述安全指标生成子模块基于模式化异常分析集,使用评分系统对每种异常模式进行安全等级划分,设置安全等级的范围从1到5,其中1表示低风险,进而生成安全异常指标。

19、作为本发明的进一步方案,所述信用风险量化模块包括风险度量子模块、风险动态预测子模块、指数输出子模块;

20、所述风险度量子模块基于安全异常指标,采用神经网络对多维风险因子进行分析,构建的神经网络包括两个隐藏层,每层128个神经元,使用relu激活函数,通过梯度下降算法调整网络权重,学习率设置为0.01,批量处理大小为32,捕捉风险因子之间的非线性关系和内在模式,从而生成风险因子分析集;

21、所述风险动态预测子模块基于风险因子分析集,使用支持向量机进行风险等级分类和评分,svm模型选择径向基函数作为核函数,c参数设置为1.0平衡训练误差和模型复杂度,gamma参数设置为0.1确定核函数的影响范围,并对风险因子进行分类处理,生成风险预测分析集;

22、所述指数输出子模块基于风险预测分析集,运用加权平均法综合参照多类风险因子,为每种风险因子设定权重,根据对信用风险的影响程度和重要性进行加权计算,进而生成信用风险指数。

23、作为本发明的进一步方案,所述用户行为挖掘模块包括行为模式挖掘子模块、用户习惯分析子模块、行为洞察构建子模块;

24、所述行为模式挖掘子模块基于原始认证数据,使用python的pandas库进行数据清洗,同时应用apriori算法进行关联规则挖掘,设置最小支持度为0.01,最小置信度为0.5,并利用mlxtend库执行频繁项集和关联规则的挖掘,分析用户行为模式,进而生成行为模式深度分析;

25、所述用户习惯分析子模块基于行为模式深度分析,采用机器学习算法,使用scikit-learn库进行k-均值聚类分析,设置聚类数为5,使用fit_predict方法对用户习惯数据进行聚类,分析多个用户群体的行为习惯,同时利用主成分分析进行数据降维,保留主成分,生成用户习惯分析;

26、所述行为洞察构建子模块基于用户习惯综合分析,使用numpy和pandas库进行数据合并和重组,结合行为模式和用户习惯数据,运用支持向量机算法进行行为分类,使用scikit-learn库中的svc函数,设置核函数为径向基函数,c参数为1.0,利用fit方法对模型进行训练,调整并优化分类结果,生成用户行为洞察。

27、作为本发明的进一步方案,所述认证数据匹配模块包括网络动态调整子模块、数据关系匹配子模块、模型更新子模块;

28、所述网络动态调整子模块基于信用风险指数和用户行为洞察,使用隐马尔可夫模型进行数据流的状态转换建模,模型中设定状态数量为5,并根据数据流中的行为频率动态调整转移概率,分析数据流中的状态变化趋势,进而生成状态转换分析;

29、所述数据关系匹配子模块基于状态转换分析,根据隐马尔可夫模型的结果调整网络结构,重新设定节点和边的权重,匹配数据间的关系模式,使用贝叶斯参数估计优化网络结构,生成数据关系匹配分析;

30、所述模型更新子模块基于数据关系匹配分析、状态转换分析,应用梯度提升树算法对模型进行调整,设置学习率为0.05,最大深度为4,通过参数调整,反映模型当前数据流和行为趋势,生成适应性认证模型。

31、作为本发明的进一步方案,所述认证结果验证模块包括学习策略综合子模块、结果验证子模块、综合评分生成子模块;

32、所述学习策略综合子模块基于适应性认证模型,应用随机森林算法对数据特征进行分析和分类,随机森林算法中设置树的数量为100,最大深度为10,使用基尼不纯度作为分裂标准,进行特征重要性评估和分类决策,分析数据特征和识别关键的分类标准,生成特征分析结果;

33、所述结果验证子模块基于特征分析结果,采用梯度提升机对数据特征进行深度学习和分析,梯度提升机设置学习率为0.1,最大深度为5,使用损失函数为deviance,通过迭代优化提炼数据特征和识别深层次的数据模式,进而生成深度特征分析结果;

34、所述综合评分生成子模块基于深度特征分析结果,采用集成学习方法,结合多种差异化模型,通过scikit-learn库的随机森林、支持向量机和梯度提升决策树算法的集成,设定多模型的权重和参数,使用cross_val_score函数进行交叉验证,利用软投票机制,结合多模型输出的概率估计,计算平均概率得分,生成认证综合评分。

35、作为本发明的进一步方案,所述链式数据完整性模块包括区块链构建子模块、数据不变性保证子模块、完整性证明生成子模块;

36、所述区块链构建子模块基于认证综合评分,采用区块链技术,通过编程语言创建区块链结构,每个区块利用sha-256哈希算法生成独特哈希值,将数据记录、前一区块的哈希值及当前数据处理成字符串,应用哈希算法转换成固定长度的唯一哈希值,连续串联每个区块,生成加密数据链;

37、所述数据不变性保证子模块基于加密数据链,通过编程进行哈希函数和时间戳的结合使用,锁定每个区块内容,对每个区块内数据和时间戳应用哈希函数生成当前哈希值,辅助区块链网络中的数据记录,生成数据不变性记录;

38、所述完整性证明生成子模块基于数据不变性记录,采用区块链完整性验证程序,对区块链中每个区块的数据和结构进行检查,使用编程逻辑验证链中每个区块的完整性和更改项状态,生成链式完整性证明。

39、一种基于大数据的认证分析方法,所述基于大数据的认证分析方法基于上述基于大数据的认证分析系统执行,包括以下步骤:

40、s1:基于原始认证数据集,采用动态时间弯曲算法进行时间序列的形状匹配和对齐,并使用序列聚类方法对时间序列数据进行分类和模式提取,分析用户行为的时间规律性,并提取关键时间特征,生成时间行为特征集;

41、s2:基于所述时间行为特征集,运用孤立森林算法对每个实例进行异常评分,通过分析和识别与常规用户行为模式差异的异常行为,生成安全异常评估;

42、s3:基于所述安全异常评估,使用神经网络分析多维风险因子,并通过支持向量机对风险等级进行分类和评分,进行信用风险的综合量化评估,生成信用风险指数;

43、s4:基于原始认证数据,利用数据预处理技术整理和标准化行为数据,同时应用前缀跨度算法对用户行为模式进行深度挖掘和分析,生成用户行为洞察结果;

44、s5:基于所述信用风险指数和用户行为洞察结果,采用隐马尔可夫模型对数据流的状态转换进行建模,并根据模型结果更新动态贝叶斯网络,匹配当前数据模式,进而生成适应性认证模型;

45、s6:基于所述适应性认证模型,采用随机森林、梯度提升机和集成学习方法进行数据特征分析和验证,再利用区块链技术加密处理认证数据,生成链式完整性证明。

46、与现有技术相比,本发明的优点和积极效果在于:

47、本发明中,动态时间弯曲算法在行为时间分析中实现时间序列的精确匹配和对齐,为用户行为分析提供更准确的时间维度洞察。孤立森林算法在安全异常识别上有效识别异常行为,增强系统的安全性。利用神经网络和支持向量机进行信用风险评估,实现了风险因素的多维度深入分析,提高信用风险评估的全面性和准确度。用户行为挖掘中的前缀跨度算法深入解析用户行为模式,增强对用户行为的理解和预测能力。适应性认证模型的构建与应用,使系统能够灵活匹配不同数据模式,提升数据处理的适应性和灵活性。认证结果的交叉验证方法提升认证结果的可靠性和准确性。区块链技术的应用确保数据的安全性和完整性,为系统提供强大的数据保护机制。

本文地址:https://www.jishuxx.com/zhuanli/20240911/292539.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。