技术新讯 > 核算装置的制造及其应用技术 > 基于高并发和数据安全的智能取号方法及系统与流程  >  正文

基于高并发和数据安全的智能取号方法及系统与流程

  • 国知局
  • 2024-07-31 22:17:53

本发明涉及数据分类处理,具体涉及基于高并发和数据安全的智能取号方法及系统。

背景技术:

1、随着城市化进程的加快,城市政务服务中心作为提供各类行政审批和公共服务的重要场所,每天需要接待大量前来办理业务的市民。取号过程中,由于实际人数过多,可能会出现高并发情况,这可能导致排队时间过长、服务效率低下甚至影响用户体,为了提高办事效率,减少市民排队等待时间,同时确保数据安全,城市政务服务中心采用智能取号系统进行取号,智能取号系统能够根据实时数据调整叫号顺序,优化等待时间,提升整体服务效率。

2、现有算法中往往通过迭代算法(adaboost)分类器对实时的挂号数据进行分类,获取每个挂号数据所需的处理时间和等待时间,进而通过预测时间实时调整叫号顺序,优化等待时间,提升整体服务效率,但现有的adaboost在分类过程中,由于数据维度较高,数据量较大,分类器容易过拟合,导致泛化性不强,即对于一个新数据进行分类时,存在分类结果不准确的问题,影响待取号用户后续的取号进度。

技术实现思路

1、为了解决现有方法adaboost算法对待取号用户的挂号数据进行分类时存在的分类结果不准确,影响待取号用户的取号进度的问题,本发明的目的在于提供一种基于高并发和数据安全的智能取号方法及系统,所采用的技术方案具体如下:

2、第一方面,本发明提供了一种基于高并发和数据安全的智能取号方法,该方法包括以下步骤:

3、获取待取号用户的挂号数据以及由多名历史取号用户的挂号数据构成的数据集;

4、基于所述数据集中每条挂号数据对应的平均处理时长将历史取号用户的挂号数据划分为多个类别;基于所述数据集对adaboost分类器进行训练获得每条挂号数据在每次迭代过程中对应的权重,根据每条被分错数据在迭代过程中对应的权重的变化情况,从所有被分错数据中筛选保留数据;

5、基于每个类别中保留数据与除保留数据外的其他数据之间的相似情况确定保留特征向量;根据每个类别中被分对数据在保留特征向量上的特征值与被非分错数据在保留特征向量上的特征值之间的差异情况,获得每条被分对数据对应的权重系数,基于所述权重系数获得每条被分对数据在每次迭代过程中对应的目标权重;基于每条被分错数据在每次迭代过程中对应的权重和每条被分对数据在每次迭代过程中对应的目标权重对adaboost分类器进行迭代训练,获得训练好的adaboost分类器;

6、将待取号用户的挂号数据输入到训练好的adaboost分类器中获得待取号用户的分类结果,基于分类结果进行智能取号。

7、优选的,所述根据每条被分错数据在迭代过程中对应的权重的变化情况,从所有被分错数据中筛选保留数据,包括:

8、对于第a条被分错数据:

9、将第a条被分错数据从首次被分错到被分对的每次迭代过程记为第a条被分错数据的待分析迭代过程;按照时间先后顺序对第a条被分错数据在所有待分析迭代过程中对应的权重进行排序获得第a条被分错数据对应的权重序列;将所述权重序列中每个元素值的次序值作为横坐标,将每个次序值对应的元素值作为纵坐标,获得不少于两个坐标,将所有坐标作为pca算法的输入,得到每个二维向量和每个二维向量对应的投影值;将最大投影值对应的二维向量作为投影主方向向量,将投影主方向向量中第二个元素与第一个元素的比值的反正切值作为投影方向值;

10、基于第a条被分错数据首次被分错对应的迭代次数、第a条被分错数据首次被分错与首次被分错之后首次被分对之间的迭代次数的差异和所述投影方向值,得到第a条被分错数据的错分评价值;

11、基于所述错分评价值判断第a条被分错数据是否为保留数据。

12、优选的,所述基于第a条被分错数据首次被分错对应的迭代次数、第a条被分错数据首次被分错与首次被分错之后首次被分对之间的迭代次数的差异和所述投影方向值,得到第a条被分错数据的错分评价值,包括:

13、将所述投影方向值与的比值记为第一特征值;

14、计算第a条被分错数据首次被分错对应的迭代次数的负相关归一化结果,将第a条被分错数据首次被分错与首次被分错之后首次被分对之间的迭代次数的差异、所述负相关归一化结果和第一特征值三者的乘积,确定为第a条被分错数据的错分评价值。

15、优选的,所述基于所述错分评价值判断第a条被分错数据是否为保留数据,包括:

16、若所述错分评价值大于预设评价阈值,则判定第a条被分错数据为保留数据。

17、优选的,所述基于每个类别中保留数据与除保留数据外的其他数据之间的相似情况确定保留特征向量,包括:

18、对于第r个类别:

19、基于第r个类别中所有保留数据构建第一矩阵,其中第一矩阵中每一行为一条保留数据;采用svd分解算法对所述第一矩阵进行分解获得第一右奇异矩阵,第一右奇异矩阵中每列数据构成一个第一右奇异向量;

20、基于第r个类别中除保留数据外的其他所有数据构建第二矩阵,其中第二矩阵中每一行为除保留数据外的一条数据;采用svd分解算法对所述第二矩阵进行分解获得第二右奇异矩阵,第二右奇异矩阵中每列数据构成一个第二右奇异向量;

21、对第一右奇异向量和第二右奇异向量进行匹配,基于匹配结果获得保留特征向量。

22、优选的,对第一右奇异向量和第二右奇异向量进行匹配,基于匹配结果获得保留特征向量,包括:

23、采用km匹配算法对第一右奇异向量与第二右奇异向量进行匹配获得多个匹配对;分别计算每个匹配对中两个向量之间的余弦相似度,将余弦相似度大于预设相似度阈值的匹配对作为目标匹配对;

24、将每个目标匹配对中两个向量的均值向量作为一个保留特征向量。

25、优选的,所述根据每个类别中被分对数据在保留特征向量上的特征值与被非分错数据在保留特征向量上的特征值之间的差异情况,获得每条被分对数据对应的权重系数,包括:

26、对于第b条被分对数据:

27、将第b条被分对数据所处的类别中的被分错数据记为第b条被分对数据的参考数据;分别计算第b条被分对数据的所有参考数据在每个保留特征向量上的特征值的平均值,分别将第b条被分对数据在每个保留特征向量上的特征值与第b条被分对数据的所有参考数据在对应保留特征向量上的特征值的所述平均值之间的差值绝对值,记为第b条被分对数据在每个保留特征向量上的差异指标;

28、分别将第b条被分对数据在所有保留特征向量上的差异指标的负相关归一化结果的和值,作为第b条被分对数据对应的权重系数。

29、优选的,数据集中每条挂号数据对应的平均处理时长的获取,包括:

30、对数据集中每条挂号数据对应的处理时长进行统计获得对应的直方图,采用大津阈值分割算法对直方图进行划分获得不少于两个分割段;

31、分别计算每个分割段中所有挂号数据的处理时长的平均值,并作为对应分割段中每条挂号数据对应的平均处理时长。

32、优选的,所述基于所述权重系数获得每条被分对数据在每次迭代过程中对应的目标权重,包括:

33、对于任意一条被分对数据:分别将该条被分对数据在每次迭代过程中对应的权重与对应的权重系数的乘积作为该条被分对数据在每次迭代过程中对应的目标权重。

34、第二方面,本发明提供了一种基于高并发和数据安全的智能取号系统,包括存储器和处理器,所述处理器执行所述存储器存储的计算机程序,以实现上述所述的基于高并发和数据安全的智能取号方法。

35、本发明至少具有如下有益效果:

36、本发明考虑到基于挂号数据对adaboost分类器进行训练的过程中,由于数据维度较高,数据量较大,分类器容易过拟合,导致泛化性不强,新数据的分类结果存在准确性较低的问题,本发明首先根据每条被分错数据在迭代过程中对应的权重的变化情况,从所有被分错数据中筛选出了保留数据,然后根据每个类别中被分对数据在保留特征向量上的特征值与被非分错数据在保留特征向量上的特征值之间的差异情况,对每条被分对数据在每次迭代过程中对应的权重进行了修正获得了目标权重,在adaboost分类器训练过程中,通过增强容易错分数据与该数据的同类别样本权重来增强后续分类器对该数据的识别能力,避免该样本一直被错分的问题,加快收敛的同时,可以达到一个较高的分类精度,提高了待取号用户的处理时长的分类精度,进而优化了叫号顺序,减少用户的等待时间,提高了用户的取号进度,提升了整体的服务效率和用户的满意度。

本文地址:https://www.jishuxx.com/zhuanli/20240731/192641.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。