技术新讯 > 计算推算,计数设备的制造及其应用技术 > 面向烟草专卖零售户的多算法融合风险预测方法与流程  >  正文

面向烟草专卖零售户的多算法融合风险预测方法与流程

  • 国知局
  • 2024-07-31 22:56:00

本技术涉及烟草监管的,尤其是涉及一种面向烟草专卖零售户的多算法融合风险预测方法。

背景技术:

1、近年来,数据分析技术的快速发展为烟草行业监管提供了新的思路和方法。通过收集和分析零售户的销售和营业信息,可以有效识别和预测零售户的违法风险,为监管部门提供科学的决策依据。然而,目前烟草行业在利用数据分析技术进行风险预测时,仍然存在一些问题和挑战。首先,由于数据来源的多样性和复杂性,如何准确、高效地提取和分析这些数据,并使其与风险进行关联从而进行风险预测,成为了一个关键难题。

技术实现思路

1、为了提高对烟草零售户风险预测的准确性,从而提高监管效率,本技术提供了一种面向烟草专卖零售户的多算法融合风险预测方法。

2、本技术的上述发明目的一是通过以下技术方案得以实现的:

3、一种面向烟草专卖零售户的多算法融合风险预测方法,包括步骤:

4、间隔获取各零售户的购销数据信息、营业信息、历史信用信息以及顾客反馈信息,并对获取的信息进行对应的预处理;

5、基于预设的提取规则,分别从预处理后的购销数据信息、营业信息、历史信用信息以及顾客反馈信息中提取对应的异常特征,所述提取规则包括差异分析规则、逻辑回归分析规则以及文本挖掘规则;

6、将预处理后的购销数据信息以及营业信息输入合规判断模型中,合规判断模型判断可能存在向未成年顾客销售烟草的情况时,输出销售异常特征;

7、将提取的异常特征打包成与对应零售户的身份信息关联的特征数据集;

8、将特征数据集一一输入至预训练好的风险匹配模型,风险匹配模型对输入的特征数据集进行风险等级匹配,并将匹配结果映射至特征数据集关联的身份信息。

9、通过采用上述技术方案,间隔获取各零售户的购销数据信息、营业信息、历史信用信息以及顾客反馈信息,并且对每一种数据信息进行预设的对应预处理,基于预设的提取规则,分别从各数据中提取对应的异常特征,其中预设的提取规则包括差异分析规则、逻辑回归分析规则以及文本挖掘规则,并将购销数据信息以及营业信息输入至预训练好的合规判断模型中,使合规判断模型基于输入的信息判断零售户是否可能具有向未成年顾客售卖烟草的违规销售行为,并在判断可能存在违规销售行为时输出销售异常特征,提取到异常特征后打包为与零售户身份信息对应关联的特征数据集,并输入至预训练好的风险匹配模型进行风险等级匹配,并将风险等级的匹配结果映射至对应零售户的身份信息;本技术通过以多算法融合的提取规则对从零售户处获取的信息数据进行异常特征提取,并通过风险匹配模型对其风险等级匹配,将风险等级映射至零售户的身份信息,从而准确、高效地提取和分析具有多样性和复杂性的数据,具有提高对烟草零售户风险预测的准确性,从而提高监管效率的效果。

10、本技术在一较佳示例中可以进一步配置为:所述基于预设的提取规则,分别从预处理后的购销数据信息、营业信息、历史信用信息以及顾客反馈信息中提取对应的异常特征,所述提取规则包括差异分析规则、逻辑回归分析规则以及文本挖掘规则的步骤,包括步骤:

11、基于差异分析规则从购销数据信息中提取对应的异常特征;

12、基于逻辑回归分析规则从营业信息以及历史信用信息中提取对应的异常特征;

13、基于文本挖掘规则从顾客反馈信息中提取对应的异常特征。

14、通过采用上述技术方案,基于差异分析规则从购销数据信息中提取对应的异常特征,基于逻辑回归分析规则从营业信息以及历史信用信息中提取对应的异常特征,基于文本挖掘规则从顾客反馈信息中提取对应的异常特征,通过以多算法融合的不同规则对不同的数据进行对应的特征提取,提高数据分析和特征提取的准确性。

15、本技术在一较佳示例中可以进一步配置为:所述购销数据信息包括进货频次、进货量、历史销售数据以及价格变动,所述基于差异分析规则从购销数据信息中提取对应的异常特征的步骤,包括步骤:

16、基于进货频次获取平均进货频次,并提取与平均进货频次之间差值的绝对值大于预设值的进货频次作为频次异常特征;

17、获取行业平均价格变动频率,并基于历史销售数据以及价格变动获取价格变动频率,提取与行业平均价格变动频率之间差值大于预设值的价格变动频率作为价格变动异常特征;

18、若同一身份信息同时关联有频次异常特征以及价格变动异常特征,则识别该频次异常特征是否为高频次异常特征;

19、若该频次异常特征为高频次异常特征,则基于该身份信息关联的历史销售数据以及进货量分析其囤积情况;

20、若囤积量大于预设值,则提取该囤积量作为异常囤积特征。

21、通过采用上述技术方案,基于进货频次获取平均进货频次,并将与平均进货频次之间差值的绝对值大于预设值的异常进货频次作为频次异常特征进行提取,获取行业平均价格变动频率,并基于历史销售数据以及价格变动获取价格的变动频率,将与行业平均频率之间差值大于预设值的异常变动频率作为价格变动异常特征进行提取,当同一身份信息同时关联有频次异常特征以及价格变动异常特征时,识别该频次异常特征是否为进货频次过高的高频次异常特征;若该频次异常特征为高频次异常特征,则基于该身份信息关联的历史销售数据以及进货量分析其囤积情况,若囤积量大于预设值,则将该囤积量作为异常囤积特征进行提取,从而完成基于差异分析规则对购销数据信息中的异常进货频次、异常价格变动频率以及异常囤积行为的特征进行提取。

22、本技术在一较佳示例中可以进一步配置为:所述营业信息包括营业时间、销售量以及销售额,所述基于逻辑回归分析规则从营业信息以及历史信用信息中提取对应的异常特征的步骤,包括步骤:

23、基于法定销售时间以及法定销售量对营业时间、销售量以及销售额进行分析筛选,以获取违规信息;

24、从违规信息中提取异常营业特征以及异常销售特征;

25、对同一身份信息关联的历史信用信息以及违规信息进行关联分析,提取信用违规特征。

26、通过采用上述技术方案,基于法定的销售时间上限以及销售量上限对营业时间、销售量以及销售额中的违规数据进行分析筛选,获得包括违规行为的类型、频率以及趋势等信息的违规信息,从违规数据中提取异常营业特征以及异常销售特征,对统一身份信息关联的历史信用信息以及违规信息进行关联分析,从而对历史信用信息以及违规信息进行结合,并提取信用违规特征,从而完成基于逻辑回归分析规则对营业信息以及历史信用信息中的违规营业时间、违规销售量以及信用合规性趋势的特征进行提取。

27、本技术在一较佳示例中可以进一步配置为:所述基于文本挖掘规则从顾客反馈信息中提取对应的异常特征的步骤,包括步骤:

28、基于文本挖掘规则,提取顾客反馈信息以及市场监管报告的文本信息中的有效文本;

29、将有效文本输入至情绪识别模型进行情绪倾向分析;

30、当接收到情绪识别模型输出的负面情绪文本时,基于预配置的语言分类库以及预设的提取策略,对负面情绪文本进行关键词提取;

31、基于提取的关键词提取关键词异常特征。

32、通过采用上述技术方案,基于文本挖掘规则提取收集的顾客反馈信息以及市场监管报告中的有效文本,以排除与烟草无关的无效文本,将有效文本输入至情绪识别模型使情绪识别模型对有效文本中的情绪倾向进行分析,当接收到情绪识别模型输出的负面情绪文本时,基于预配置好的语言分类库以及预设置的提取策略,对负面情绪文本中的关键词进行提取,并基于提取的关键词提取关键词异常特征,从而完成基于文本挖掘规则对顾客反馈信息中的负面评价进行特征提取。

33、本技术在一较佳示例中可以进一步配置为:所述基于文本挖掘规则,提取顾客反馈信息以及市场监管报告的文本信息中的有效文本的步骤,包括步骤:

34、对顾客反馈信息以及市场监管报告的文本信息进行分词、词性标注以及上下文关联处理;

35、对处理后的文本信息进行语义识别,若识别到语义中含有象征向未成年顾客售卖烟草的违规销售文本时,提取其为销售异常特征;

36、若识别到语义中仅含有象征烟草的烟草信息文本时,提取其为有效文本。

37、通过采用上述技术方案,对顾客反馈信息以及市场监管报告中的文本信息进行分词、词性标注以及上下文关联处理,并对处理后的文本信息进行语义识别,当识别到语义中含有象征未成年购买香烟等的违规销售文本时,将其提取为异常销售特征,当识别到语义中含有象征烟草的烟草信息文本时,将其提取未有效文本,从而完成对有效文本的提取。

38、本技术在一较佳示例中可以进一步配置为:所述营业信息还包括营业区域信息,所述将预处理后的购销数据信息以及营业信息输入合规判断模型中,合规判断模型判断可能存在向未成年顾客销售烟草的情况时,输出销售异常特征的步骤,包括步骤:

39、合规判断模型对销售额与营业时间的关联性进行分析,识别销售额存在异常增长的时间段并获取其增长对应的品类信息;

40、合规判断模型识别存在异常增长的销售额关联的营业区域信息,判断其预设范围内是否存在预设象征未成年人聚集场所的第一场所;

41、若存在第一场所,则获取该第一场所对应预设的象征未成年人聚集时间的第一时间,并对比第一时间与销售额存在异常增长的时间段之间的重合率;

42、合规判断模型基于重合率以及品类信息输出销售异常特征。

43、通过采用上述技术方案,合规判断模型对销售额以及营业时间的关联性进行分析,识别销售额存在异常增长的时间段,同时获取销售额增长对应增长的品类信息,并且识别存在异常增长的销售额对应关联的营业区域信息,判断其预设范围内是否存在预设象征未成年人聚集场所的第一场所,如学校、青少年活动中心、游乐设施等,若存在第一场所,则获取该第一场所预设对应的象征未成年人聚集时间的第一时间,如放学时间、设施开放时间等,并且对第一时间与销售额存在异常增长的时间段之间的重合率进行识别比对,比对之后合规判断模型基于重合率以及品类信息输出销售异常特征,从而判断零售户是否可能存在向未成年售卖烟草的情况。

44、本技术在一较佳示例中可以进一步配置为:所述合规判断模型基于重合率以及品类信息输出销售异常特征的步骤,包括步骤:

45、若重合率高于预设的重合阈值,且品类信息中所包含的预设品类数量大于预设的品类数量阈值,合规判断模型输出重度销售异常特征;

46、若重合率高于预设的重合阈值,且品类信息中所包含的预设品类数量小于预设的品类数量阈值,或,重合率低于预设的重合阈值,且品类信息中所包含的预设品类数量大于预设的品类数量阈值,合规判断模型输出中度销售异常特征;

47、若重合率低于预设的重合阈值,且品类信息中所包含的预设品类数量小于预设的品类数量阈值,合规判断模型输出轻度销售异常特征。

48、通过采用上述技术方案,当重合率高于预设的阈值,且品类信息中所包含的预设品类数量大于预设的品类数量阈值时,合规判断模型判断该对应零售户可能存在较高频率向未成年顾客售卖烟草的情况,并输出重度销售异常特征;当重合率高于预设的重合阈值,且品类信息中所包含的预设品类数量小于预设的品类数量阈值,或者重合率低于预设的重合阈值,且品类信息中所包含的预设品类数量大于预设的品类数量阈值,合规判断模型判断该对应零售户可能存在一定数量向未成年顾客售卖烟草的情况,并输出中度销售异常特征;若重合率低于预设的重合阈值,且品类信息中所包含的预设品类数量小于预设的品类数量阈值,合规判断模型判断该对应零售户可能存在低频率向未成年顾客售卖烟草的情况,并输出轻度销售异常特征。

49、本技术的上述发明目的二是通过以下技术方案得以实现的:

50、一种面向烟草专卖零售户的多算法融合风险预测系统,包括:

51、信息处理模块,用于间隔获取各零售户的购销数据信息、营业信息、历史信用信息以及顾客反馈信息,并对获取的信息进行对应的预处理;

52、特征提取模块,用于基于预设的提取规则,分别从预处理后的购销数据信息、营业信息、历史信用信息以及顾客反馈信息中提取对应的异常特征,所述提取规则包括差异分析规则、逻辑回归分析规则以及文本挖掘规则;

53、合规判断模块,用于将预处理后的购销数据信息以及营业信息输入合规判断模型中,合规判断模型判断可能存在向未成年顾客销售烟草的情况时,输出销售异常特征;

54、打包模块,用于将提取的异常特征打包成与对应零售户的身份信息关联的特征数据集;

55、风险匹配模块,用于将特征数据集一一输入至预训练好的风险匹配模型,风险匹配模型对输入的特征数据集进行风险等级匹配,并将匹配结果映射至特征数据集关联的身份信息。

56、通过采用上述技术方案,信息处理模块用于间隔获取各零售户的购销数据信息、营业信息、历史信用信息以及顾客反馈信息,并对获取的信息进行对应的预处理;特征提取模块用于基于预设的提取规则,分别从预处理后的购销数据信息、营业信息、历史信用信息以及顾客反馈信息中提取对应的异常特征,所述提取规则包括差异分析规则、逻辑回归分析规则以及文本挖掘规则;合规判断模块用于将预处理后的购销数据信息以及营业信息输入合规判断模型中,合规判断模型判断可能存在向未成年顾客销售烟草的情况时,输出销售异常特征;打包模块用于将提取的异常特征打包成与对应零售户的身份信息关联的特征数据集;风险匹配模块用于将特征数据集一一输入至预训练好的风险匹配模型,风险匹配模型对输入的特征数据集进行风险等级匹配,并将匹配结果映射至特征数据集关联的身份信息。

57、综上所述,本技术包括以下至少一种有益技术效果:

58、1.本技术通过以多算法融合的提取规则对从零售户处获取的信息数据进行异常特征提取,并通过风险匹配模型对其风险等级匹配,将风险等级映射至零售户的身份信息,从而准确、高效地提取和分析具有多样性和复杂性的数据,具有提高对烟草零售户风险预测的准确性,从而提高监管效率的效果。

本文地址:https://www.jishuxx.com/zhuanli/20240730/195380.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。