风险用户识别方法、装置、电子设备和存储介质与流程
- 国知局
- 2024-08-02 13:53:01
本发明涉及网络安全,具体而言,涉及一种风险用户识别方法、装置、电子设备和存储介质。
背景技术:
1、随着互联网技术的飞速发展,网络直播作为一种新型的互动社交方式,其信息传播和商业价值等呈现爆炸式增长趋势。近年来直播平台已成为传播违规信息的新兴场所,在直播过程中传播违规信息。目前,对于直播违规的监测手段主要集中在对直播内容进行风险识别,在进行风险识别的同时违规信息已经传播给观众,存在严重的滞后性。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种风险用户识别方法、装置、电子设备和存储介质,能够有效降低违规信息的传播概率。
2、为了实现上述目的,本发明实施例采用的技术方案如下:
3、第一方面,本发明实施例提供一种风险用户识别方法,所述方法包括:
4、根据待识别用户的用户特征信息确定所述待识别用户为正常用户、疑似风险用户或风险用户;
5、当所述待识别用户为疑似风险用户时,根据所述待识别用户的直播视频确定所述待识别用户为所述正常用户或所述风险用户。
6、可选地,所述根据待识别用户的用户特征信息确定所述待识别用户为正常用户、疑似风险用户或风险用户,包括:
7、根据待识别用户的用户特征信息获取所述待识别用户的特征得分;所述特征得分表征所述待识别用户存在风险的概率;
8、根据所述待识别用户的特征得分确定所述待识别用户为正常用户、疑似风险用户或风险用户。
9、可选地,所述用户特征信息包括不同特征对应的特征值,所述根据待识别用户的用户特征信息获取所述待识别用户的特征得分,包括:
10、根据所述用户特征信息中的每个特征以及对应的特征值查找评分表,得到每个所述特征对应的风险分;所述评分表记录有基础分和多个风险项;每个所述风险项包括风险特征、风险特征值和风险分;
11、根据所述基础分和所述用户特征信息中的全部特征对应的风险分,得到待识别用户的特征得分。
12、可选地,所述风险项还包括woe值和权重,所述评分表通过以下方式得到:
13、从用户样本中获取正常用户总数量、风险用户总数量、多个样本特征和对应的样本特征值;
14、根据多个样本特征和对应的样本特征值进行分箱,得到多个特征箱;每个所述特征箱对应一个样本特征的至少一个样本特征值;
15、根据每个所述特征箱对应的样本特征值,从所述用户样本中确定所述样本特征值对应的正常用户数量和风险用户数量;
16、根据所述正常用户总数量、所述风险用户总数量、每个所述特征箱对应的正常用户数量和风险用户数量,得到每个所述特征箱对应的woe值;
17、利用所述woe值从多个样本特征中筛选出有效特征,并确定所述有效特征对应的目标特征箱;
18、将所述用户样本中每个用户的有效特征对应的woe值和对应的用户标签输入至逻辑回归模型,得到基准权重和每个所述目标特征箱对应的woe值的权重;
19、根据每个所述目标特征箱对应的woe值和对应的权重,得到每个所述目标特征箱对应的风险分;
20、将所述有效特征作为所述风险特征,所述目标特征箱对应的样本特征值作为所述风险特征值,并根据所述风险特征、所述目标特征箱对应的风险特征值、woe值、权重、风险分以及基于所述基准权重得到的所述基础分,构建所述评分表。
21、可选地,所述根据多个样本特征和对应的样本特征值进行分箱,得到多个特征箱,包括:
22、当同一样本特征的样本特征值的数量未超过预设分箱阈值时,将所述样本特征的每个所述样本特征值分别对应一个特征箱;
23、当同一样本特征的样本特征值的数量超过预设分箱阈值时,统计所述样本特征的每个样本特征值对应的风险用户个数,将所述样本特征的样本特征值按照所述风险用户个数的高低顺序进行排序,并将前目标数目个样本特征值分别对应一个特征箱,将剩余的样本特征值对应至少一个特征箱;所述目标数目根据所述预设分箱阈值确定。
24、可选地,所述利用所述woe值从多个样本特征中筛选出有效特征,包括:
25、将同一样本特征对应的全部特征箱对应的woe值进行加权求和,得到所述样本特征对应的样本评分;
26、从多个所述样本特征中删除样本评分低于预设样本评分阈值的样本特征,得到有效特征。
27、可选地,所述根据所述待识别用户的特征得分确定所述待识别用户为正常用户、疑似风险用户或风险用户,包括:
28、当所述特征得分低于第一阈值时,将所述待识别用户识别为风险用户;
29、当所述特征得分不低于第二阈值时,将所述待识别用户识别为正常用户;
30、当所述特征得分低于所述第二阈值且所述特征得分不低于所述第一阈值时,将所述待识别用户识别为疑似风险用户。
31、第二方面,本发明实施例提供一种风险用户识别装置,所述装置包括:
32、特征识别模块,用于根据待识别用户的用户特征信息确定所述待识别用户为正常用户、疑似风险用户或风险用户;
33、视频识别模块,用于当所述待识别用户为疑似风险用户时,根据所述待识别用户的直播视频确定所述待识别用户为所述正常用户或所述风险用户。
34、第三方面,本发明实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现前述实施方式任一所述的风险用户识别方法。
35、第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述实施方式中任一项所述的风险用户识别方法。
36、相比于现有技术,本发明实施例提供的风险用户识别方法、装置、电子设备和存储介质,利用待识别用户的用户特征信息对待识别用户进行首次识别,能够提前识别风险用户、正常用户和疑似风险用户,并结合直播过程中直播视频对疑似风险用户进行二次识别得到正常用户和风险用户。本发明实施例利用用户特征信息和直播视频相结合的识别方式识别风险用户和正常用户,能够实现预防性识别风险用户,有效降低违规信息的传播概率,提高风险用户识别的防御效果,从而提高风险用户识别的实时性、前置性、准确性和召回率。
37、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
技术特征:1.一种风险用户识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的风险用户识别方法,其特征在于,所述根据待识别用户的用户特征信息确定所述待识别用户为正常用户、疑似风险用户或风险用户,包括:
3.根据权利要求2所述的风险用户识别方法,其特征在于,所述用户特征信息包括不同特征对应的特征值,所述根据待识别用户的用户特征信息获取所述待识别用户的特征得分,包括:
4.根据权利要求3所述的风险用户识别方法,其特征在于,所述风险项还包括woe值和权重,所述评分表通过以下方式得到:
5.根据权利要求4所述的风险用户识别方法,其特征在于,所述根据多个样本特征和对应的样本特征值进行分箱,得到多个特征箱,包括:
6.根据权利要求4所述的风险用户识别方法,其特征在于,所述利用所述woe值从多个样本特征中筛选出有效特征,包括:
7.根据权利要求2所述的风险用户识别方法,其特征在于,所述根据所述待识别用户的特征得分确定所述待识别用户为正常用户、疑似风险用户或风险用户,包括:
8.一种风险用户识别装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现权利要求1-7任一所述的风险用户识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的风险用户识别方法。
技术总结本发明实施例提出一种风险用户识别方法、装置、电子设备和存储介质,涉及网络安全技术领域。该方法利用待识别用户的用户特征信息对待识别用户进行首次识别,能够提前识别风险用户、正常用户和疑似风险用户,并结合直播过程中直播视频对疑似风险用户进行二次识别得到正常用户和风险用户。本发明实施例利用用户特征信息和直播视频相结合的识别方式识别风险用户和正常用户,能够实现预防性识别风险用户,有效降低违规信息的传播概率,提高风险用户识别的防御效果,从而提高风险用户识别的实时性、前置性、准确性和召回率。技术研发人员:邓钰钊受保护的技术使用者:广州虎牙信息科技有限公司技术研发日:技术公布日:2024/7/18本文地址:https://www.jishuxx.com/zhuanli/20240801/240942.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表