一种弹幕用户识别方法、装置、电子设备及可读存储介质与流程
- 国知局
- 2024-07-31 23:20:45
本发明涉及用户识别,特别是涉及一种弹幕用户识别方法、一种弹幕用户识别装置、一种电子设备和一种计算机可读存储介质。
背景技术:
1、弹幕,指的是在网络上观看视频时弹出的评论性字幕,基于在视频中特定的时间点出现的字幕以给观众提供实时互动的感觉。
2、然而,在弹幕社区中存在针对特定内容发布特定信息的、被雇佣的网络写手,这类异常用户将会大量且频繁地发送低质量、同质量、相似、炒作以及无意义的弹幕信息,不但影响弹幕社区的氛围,同时还可能增加视频播放系统的系统成本,例如存储成本、cpu(central processing unit,中央处理器)成本等;以及随着技术的进步,异常用户使用chatgpt(chat generative pre-trained transformer,聊天生成预训练转换器)等aigc技术(ai-generated content,指基于人工智能通过已有数据寻找规律,并自动生成内容的生产方式)生成语义相似的弹幕,增加了对异常用户的识别难度和实现成本。
技术实现思路
1、本发明实施例的目的在于提供一种弹幕用户识别方法、一种弹幕用户识别装置、一种电子设备和一种计算机可读存储介质,以准确识别弹幕中的异常用户。具体技术方案如下:
2、在本发明实施的第一方面,首先提供了一种弹幕用户识别方法,所述方法包括:
3、获取弹幕用户的用户信息;所述用户信息用于指示所述弹幕用户的活跃程度属性和所述弹幕用户的弹幕内容属性;
4、对所述弹幕用户的活跃程度属性和所述弹幕内容属性进行特征提取,得到针对所述弹幕用户的特征向量;
5、将所述特征向量输入预先训练的针对异常用户的用户识别模型,得到判定所述弹幕用户是否为异常用户的分类结果。
6、在本发明实施的第二方面,还提供了一种弹幕用户识别装置,所述装置包括:
7、用户信息获取模块,用于获取弹幕用户的用户信息;所述用户信息用于指示所述弹幕用户的活跃程度属性和所述弹幕用户的弹幕内容属性;
8、特征向量生成模块,用于对所述弹幕用户的活跃程度属性和所述弹幕内容属性进行特征提取,得到针对所述弹幕用户的特征向量;
9、弹幕用户识别模块,用于将所述特征向量输入预先训练的针对异常用户的用户识别模型,得到判定所述弹幕用户是否为异常用户的分类结果。
10、在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现任一所述弹幕用户识别方法。
11、在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述弹幕用户识别方法。
12、在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述弹幕用户识别方法。
13、本发明实施例提供的弹幕用户识别方法、装置、电子设备及可读存储介质,通过获取弹幕用户的用户信息,对用户信息所能够指示的活跃程度属性和弹幕内容属性进行特征提取,得到多属性特征的特征向量,基于结合多属性特征的特征向量和用户识别模型,将特征向量输入预先训练的针对异常用户的用户识别模型,得到判定弹幕用户是否为异常用户的分类结果,从而对弹幕用户进行准确识别,进而识别得到异常用户,便于后续对异常用户采取相关约束措施,有效改善弹幕社区的氛围以及提升所发布的弹幕内容质量,同时达到较少系统成本的目的。
技术特征:1.一种弹幕用户识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述针对异常用户的用户识别模型的生成方式如下:
3.根据权利要求2所述的方法,其特征在于,所述基于所述特征向量样本集和所述标签集,对预设分类器进行训练得到弹幕异常识别分类器,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述特征向量验证集对所述预设模型参数进行调优,得到目标参数组合,包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述初始模型参数以所述预设分类器在所述特征向量验证集上的性能为目标进行调优,得到目标参数组合,包括:
6.根据权利要求1所述的方法,其特征在于,所述获取弹幕用户的用户信息,包括:
7.根据权利要求6所述的方法,其特征在于,所述社交行为包括所述弹幕用户的关注行为和/或被关注行为,所述弹幕行为包括所述弹幕用户进行的弹幕发布行为、对所述弹幕用户发布的弹幕内容进行的弹幕举报行为和弹幕评价行为;
8.根据权利要求7所述的方法,其特征在于,所述对所述弹幕发布行为和弹幕举报行为进行统计,得到所述弹幕用户的弹幕内容质量指标,包括:
9.根据权利要求1或6所述的方法,其特征在于,所述特征向量为连续特征向量,所述对所述弹幕用户的活跃程度属性和所述弹幕内容属性分别进行特征提取,得到针对所述弹幕用户的特征向量,包括:
10.根据权利要求9所述的方法,其特征在于,所述活跃程度属性基于所述弹幕用户的粉丝关注比、互相关注数、平均弹幕发布数和弹幕赞踩比进行体现,所述对所述弹幕用户的活跃程度属性进行特征向量化,得到第一数值特征向量,包括:
11.根据权利要求1所述的方法,其特征在于,所述分类结果包括判定所述弹幕用户为异常用户的第一分类结果和判定所述弹幕用户为非异常用户的第二分类结果;
12.一种弹幕用户识别装置,其特征在于,所述装置包括:
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一所述弹幕用户识别方法。
技术总结本发明实施例提供了一种弹幕用户识别方法、装置、电子设备及可读存储介质,所述方法包括:获取弹幕用户的用户信息;用户信息用于指示弹幕用户的活跃程度属性和弹幕用户的弹幕内容属性;对弹幕用户的活跃程度属性和弹幕内容属性进行特征提取,得到针对弹幕用户的特征向量;将特征向量输入预先训练的针对异常用户的用户识别模型,得到判定弹幕用户是否为异常用户的分类结果。基于结合多属性特征的特征向量和用户识别模型对弹幕用户进行准确识别,进而识别到异常用户,便于后续对异常用户采取相关约束措施,有效改善弹幕社区的氛围以及提升所发布的弹幕内容质量,同时达到较少系统成本的目的。技术研发人员:谢忠帅受保护的技术使用者:北京奇艺世纪科技有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/197104.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。