技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于精细分级的多模态媒资内容审核方法及其系统与流程  >  正文

一种基于精细分级的多模态媒资内容审核方法及其系统与流程

  • 国知局
  • 2024-10-09 14:59:37

本发明涉及人工智能和多媒体资源管理,特别是一种基于精细分级的多模态媒资内容审核方法及其系统。

背景技术:

1、随着互联网的飞速发展和多媒体内容的爆炸式增长,媒体资源内容(下称媒资)审核面临着前所未有的挑战。现有媒资审核技术往往局限于处理单一模态数据,如仅专注于图像、音频或文本的独立分析,而忽视了不同模态间可能存在的丰富语义关联,导致审核结果的片面性和较低的准确性,容易出现误判或漏判。同时,缺乏精细分级机制导致现有技术难以将媒资内容归类为符合或不符合标准的二元判断,忽视了内容的复杂层次和细微差别,导致合法但边缘性的内容被不当屏蔽,或是违规内容因分类不精而得以传播,使得审核结果滞后于实际需求,降低了审核的时效性和准确性性。

技术实现思路

1、基于此,本发明提供一种基于精细分级的多模态媒资内容审核方法及其系统,解决技术背景中的现有技术问题,实现高效、准确、可持续优化的媒资智能审核方法。

2、本发明公开了一种基于精细分级的多模态媒资内容审核方法及其系统,其核心在于构建了一个基于内容精细分级的从数据采集、预处理到精细分级、场景深度分析、标签添加和持续优化的全流程解决方法。首先全面搜集多模态数据,并通过深度学习技术进行数据清洗和特征提取,确保数据质量。内容精细分级则依据内容类型、价值层次、内容适宜年龄段及使用场景对媒资的内容性质、敏感度和受众群体进行精细管理,提升内容安全性和用户体验。再利用卷积神经网络和循环神经网络等深度学习模型对媒资内容进行深度解析,识别和分类敏感场景,进一步运用高级特征提取和决策树模型进行违规元素的识别和合规性判断。在此基础上,通过自动标注人物标签,增强了媒资的可搜索性和内容丰富度。最后,通过实时监控审核结果并持续动态优化模型,确保审核效率和准确度的同时,促进了内容创新和用户权益保护。整个方法形成了一个闭环的学习和优化流程,显著提高媒资审核的智能化水平和工作效率。

3、该方法的包括如下步骤:

4、s1全面搜集来自各种渠道的原始数据,包括图像、视频、音频和文本信息。随后,采用奇异值分解、主成分分析和离群点检测算法,对数据进行精细筛选,剔除无效、重复和噪声数据,确保数据集的纯净性和高质量。

5、s2精细分级运用自然语言处理、多模态数据处理技术和机器学习算法,对处理好的内容进行深度分析和多维度评价。不仅依据内容的表面属性进行简单的归类,而是综合考虑内容性质、敏感度、受众的接受能力和使用场景,对图像、视频等媒资内容的色情程度、暴力等级、政治倾向以及版权状况进行细致的评估和分级。精细分级能自动生成精确的分级结果,指导内容的分类存储和访问权限设定。

6、s3在内容进行分级的基础上,利用深度学习算法,特别是卷积神经网络和循环神经网络,并结合计算机视觉技术,深度解析媒资内容,进一步对分类后的场景进行深度解析,卷积神经网络识别图像中的复杂模式,包括人脸、物体和场景,循环神经网络则处理音频流和文本等序列数据。通过对媒资内容的逐帧分析,能识别并分类各种场景,包括但不限于暴恐场景、色情场景、违禁场景等,提供精准的场景分类信息。通过深度学习模型的高级特征提取能力,迅速捕捉到图像和视频中的微小细节,如武器、裸露部位、非法标识等,结合决策树模型和规则库,根据实施的合规性标准和政策法规,对媒资内容进行动态的合规性判断。

7、s4实施自动添加标签功能,利用向量机、k近邻和神经网络算法,对媒资内容中的违规行为、人物等进行精准标注。通过面部识别、姿态分析和行为模式识别技术,准确识别并标记出人物身份、情感属性和违规类型。

8、s5实时监控审核结果,收集反馈数据,用于模型的持续训练和优化。这一阶段涉及对模型参数的微调、超参数的优化以及新算法的引入,提升模型的准确性和泛化能力。通过分析不同场景类型的审核频率和难度,针对性地调整审核架构与模型,还建立了审核结果的反馈机制,收集审核意见,用于算法模型的动态优化迭代改进,形成一个闭环的学习和优化流程。

9、优选的,在所述s1,还包括:

10、在数据预处理阶段,除了向量机、k近邻等传统数据清洗方法之外,还运用了深度学习中的神经网络架构来进一步增强数据的规范性。预设的神经网络包含了深度卷积神经网络和长短时记忆网络,能从媒资内容中自动提取高层次的抽象特征,这些特征对于后续场景理解、分类和识别至关重要。深度卷积神经网络从图像中提取边缘、纹理和形状等视觉特征,而长短时记忆网络能从音频或文本数据中捕捉时序依赖关系。增强了数据表达能力,有效减少数据维度,降低计算复杂度,提高后续步骤处理效率。

11、优选的,在所述s2,还包括:

12、通过制定详尽的标准和层级,确保每项经过标注后的内容都能适当的分类。分级标准考虑了内容类型、价值、适宜受众以及使用场景,形成一个多维的评价框架。主要包括:

13、内容类型主要分为四大类,教育类、娱乐类、新闻类和广告类。教育类内容专注于知识传授和技能培养,如在线课程和科普资料;娱乐类涵盖电影、电视剧、音乐和游戏等多种形式,旨在提供休闲和乐趣;新闻类负责报道实时事件,传递最新资讯;广告类则是商业推广的载体,其目标是促进产品和服务的销售。

14、价值层次将内容划分为三个等级,高价值内容通常富含深厚的历史、文化、科学或艺术价值,是知识传承和审美体验的重要载体;中价值内容虽具备一定的实用或参考价值,但在独特性和稀缺性上略逊一筹;低价值内容则更多偏向娱乐或日常信息分享,其价值在于即时的消遣或简单的资讯传递

15、根据内容适宜的年龄段划分了四个阶段,一是所有年龄层都可以观看无限制的内容;二是13岁以上的青少年适合看可能包含轻微暴力或成人话题的内容;三是18岁以上的成人适宜看可能含有暴力、性暗示或强烈语言的内容。而限制级内容只适用于特定成年人群,可能包含极端暴力或色情元素。

16、根据内容适宜的使用场景也划分了四个板块,公共展示的内容适宜在教育场所和公共区域公开展示;家庭娱乐内容适合家庭成员共同享受;个人学习材料专门设计用于个人自主学习和研究;内部培训资料则是为企业或组织内部成员的培训和提升而定制的。

17、优选的,在所述s3,还包括:

18、在场景理解阶段,采用卷积神经网络作为主要的图像特征提取工具。卷积神经网络能自动识别图像中颜色、纹理、形状和对象边界等局部和全局特征,区分出不同的场景类型。通过大量训练样本,卷积神经网络能学习到区分暴恐、色情、违禁等场景的关键特征。在卷积神经网络提取的特征基础上,决策树模型对这些特征进行分类,会根据卷积神经网络提取的特征值,遵循预设的规则路径,最终确定媒资内容所属的具体场景类别。

19、优选的,在所述s4,还包括:

20、自动添加标签功能不仅依赖于卷积神经网络提取的特征,还结合了光流分析、骨架检测和语义分割特征提取技术,实现对媒资内容中人物的精准识别和标签标注。卷积神经网络可识别出人物的基本轮廓和面部特征,光流分析和骨架检测则能捕捉人物的动作和姿势,进一步丰富人物识别的细腻度;通过这些技术的综合应用,自动为媒资中的关键人物打上详细标签,比如角色名称、情感状态、行为动作等。

21、优选的,在所述s5,还包括:

22、通过监控审核结果,可识别出哪些类型的媒资内容更频繁地需要人工干预,或者哪些场景的识别准确率较低,基于这些实时反馈,自动动态调整模型参数,优化算法配置,提升整体审核效率和准确度。此外,还会增加定期人工复审和模型性能评估,确保其长期稳定性和可靠性,适应不断变化的内容生态和用户需求。

23、与现有技术相比,本发明的具有明显的技术效果和改进:

24、在一种基于精细分级的多模态媒资内容审核方法及其系统中,利用深度学习卷积神经网络算法和多模态信息融合技术,并结合场景理解技术,对媒资内容展开更为深入且全面的剖析理解。通过场景理解,本发明能精准识别并理解媒资中的场景背景、元素关系以及上下文语境,进而对图像中的细微元素、音频中的复杂特征、文字中的潜在含义进行更准确的捕捉和综合考量,极大程度地提升了审核的准确性,显著降低了误判和漏判的概率。

25、在一种基于精细分级的多模态媒资内容审核方法及其系统中,采用自研的精细分层机制,结合了多模态数据处理与深度学习等技术,实现媒资内容多层次、多维度分类。能依据内容性质、价值层、受众群体和使用场景等要素,对媒资内容进行精细分类,确保内容安全与合规。

26、在一种基于精细分级的多模态媒资内容审核方法及其系统中,通过卷积层、池化层和全连接层等组件实现对图像的特征提取和分类,结合场景理解模块决策树模型,精心优化的算法能够迅速识别并处理媒资中的关键场景,且在极短的时间内完成精确审核,大幅提升媒体平台的内容审核效率。

本文地址:https://www.jishuxx.com/zhuanli/20241009/307204.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。