互联网证据自动采集方法及系统与流程
- 国知局
- 2025-01-10 13:31:25
本发明属于计算机应用的,具体涉及一种互联网证据自动采集方法及系统。。
背景技术:
1、随着互联网技术的迅猛发展,电子证据在司法程序中的重要性日益凸显。尽管当前存在多种电子取证平台,但这些平台主要是为用户提供固定证据的辅助工具,取证过程本质上仍以人工操作为主导,相关平台仅起到证据固定的作用,即确保上传平台的证据与最终下载的证据是一致的,不存在修改的可能,但用户使用该类平台即使证实了其上传平台的证据本身是真实的,也难以确定所采集的证据完整性,难以保证形成了完整的证据链,同时,也较难证明证据获取的整个流程的合法性,以及证据内容的准确性、相关性等关键要求。
技术实现思路
1、本发明的主要目的在于克服现有技术的缺点与不足,提供一种互联网证据自动采集方法及系统,通过结合ocr技术和知识图谱对网络页面内容进行智能侵权分析,自动提取关键信息,将关键信息与法律知识库关联生成证据固定策略,提高了互联网证据采集的质量和效率。
2、为了达到上述目的,本发明采用以下技术方案:
3、第一方面,本发明提供了一种互联网证据自动采集方法,包括下述步骤:
4、采集案件相关数据,获取多维的案件基础信息;
5、深度整合案件基础信息,识别关键信息点及其证据价值,根据设定评估标准生成涉案原始信息采集策略;
6、执行涉案原始信息采集策略,对涉案网络页面内容进行采集,获取涉案信息;
7、对涉案信息中关键信息进行提取,利用知识图谱将关键信息和法律知识库进行关联,基于规则引擎和机器学习对关联结果进行处理,生成最优的证据固定策略;所述关键信息包括文本信息和多媒体信息;
8、执行证据固定策略,将涉案证据固定,生成证据采集报告,并通过人机交互界面显示。
9、作为优选的技术方案,所述深度整合案件基础信息,包括:将采集到的案件基础信息进行分类,将分类后的信息与预设的信息维度进行比对;所述信息维度包括信息种类和信息所处的平台。
10、作为优选的技术方案,构建历史案例库,包括各种类型的案件和对应的历史采集策略;
11、将案件基础信息输入,利用历史采集策略根据案件类型识别关键信息点,利用决策树对关键信息点进行分类,获取具有证据价值的关键信息点;所述关键信息点包括侵权行为、网络页面定位信息和电子媒介特征;
12、根据设定评估标准对具有证据价值的关键信息点进行评分,将评分结果反馈模型,若能够有效地采集关键信息点时,则将该历史采集策略权重提高,否则将该历史采集策略权重降低;不断优化采集策略,获取涉案原始信息采集策略。
13、作为优选的技术方案,在执行涉案原始信息采集策略时,如果侵权行为增加,定期采用增量式方法对涉案网络页面内容进行采集。
14、作为优选的技术方案,所述涉案原始信息采集策略包括采集对象、采集范围、采集步骤、采集工具和采集频率。
15、作为优选的技术方案,所述对涉案信息中关键信息进行提取,包括:
16、利用光学字符识别将涉案信息的文字区域切割,根据字符特性识别并提取文本信息,校正文本信息;
17、对涉案物体或者标识进行识别,获取多媒体信息。
18、作为优选的技术方案,所述利用知识图谱将关键信息和法律知识库进行关联,包括:
19、将文本信息和多媒体信息编码成向量表示,获取关键信息向量;
20、构建知识图谱,其结构包括法律概念、法律条款和关系;
21、计算关键信息向量与知识图谱之间的相似度,根据设定的阈值将关键信息和法律条款进行关联。
22、作为优选的技术方案,所述生成最优的证据固定策略,包括以下步骤:
23、规则引擎处理:定义专家知识的if-then规则,当关键信息与法律知识库不匹配,则认定为“潜在侵权”,并将相应的关键信息进行标记;
24、机器学习模型分类:预训练机器学习模型,将关键信息和关联结果进行分类,获取有效证据及其重要程度;
25、混合决策:将规则引擎处理和机器学习模型分类的输出进行加权投票,根据投票结果确定证据的采集优先级、采集步骤、保存格式和关联说明,获取涉案原始信息采集策略。
26、作为优选的技术方案,所述将涉案证据固定,包括:
27、对涉案网络页面进行截图、拍照、打印、视频录制或者公证;
28、将涉案证据上传至区块链;
29、对涉案证据进行加密储存和访问控制。
30、第二方面,本发明还提供了一种互联网证据自动采集系统,应用于所述的互联网证据自动采集方法,包括信息获取模块、信息采集方案生成模块、信息采集模块、采集内容分析模块、证据固定模块和中央控制模块;
31、信息获取模块,用于采集案件相关数据,获取案件基础信息;
32、信息采集方案生成模块,用于识别关键信息点及其证据价值,根据设定评估标准生成涉案原始信息采集策略;
33、信息采集模块,用于执行涉案原始信息采集策略,对涉案网络页面内容进行采集,获取涉案信息;
34、采集内容分析模块,用于利用光学字符识别对涉案信息中关键信息进行提取,利用知识图谱将关键信息和法律知识库进行关联,基于规则引擎和机器学习对关联结果进行处理,生成最优的证据固定策略;所述关键信息包括文本信息和多媒体信息;
35、证据固定模块,用于执行证据固定策略,将涉案证据固定,生成证据采集报告,并将证据采集报告传输至人机交互界面;
36、中央控制模块,用于协调各个模块的工作,生成证据采集报告,并通过人机交互界面操作和查看证据采集报告。
37、本发明与现有技术相比,具有如下优点和有益效果:
38、(1)本发明运用自然语言处理技术、图像识别技术和知识图谱技术,对采集到的网络网页内容进行智能分析,能够自动提取关键信息,并结合法律知识库生成最优证据固定策略,增强模型鲁棒性,从而提高证据采集的效率和准确性。
39、(2)本发明基于规则引擎和机器学习对关联结果进行处理,增强了模型决策能力,确保了采集过程的科学性和针对性,降低了人工成本,提高了证据采集的质量和效率。
40、(3)本发明结合现有的历史案例库并提供一套清晰的信息采集规则,为后续的实际取证工作提供了清晰、科学的行动指南。
技术特征:1.一种互联网证据自动采集方法,其特征在于,包括下述步骤:
2.根据权利要求1所述互联网证据自动采集方法,其特征在于,所述深度整合案件基础信息,包括:将采集到的案件基础信息进行分类,将分类后的信息与预设的信息维度进行比对;所述信息维度包括信息种类和信息所处的平台。
3.根据权利要求1所述互联网证据自动采集方法,其特征在于,包括:
4.根据权利要求3所述互联网证据自动采集方法,其特征在于,在执行涉案原始信息采集策略时,如果侵权行为增加,定期采用增量式方法对涉案网络页面内容进行采集。
5.根据权利要求1所述互联网证据自动采集方法,其特征在于,所述证据采集策略涉案原始信息采集策略包括采集对象、采集范围、采集步骤、采集工具和采集频率。
6.根据权利要求1所述互联网证据自动采集方法,其特征在于,所述对涉案信息中关键信息进行提取,包括:
7.根据权利要求1所述互联网证据自动采集方法,其特征在于,所述利用知识图谱将关键信息和法律知识库进行关联,包括:
8.根据权利要求1所述互联网证据自动采集方法,其特征在于,所述生成最优的证据固定策略,包括以下步骤:
9.根据权利要求1所述互联网证据自动采集方法,其特征在于,所述将涉案证据固定,包括:
10.一种互联网证据自动采集系统,其特征在于,应用于权利要求1-9中任一项所述的互联网证据自动采集方法,包括信息获取模块、信息采集方案生成模块、信息采集模块、采集内容分析模块、证据固定模块和中央控制模块;
技术总结本发明公开了一种互联网证据自动采集方法及系统,方法包括:采集案件相关数据,获取多维的案件基础信息;深度整合案件基础信息,识别关键信息点及其证据价值,根据设定评估标准生成涉案原始信息采集策略;执行涉案原始信息采集策略,对涉案网络页面内容进行采集,获取涉案信息;运用自然语言处理和图像识别技术,提取关键信息,利用知识图谱技术,将提取的信息与法律知识库关联,基于规则引擎和机器学习算法,生成最优证据固定策略;执行证据固定策略,将涉案证据固定,生成证据采集报告,并通过人机交互界面显示。本发明提高了物联网证据采集的效率和准确性。技术研发人员:何骁,操博文,刘翰,陈司旭,何煜欣受保护的技术使用者:佛山市规律未来智能科技有限公司技术研发日:技术公布日:2025/1/6本文地址:https://www.jishuxx.com/zhuanli/20250110/353678.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。