技术新讯 > 计算推算,计数设备的制造及其应用技术 > 电力标准知识的标签自动化标注方法、系统及存储介质与流程  >  正文

电力标准知识的标签自动化标注方法、系统及存储介质与流程

  • 国知局
  • 2024-09-14 14:37:32

本发明涉及自动化标注,具体涉及电力标准知识的标签自动化标注方法、系统及存储介质。

背景技术:

1、随着电力行业的迅猛发展和智能电网建设的深入推进,电力标准知识的管理与应用变得愈发重要。电力标准知识不仅涵盖了电力设备的运行规范、安全标准,还涉及电能质量、电力市场运营等多个方面,是保障电力系统安全、稳定、高效运行的基础。

2、然而,随着电力数据的爆炸式增长和电力知识体系的不断扩展,传统的电力标准知识标注方法已经难以满足实际需求。传统方法往往依赖于人工进行知识标注,这不仅效率低下,而且容易出错,同时还面临着人力成本高昂的问题。此外,由于电力知识的复杂性和多样性,手动标注很难保证标注的一致性和准确性,这在一定程度上制约了电力标准知识的有效应用。

技术实现思路

1、本技术提供电力标准知识的标签自动化标注方法、系统及存储介质,用于针对解决现有技术存在手动标注很难保证标注的一致性和准确性的技术问题。

2、鉴于上述问题,本技术提供了电力标准知识的标签自动化标注方法、系统及存储介质。

3、本技术的第一个方面,提供了电力标准知识的标签自动化标注方法,所述方法包括:

4、采集源电力标准知识数据集,对所述源电力标准知识数据集进行数据清洗和标准化处理,获得标准电力知识数据集,利用大语言模型对所述标准电力知识数据集进行文本扩充,生成电力标准知识文本描述数据集;获取文本关联筛选规则,基于所述文本关联筛选规则对所述电力标准知识文本描述数据集进行多重筛选处理,得到电力标准知识文本扩充数据集;根据电力知识应用需求设计电力知识标签体系,基于所述电力知识标签体系对所述标准电力知识数据集和所述电力标准知识文本扩充数据集进行数据标注,获得电力标准知识文本标注数据集;通过电力领域知识专家组对所述电力标准知识文本标注数据集进行修正,获得电力标准知识文本标注样本集,利用深度学习网络对所述电力标准知识文本标注样本集进行训练优化,获得电力标准知识标注模型进行电力标准知识标签自动化标注。

5、进一步的,所述获得标准电力知识数据集还包括:

6、获取文本知识清洗程序,所述文本知识清洗程序包括非文本内容去除、特殊符号去除、html标签去除以及文本格式统一;基于所述文本知识清洗程序对所述源电力标准知识数据集进行数据清洗,获得可用电力标准知识数据集;建立电力知识自定义词典,利用所述电力知识自定义词典对所述可用电力标准知识数据集进行分词处理,得到电力标准知识分词数据集;构建停用词表,基于所述停用词表对所述电力标准知识分词数据集进行停用词去除处理,获得所述标准电力知识数据集。

7、进一步的,所述得到电力标准知识文本扩充数据集还包括:

8、根据所述文本关联筛选规则,确定内容重复筛选步骤、相关性筛选步骤以及语义清晰度筛选步骤;基于所述内容重复筛选步骤利用文本去除算法对所述电力标准知识文本描述数据集进行重复内容初步筛选,得到第一电力知识文本数据集;基于所述相关性筛选步骤利用关键词匹配算法对所述第一电力知识文本数据集进行无关内容二次筛选,获得第二电力知识文本数据集;基于所述语义清晰度筛选步骤采用自然语言处理算法对所述第二电力知识文本数据集进行语义不清内容筛选,得到所述电力标准知识文本扩充数据集。

9、进一步的,所述根据电力知识应用需求设计电力知识标签体系还包括:

10、对所述电力知识应用需求进行标注属性提取,获得知识标注需求属性集合,所述知识标注需求属性集合包括标注目的、应用场景以及使用人员;按照电力运维知识架构对所述知识标注需求属性集合进行分类方式分析,确定知识标签分类方式;基于所述知识标签分类方式对所述电力运维知识架构进行标签层级设计,得到知识标签分类层级;基于所述知识标签分类方式和所述知识标签分类层级,确定所述电力知识标签体系。

11、进一步的,所述获得电力标准知识文本标注样本集还包括:

12、基于电力领域知识专家组中的各专家分别对所述电力标准知识文本标注数据集进行审查修正,获得专家标注修正信息集合;通过所述各专家对所述专家标注修正信息集合中的各修正信息进行修改指数评估,得到初始标注信息修正指数集合;基于所述初始标注信息修正指数集合和所述电力领域知识专家组对所述各修正信息进行指数加权计算,确定标注信息加权修正指数集合;对所述标注信息加权修正指数集合中达到预设修正指数阈值的标注数据进行修正处理,获得所述电力标准知识文本标注样本集。

13、进一步的,所述确定标注信息加权修正指数集合还包括:

14、按照电力知识经验对所述电力领域知识专家组中的各专家进行可信任度评估,获得专家组可信任度集合;基于所述专家组可信任度集合,生成信任度修正因子信息;将所述初始标注信息修正指数集合和所述信任度修正因子信息的加权计算结果,作为所述各修正信息的所述标注信息加权修正指数集合。

15、进一步的,所述获得电力标准知识标注模型还包括:

16、利用深度学习网络对所述电力标准知识文本标注样本集进行迭代训练,获得基础电力知识标注模型;通过模型损失函数对所述基础电力知识标注模型进行性能验证评估,获取标注模型性能评估参数集合;基于所述标注模型性能评估参数集合利用梯度下降算法对所述模型损失函数进行最小化求解,得到模型优化参数;基于所述模型优化参数对所述基础电力知识标注模型进行模型参数更新配置,获得所述电力标准知识标注模型。

17、本技术的第二个方面,提供了电力标准知识的标签自动化标注系统,所述系统包括:

18、电力标准知识文本描述数据集生成模块,所述电力标准知识文本描述数据集生成模块采集源电力标准知识数据集,对所述源电力标准知识数据集进行数据清洗和标准化处理,获得标准电力知识数据集,利用大语言模型对所述标准电力知识数据集进行文本扩充,生成电力标准知识文本描述数据集;电力标准知识文本扩充数据集获取模块,所述电力标准知识文本扩充数据集获取模块获取文本关联筛选规则,基于所述文本关联筛选规则对所述电力标准知识文本描述数据集进行多重筛选处理,得到电力标准知识文本扩充数据集;电力标准知识文本标注数据集获取模块,所述电力标准知识文本标注数据集获取模块根据电力知识应用需求设计电力知识标签体系,基于所述电力知识标签体系对所述标准电力知识数据集和所述电力标准知识文本扩充数据集进行数据标注,获得电力标准知识文本标注数据集;电力标准知识标签自动化标注模块,所述电力标准知识标签自动化标注模块通过电力领域知识专家组对所述电力标准知识文本标注数据集进行修正,获得电力标准知识文本标注样本集,利用深度学习网络对所述电力标准知识文本标注样本集进行训练优化,获得电力标准知识标注模型进行电力标准知识标签自动化标注。

19、第三方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现上述第一方面中任一项所述方法的步骤。

20、本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:

21、本技术采集源电力标准知识数据集,对源电力标准知识数据集进行数据清洗和标准化处理,获得标准电力知识数据集,利用大语言模型对标准电力知识数据集进行文本扩充,生成电力标准知识文本描述数据集;获取文本关联筛选规则,基于文本关联筛选规则对电力标准知识文本描述数据集进行多重筛选处理,得到电力标准知识文本扩充数据集;根据电力知识应用需求设计电力知识标签体系,基于电力知识标签体系对标准电力知识数据集和电力标准知识文本扩充数据集进行数据标注,获得电力标准知识文本标注数据集;通过电力领域知识专家组对电力标准知识文本标注数据集进行修正,获得电力标准知识文本标注样本集,利用深度学习网络对电力标准知识文本标注样本集进行训练优化,获得电力标准知识标注模型进行电力标准知识标签自动化标注。本发明解决现有技术存在手动标注很难保证标注的一致性和准确性的技术问题,通过自动化的标注方法,实现对电力标准知识的快速、准确标注,达到提高标注效率和质量的技术效果。

本文地址:https://www.jishuxx.com/zhuanli/20240914/295131.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。