模型训练方法、装置及计算机设备与流程
- 国知局
- 2024-09-11 14:55:26
本技术涉及人工智能领域,具体而言,涉及一种模型训练方法、装置及计算机设备。
背景技术:
1、在运营商网络维护领域,用户的业务涵盖了各类网络设备,包括光猫、路由器、itv(interactive television,交互式电视)和智能家庭设备。这些网络设备的稳定运行是保障用户业务正常使用的关键,一旦网络设备发生故障,往往会严重影响到用户的正常生产和生活。
2、网络设备的稳定运行受到多种因素的影响,具体包括网线状态、光纤曲折、设备物理损坏。一方面,即使设备未损坏,也可能影响用户网络。例如,光纤曲折度过大可能导致光衰太大,从而导致用户无法连接网络。另一方面,物理损坏,如划痕,不一定会直接影响网络使用。例如,路由器等设备的划痕可能不会影响网络使用,只有当物理损坏达到一定程度时才会产生影响。然而,从预先发现和处理障碍的角度来看,如果能够实时检测这些设备并发现异常,有助于预防和处理障碍,保障网络的稳定运行。目前,相关技术中,存在通过神经网络模型对网络设备的运行状态进行检测的方式,与工业现场不同,网络设备的异常图像数据集较少,这存在数据不均衡问题,异常检测效果差;其次,需要大量的训练数据集,导致成本较高且难以训练。
3、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本技术实施例提供了一种模型训练方法、装置及计算机设备,以至少解决相关技术中由于异常数据较少导致网络设备检测模型的检测效果较差的技术问题。
2、根据本技术实施例的一个方面,提供了一种模型训练方法,包括:获取多种网络设备的图像;对所述多种网络设备的图像进行处理,得到初始训练数据集,并采用初始模型中的多个模块依次对所述初始训练数据集进行特征提取,得到适配网络设备检测的全局特征,所述多个模块中至少包括用于采用多种方式生成所述全局特征中的异常特征的异常生成器,所述异常特征用于表征异常网络设备的图像特征;采用所述全局特征对所述初始模型中的异常评判器进行训练,得到目标模型,其中,所述异常评判器用于对所述全局特征进行分类。
3、可选地,对所述多种网络设备的图像进行处理,得到初始训练数据集,包括:将所述多种网络设备的图像进行缩放调整,得到与所述初始模型的输入维度相同的目标图像;对所述目标图像进行标注,以区分所述目标图像中的正常图像和异常图像,其中,所述正常图像用于展示处于正常工作状态的网络设备的图像,所述异常图像用于展示处于异常工作状态的网络设备的图像;将标注完成的目标图像组成所述初始训练数据集。
4、可选地,采用初始模型中的多个模块依次对所述初始训练数据集进行特征提取,得到适配网络设备检测的全局特征,包括:采用所述初始模型中的第一子模型对所述初始训练数据集进行处理,得到所述第一子模型中多个神经网络层级输出的多个层级的图像特征,其中,所述第一子模块为预先调整完成的图像处理模型;采用所述初始模型中的特征提取器对所述多个层级的图像特征聚合得到含有特征位置信息的本地特征;采用所述初始模型中的异常生成器按照预设的异常特征生成方式根据所述本地特征生成多种异常特征;根据所述本地特征和所述多种异常特征生成所述全局特征。
5、可选地,采用所述初始模型中的特征提取器对所述多个层级的图像特征聚合得到含有特征位置信息的本地特征,包括:分别从所述多个层级的图像特征中提取目标位置的局部特征,所述目标位置至少包括:所述局部特征所处的层级、输出坐标和输出通道;将每个层级的所述局部特征按照预设聚合函数进行聚合,得到每个层级的本地特征图;将所述每个层级的本地特征图均调整成预设尺寸的本地特征图;将调整后的所述每个层级的本地特征图连接得到所述含有特征位置信息的本地特征。
6、可选地,采用所述初始模型中的异常生成器按照预设的异常特征生成方式根据所述本地特征生成多种异常特征,包括:获取所述多种异常特征占所有特征数据的比例和所述多种异常特征的生成模式,其中,所述生成模式包括:按照预设生成概率生成的第一模式和按照预设生成顺序生成的第二模式;按照所述比例和所述生成模式生成所述多种异常特征。
7、可选地,根据所述本地特征和所述多种异常特征生成所述全局特征,包括:采用所述初始模型中的特征适配器根据所述本地特征和所述多种异常特征获取第一特征,所述第一特征用于表征网络设备图像中的位置异常特征;采用所述初始模型中的特征适配器根据所述本地特征和所述多种异常特征获取第二特征,所述第二特征用于表征网络设备图像中的颜色异常特征;将所述第一特征和所述第二特征按照预设权重加权求和,得到所述全局特征。
8、可选地,所述方法还包括:采用所述目标模型对待检测网络设备的图像进行检测,得到所述待检测网络设备中每个位置的异常概率;将所述异常概率高于预设概率的位置确定为异常位置。
9、根据本技术实施例的另一方面,还提供了一种模型训练装置,包括:获取模块,用于获取多种网络设备的图像;提取模块,用于对所述多种网络设备的图像进行处理,得到初始训练数据集,并采用初始模型中的多个模块依次对所述初始训练数据集进行特征提取,得到适配网络设备检测的全局特征,所述多个模块中至少包括用于采用多种方式生成所述全局特征中的异常特征的异常生成器,所述异常特征用于表征异常网络设备的图像特征;分类模块,用于采用所述全局特征对所述初始模型中的异常评判器进行训练,得到目标模型,其中,所述异常评判器用于对所述全局特征进行分类。
10、根据本技术实施例的又一方面,还提供了一种网络设备检测方法,包括:获取待检测网络设备图像;采用目标模型中的多个模块对所述待检测网络设备图像进行特征提取,得到待检测网络设备图像的全局特征;所述多个模块中至少包括用于采用多种方式生成所述全局特征中的异常特征的异常生成器,所述异常特征用于表征异常网络设备的图像特征;采用所述目标模型中的异常评判器对所述全局特征进行分类,得到所述待检测设备的检测结果。
11、根据本技术实施例的又一方面,还提供了一种计算机设备,包括:存储器和处理器,其中,存储器用于存储程序指令;处理器,与存储器连接,用于执行上述模型训练方法。
12、根据本技术实施例的再一方面,还提供了一种非易失性存储介质,该非易失性存储介质包括存储的计算机程序,其中,该非易失性存储介质所在设备通过运行计算机程序执行上述模型训练方法。
13、根据本技术实施例的再一方面,还提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述模型训练方法。
14、在本技术实施例中,通过获取多种网络设备的图像;对所述多种网络设备的图像进行处理,得到初始训练数据集,并采用初始模型中的多个模块依次对所述初始训练数据集进行特征提取,得到适配网络设备检测的全局特征,所述多个模块中至少包括用于采用多种方式生成所述全局特征中的异常特征的异常生成器,所述异常特征用于表征异常网络设备的图像特征;采用所述全局特征对所述初始模型中的异常评判器进行训练,得到目标模型,其中,所述异常评判器用于对所述全局特征进行分类,达到了基于小基数的初始训练数据集增加异常特征样本的目的,从而实现了提升模型训练效果的技术效果,进而解决了相关技术中由于异常数据较少导致网络设备检测模型的检测效果较差的技术问题。
本文地址:https://www.jishuxx.com/zhuanli/20240911/292585.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表