一种基于边缘计算的AI模型协同更新方法及系统与流程
- 国知局
- 2024-12-06 12:53:55
本发明属于物联网,具体涉及一种基于边缘计算的ai模型协同更新方法及系统。
背景技术:
1、随着城市化进程的加速,传统园区面临着管理效率低、资源浪费严重等问题;园区涉及的设备设施体量巨大、结构类型复杂,在进行实时监控及运维管理时,由于设备协议复杂,导致部署不易实现,服务器堆叠浪费资源,系统鲁棒性差;园区管理系统的线上数据管理难以维护,现有的企业信息管理系统无法有效支持园区的运营管理,存在严重的信息孤岛效应;
2、随着人工智能的发展,园区终端设备通过内置ai算法和硬件支持,执行复杂任务并提供智能化服务,将人工智能模型的训练和推理能力推向网络边缘,从而提供超低时延和高可靠性的人工智能服务。这些终端设备通常采用边缘计算技术,将数据处理工作从云端转移到本地终端,以减少网络延迟和带宽消耗;ai技术涵盖了人员管理、车辆管理、能源管理、安防管理等多个方面。通过部署前端摄像头连接边缘计算盒子,园区利用ai视频分析技术对人员行为、环境等进行实时监控和管理,通过与物联网(iot)相结合,实现园区内各类设备和系统的互联互通,从而提升数据集成和建模能力,驱动业务流程的智能化、可视化和实时控制。然而在数据采集方面,终端设备通常随机地分布在无线边缘网络中,其生成或采集的数据与所处环境高度相关,因而跨终端的数据往往服从非独立同分布,不同终端设备将拥有不同数量的数据样本,且跨终端的数据类别和数据特征也将存在很大差异;终端设备和边缘服务器的计算和存储资源有限,因而只能完成局部性、短周期业务的处理和分析大大增加了ai算法在问题建模、理论分析和实际部署方面的复杂度,并对模型性能产生了极大的影响;ai模型的训练过程以及终端设备与边缘服务器的通信开销巨大,整个系统的通信时延随着终端的数量增加而增大,因此,面向终端设备管理在面对异构管理和通信效率问题方面需要重新设计。
技术实现思路
1、为解决现有技术中存在的上述问题,本发明提供了一种基于边缘计算的ai模型协同更新方法及系统,本发明的目的可以通过以下技术方案实现:
2、s1:通过园区中终端设备的数据采集子系统采集物联数据和视频流数据,通过标签信息库对所述物联数据和视频流数据进行信息标注并组成本地数据集;边缘节点根据接收的园区应用服务将对应的ai模型广播至所述终端设备;
3、s2:所述终端设备基于所述本地数据集计算所述ai模型损失函数的局部更新参数,通过调度框架和所述局部更新参数计算所述终端设备对应的权重指标并上传至所述边缘节点;
4、s3:所述边缘节点根据所述终端设备的所述权重指标和信道状态构建资源匹配终端序列,所述边缘节点根据所述资源匹配终端序列进行带宽资源分配,通过控制信道向所述资源匹配终端序列对应的终端设备发送梯度上传指令;
5、s4:所述终端设备若接收到所述梯度上传指令,则通过多址接入信道将所述局部更新参数上传至所述边缘节点中;所述边缘节点根据接收的所述局部更新参数计算全局梯度,根据所述全局梯度对所述ai模型进行更新。
6、具体地,所述终端设备的本地数据集独立统计,所述局部更新参数为所述终端设备与所述边缘节点周期性低交互本地计算与全局聚合所得的梯度,计算公式为:
7、,
8、其中, g k为局部更新参数, b k为第 k个终端设备从本地数据集中随机选取的数据, s k为 b k包含的训练样本个数, l为局部损失函数, w为共同训练的ai模型,( x, y)为样本特征和标签,∇为梯度算子;
9、所述权重指标为在单轮通信中所述调度框架在最优调度策略下的边缘节点选取终端设备上传所述局部更新参数的数学期望与对应终端设备的局部损失函数的差值;所述资源匹配终端序列为根据终端设备的信道传输速率、计算能力以及所述权重指标分配给所述终端设备的时隙资源:
10、,
11、其中, u k为边缘节点分配给所述终端设备资源, r k为信道传输速率, q为局部更新参数的梯度元素量化位数, n为局部更新参数的元素个数, m为所有边缘计算节点和回程链路通信容量的比值, s为单轮通信下边缘节点与终端设备的训练样本批次大小, c为权重指标, s new为调度框架下最优训练样本批次大小, v k为样本训练速率, t为单轮通信端到端时延;
12、所述全局梯度为所述边缘节点在预设的通信周期内接收到所有局部更新参数后生成的平衡参数,计算公式为:
13、,
14、其中, g为全局梯度, g k为局部更新参数, s k为训练样本个数, k为终端设备总数, k为终端设备计数;
15、所述边缘节点和所述终端设备共同对所述ai模型训练更新,所述终端设备根据所述本地数据集训练所述ai模型的局部损失函数为:
16、,
17、其中,w为共同训练的ai模型, loss k( w)表示ai模型在第 k个终端设备上的局部损失, n k为本地数据集参与训练的样本数量, i为训练样本计数,为第 i个样本的特征,为第 i个样本的样本标签。
18、具体地,所述终端设备采用正交频分多址技术共享系统带宽,所述边缘节点占用整个系统带宽广播ai模型。
19、具体地,所述调度框架通过所述终端设备的信道状态和梯度散度执行最优调度策略,所述最优调度策略的目标函数为:
20、,
21、其中,e表示数学期望, ρ为平衡权重因子,为被选择的终端设备 x t的梯度散度,为被选择的终端设备 x t的通信时延, k为终端设备总数, k为终端设备计数,为调度第 k个终端设备的通信时延,为边缘节点选择第 k个终端设备上传局部梯度的最优概率,为第k个终端设备局部梯度与边缘节点全局梯度偏差的范数。
22、具体地,所述终端设备的通信时延由所述局部更新参数的计算时延、传输时延和模型广播时延组成,所述计算时延通过所述本地数据集执行一次反向传播算法所需的浮点运算次数和所述终端设备每秒可执行的浮点运算次数的比值得到,所述传输时延为被选中的终端设备对应的所述局部更新参数的量化位数进行单次调度传输时延;所述模型广播时延为模型参数个数与所述边缘节点的信道传输速率计算得到。
23、具体地,所述带宽资源分配方法为:根据所述终端设备的信道状态将最小化所述传输时延作为目标优化方向进行分配:
24、,
25、其中,为第t轮通信中分配给第个终端设备的带宽, b为系统总带宽,为第个终端设备在单位带宽上的上行信道传输速率, m为调度终端序列计数, m为调度终端个数。
26、具体地,所述边缘节点根据所述终端设备的局部更新参数对全局模型的梯度散度在计算全局梯度时对所述局部更新参数进行缩放。
27、一种基于边缘计算的ai模型协同更新系统,包括:全局广播模块、局部计算模块、终端调度模块、模型更新模块;
28、所述全局广播模块用于通过园区中终端设备的数据采集子系统采集物联数据和视频流数据,通过标签信息库对所述物联数据和视频流数据进行信息标注并组成本地数据集;边缘节点根据接收的园区应用服务将对应的ai模型广播至所述终端设备;
29、所述局部计算模块基于所述本地数据集计算所述ai模型损失函数的局部更新参数,通过调度框架和所述局部更新参数计算所述终端设备对应的权重指标并上传至所述边缘节点;
30、所述终端调度模块根据所述终端设备的所述权重指标和信道状态构建资源匹配终端序列,所述边缘节点根据所述资源匹配终端序列进行带宽资源分配,通过控制信道向所述资源匹配终端序列对应的终端设备发送梯度上传指令;
31、所述模型更新模块通过多址接入信道将所述局部更新参数上传至所述边缘节点中;所述边缘节点根据接收的所述局部更新参数计算全局梯度,根据所述全局梯度对所述ai模型进行更新。
32、作为本发明的一种优选技术方案,
33、本发明的有益效果为:
34、通过分析和比较业务在终端设备和边缘节点上进行计算的信道传输速率、计算能力、所述权重指标以及端到端时延,针对边缘节点和终端设备的联合计算资源分配,实现了系统资源利用率的最大化;将模型参数和通信资源集成到统一的框架下进行联合优化,根据无线信道质量进行动态调整,大大降低了实际部署的复杂度,通过分析数据不平衡性、局部梯度范数、以及无线信道状态,实现联邦学习和边缘学习的融合。
本文地址:https://www.jishuxx.com/zhuanli/20241204/342967.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。