技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种模型训练方法及相关装置与流程 > 正文

一种模型训练方法及相关装置与流程

国知局
2024-09-19 14:49:19

本技术涉及电子，尤其涉及一种模型训练方法及相关装置。

背景技术：

1、随着用户个性化需求的增加，电子设备的常规功能难以满足用户的使用需求。因此，电子设备可以向云端服务器发送用户数据，由云端服务器根据用户数据来训练模型，从而使得训练后的模型可以实现与用户有关的功能，以满足用户的个性化需求。

2、但是，由于用户数据涉及用户隐私，电子设备向云端服务器发送用户数据的过程中可能存在泄露用户隐私的风险。所以，电子设备在本地根据用户数据来训练模型，以解决用户数据在传输过程中的隐私泄露问题。例如，电子设备可以在充电的过程中根据用户数据对模型进行训练。但是，电子设备在充电状态下会发热，若在充电过程中训练模型，可能会导致电子设备的发热量进一步增大，使得电子设备的温度较高。若电子设备的温度较高，可能会影响电子设备的性能、降低用户的使用体验。

技术实现思路

1、本技术实施例提供的一种模型训练方法及相关装置，终端设备通过在多个训练时间段上进行模型训练，可以减轻因模型训练而对用户产生的负面影响，提高了终端设备的能源利用率。

2、第一方面，本技术提供一种模型训练方法，所述方法包括：

3、响应于第一指令，获取第一训练数据和第一能耗数据，其中，所述第一训练数据用于表明训练第一模型需要的总时长，所述第一能耗数据用于表征所述终端设备的电量变化情况；

4、将所述第一训练数据和所述第一能耗数据输入到目标决策模型中，使得所述目标决策模型输出多个训练时间段，其中，所述多个训练时间段所分别对应的时长之和与所述总时长相等，所述多个训练时间段包括每个训练时间段对应的开始时刻和结束时刻，以及，所述开始时刻对应的所述终端设备的第一电量和所述结束时刻对应的所述终端设备的第二电量中的一项或多项；

5、按照所述多个训练时间段对所述第一模型进行训练。

6、上述方法中，第一训练数据用于确定训练第一模型需要的总时长，便于终端设备根据总时长划分出多个训练时间段。能耗数据包括但不限于终端设备在运行过程中产生能耗时所对应的数据，比如说终端设备运行应用程序时产生的能耗数据、运行算法时产生的能耗数据等。而终端设备是响应于用户的操作而运行的，所以，终端设备的能耗数据可以反映用户使用终端设备的规律，即用户的使用习惯。因此“终端设备根据能耗数据来确定训练时间段”，可以理解为“终端设备是根据用户的使用习惯来确定训练时间段”，从而可以使得确定出来的训练时间段是符合用户的使用习惯的。比如说，用户的使用习惯用于反映用户对终端设备的使用频率，用户的使用习惯包括但不限于时间习惯和位置习惯。终端设备根据符合用户的使用习惯的训练时间段来训练第一模型，比如说，根据用户使用终端设备的时间习惯来说，终端设备在1：00至5：00之间用户使用频率较低的夜晚来训练第一模型。又例如，根据用户使用终端设备的位置习惯来说，终端设备在处于用户使用频率较低的工作地点时来训练第一模型。所以，由于在训练时间段中，用户对于终端设备的使用频率较低，从而可以在训练过程中减少用户对于训练过程的感知、降低对用户的负面影响（例如终端设备发热量增加、充电时长增加、运行卡顿等）。终端设备根据能耗数据确定出来的多个训练时间段符合终端设备的电量变化情况，从而可以提高终端设备的能源利用率。所以，终端设备依次按照多个训练时间段所分别指示的开始时刻和结束时刻来对第一模型进行训练，而不是集中在一个时间段（例如终端设备充电的时间段）对第一模型进行训练，可以提高终端设备的能源利用率、降低电量的消耗速度。从而减轻终端设备在训练第一模型时用户对于训练的感知，进一步提升用户的使用感受。

7、在一种可能的实施方式中，所述按照所述多个训练时间段对所述第一模型进行训练，包括：

8、按照第一训练时间段的开始时刻开始对所述第一模型进行训练，按照所述第一训练时间段的结束时刻结束对所述第一模型的训练，其中，所述第一训练时间段为所述多个训练时间段中的一个训练时间段，在所述第一训练时间段的结束时刻对应的所述第二电量小于或等于所述第一训练时间段的开始时刻对应的所述第一电量的情况下，第三电量和第四电量之间的电量差值小于或等于电量阈值，所述第三电量对应于所述终端设备在所述第一训练时间段中的最大电量，所述第四电量对应于所述终端设备在所述第一训练时间段中的最小电量。

9、在上述方法中，第一训练时间段的结束时刻对应的第二电量小于或等于第一训练时间段的开始时刻对应的第一电量，可以说明终端设备在第一训练时间段的过程中的电量是呈下降趋势的。第三电量和第四电量之间的电量差值小于或等于电量阈值，可以说明终端设备在第一训练时间段中的最大电量和最小电量之间的差值较小，进一步可以说明终端设备在第一训练时间段的过程中的电量的下降趋势较缓，即相对于在终端设备充电时进行模型训练来说，终端设备在第一训练时间段之间的耗电量较少。耗电量较少可以说明终端设备在第一训练时间段间运行的数据较少，那么终端设备未使用的计算资源（例如算力或内存等）较多。若终端设备在第一训练时间段中训练第一模型，那么终端设备中未使用的计算资源可以得到合理应用，从而提高终端设备的能源及计算资源的使用率。从用户角度来说可以理解为用户在第一训练时间段中对终端设备的使用频率较低。若终端设备在第一训练时间段中对第一模型进行训练，由于此时用户对终端设备的使用频率较低，那么终端设备训练第一模型时消耗的算力、产生的发热量等负面感知因素对用户的影响较小。

10、在一种可能的实施方式中，所述响应于第一指令，获取第一训练数据和第一能耗数据之前，所述方法还包括：

11、获取第一训练集，所述第一训练集包括所述第一模型的第二训练数据和所述终端设备的第二能耗数据；

12、根据所述第二训练数据和所述第二能耗数据对原始决策模型进行训练，得到所述目标决策模型，其中，所述原始决策模型为所述终端设备预先存储的模型。

13、在上述方法中，第二能耗数据是终端设备对应的能耗数据，例如，可以是终端设备的实际用户在使用终端设备时产生的能耗数据。由于用户对于终端设备的使用习惯会影响终端设备实际的能耗变化，以及，终端设备中电池等硬件的健康程度也会影响终端设备实际的能耗变化。并且，目标决策模型是基于终端设备历史的能耗数据训练出来的。所以，若终端设备实际的能耗变化与终端设备历史的能耗变化的差距较大，可能会导致目标决策模型输出的多个训练时间段的准确度较低。所以，终端设备可以基于终端设备实际的能耗数据对原始决策模型进行迭代训练，可以降低因用户使用习惯的变化和/或终端设备中电池等硬件健康程度的变化而对目标决策模型输出结果的影响。

14、在一种可能的实施方式中，所述根据所述第二训练数据和所述第二能耗数据对原始决策模型进行训练，得到所述目标决策模型，包括：

15、将所述第二训练数据和所述第二能耗数据输入到所述原始决策模型中，使得所述原始决策模型输出n个开始时刻和n个结束时刻，以及，所述终端设备的n个预估开始电量和n个预估结束电量中的一项或多项，其中，所述n为大于1的整数，所述n个开始时刻中的第n个开始时刻和所述n个结束时刻中的第n个结束时刻用于确定所述第一模型的第n个训练时间段，所述n个预估开始电量与所述n个开始时刻一一对应，所述n个预估结束电量与所述n个结束时刻一一对应；

16、基于所述n个开始时刻、所述n个结束时刻、所述n个预估开始电量和所述n个预估结束电量对所述原始决策模型进行训练，得到所述目标决策模型。

17、在上述方法中，由于需要目标决策模型输出的训练时间段可以符合终端设备的能耗（电量）变化情况，所以，在对原始决策模型进行训练时，可以基于终端设备的电量来进行训练。例如，原始决策模型除了输出用于训练第一模型的开始时刻和结束时刻外，还可以推理出终端设备在开始时刻对应的电量和在结束时刻对应的电量，然后基于原始决策模型推理出来的电量对原始决策模型进行迭代训练。

18、在一种可能的实施方式中，所述基于所述n个开始时刻、所述n个结束时刻、所述n个预估开始电量和所述n个预估结束电量对所述原始决策模型进行训练，得到所述目标决策模型，包括：

19、按照所述n个开始时刻和所述n个结束时刻对所述第一模型进行模拟训练，获取所述终端设备的n个模拟开始电量和n个模拟结束电量，其中，所述n个模拟开始电量与所述n个开始时刻一一对应，所述n个模拟结束电量与所述n个结束时刻一一对应；

20、确定所述n个预估开始电量中的第n个预估开始电量和所述n个模拟开始电量中的第n个模拟开始电量的第一比较值，以及，所述n个预估结束电量中的第n个预估结束电量和所述n个模拟结束电量中的第n个模拟结束电量的第二比较值；

21、在所述第一比较值小于或等于第一比较阈值且所述第二比较值小于或等于第二比较阈值时，根据所述第一比较值和所述第二比较值确定所述目标决策模型的参数，得到所述目标决策模型。

22、在上述方法中，服务器基于原始决策模型推理出来的开始时刻和结束时刻对第一模型进行模拟训练，可以模拟出训练第一模型所消耗的电量，例如模拟出开始时刻对应的模拟开始电量，以及模拟出结束时刻对应的模拟结束电量。然后，将原始决策模型推理出来的预估开始电量和模拟开始电量进行比较，以及，将原始决策模型推理出来的预估结束电量和模拟结束电量进行比较，根据比较值来修改原始决策模型的参数。然后继续对原始决策模型进行迭代训练，直到第一比较值小于或等于第一比较阈值且第二比较值小于或等于第二比较阈值时，此时目标决策模型训练成功。由此，通过上述训练过程，可以使得目标决策模型推理出来的训练时间段符合终端设备的电量变化情况，提高了目标决策模型推理结果的准确性。

23、在一种可能的实施方式中，所述原始决策模型为服务器根据所述第一模型的第三训练数据和第三能耗数据训练出来的模型，所述第三能耗数据包括多个所述终端设备生成的能耗数据，所述第三能耗数据包括多条能耗曲线，所述多条能耗曲线分别用于表明所述终端设备的电量变化情况，所述多条能耗曲线所分别对应的电量变化情况用于将所述多条能耗曲线划分为m个类别对应的能耗曲线，所述m为大于1的整数，所述m小于或等于所述多条能耗曲线对应的数量。

24、在上述方法中，为了节省终端设备的计算资源，可以在服务器上训练原始决策模型后再部署到终端设备上使用。第三能耗数据包括多个终端设备生成的能耗数据，例如，包括一个或多个用户分别使用终端设备而产生的能耗数据。由于不同用户对终端设备的使用习惯是不同的，所以产生的能耗数据也是不同的。可以使得终端设备获取到的第三能耗数据的类型较多，从而使得训练出来的原始决策模型符合不同用户对终端设备的使用习惯。为了细化第二训练集，增强训练原始决策模型的准确性和鲁棒性，可以先将获取到的能耗曲线进行分类，然后按照不同类别的能耗曲线分别对原始决策模型进行训练。

25、在一种可能的实施方式中，所述原始决策模型是根据所述第三训练数据和第四能耗数据训练出来的模型，所述第四能耗数据是根据所述第三能耗数据确定出来的，所述第三能耗数据为所述终端设备在第一芯片平台上运行时所产生的能耗数据，所述第四能耗数据为所述终端设备在第二芯片平台上运行时所产生的能耗数据，所述终端设备的芯片搭载在所述第一芯片平台或者所述第二芯片平台上。

26、在上述方法中，无需大量收集终端设备在第二芯片平台上运行时所产生的能耗数据，直接基于第三能耗数据即可确定第四能耗数据，节省了收集能耗数据的时间，降低了训练原始决策模型的难度，缩短了训练原始决策模型的周期。例如，在终端设备在第一芯片平台上运行时所产生的第三能耗数据，多于在第二芯片平台上运行时所产生的能耗数据的情况下。若根据在第二芯片平台上运行时所产生的能耗数据来训练原始决策模型，可能受限于在第二芯片平台上运行时所产生的能耗数据的数量，而导致确定出来的训练集的数量和/或种类较少，影响对于原始决策模型的训练。所以可以根据第三能耗数据来确定第四能耗数据，从而可以增加第四能耗数据的数量和/或种类，以提高训练原始决策模型的效果。

27、在一种可能的实施方式中，所述第四能耗数据包括根据能耗差值对所述第三能耗数据进行拟合处理后的数据，所述能耗差值为第一能耗和第二能耗之间的差值，所述第一能耗为所述终端设备在所述第一芯片平台上运行第一功能算法所产生的能耗，所述第二能耗为所述终端设备在所述第二芯片平台上运行第二功能算法所产生的能耗。

28、在上述方法中，不同的芯片平台在运行时会产生不同的能耗，主要是不同芯片平台中功能算法的能耗不同导致的。所以，若电子设备可以获取到第一芯片平台中第一功能算法的能耗，以及第二芯片平台中第二功能算法的能耗。那么，电子设备可以根据第一能耗和第二能耗之间的差值，来基于第三能耗数据拟合出第四能耗数据，节省了收集能耗数据的时间，降低了训练原始决策模型的难度，缩短了训练原始决策模型的周期。

29、第二方面，本技术实施例提供的一种电子设备，所述电子设备包括：一个或多个处理器和一个或多个存储器；其中，所述一个或多个存储器与所述一个或多个处理器耦合，所述一个或多个存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，所述一个或多个处理器调用所述计算机指令以使得所述电子设备执行第一方面或第一方面的任一种可能的实现方式中描述的更新角标的方法。

30、第三方面，本技术提供一种芯片或者芯片系统，该芯片或者芯片系统包括至少一个处理器和通信接口，通信接口和至少一个处理器通过线路互联，至少一个处理器用于运行计算机程序或指令，以执行第一方面或第一方面的任意一种可能的实现方式中描述的更新角标的方法。其中，芯片中的通信接口可以为输入/输出接口、管脚或电路等。

31、在一种可能的实现中，本技术实施例中上述描述的芯片或者芯片系统还包括至少一个存储器，该至少一个存储器中存储有指令。该存储器可以为芯片内部的存储单元，例如，寄存器、缓存等，也可以是该芯片的存储单元（例如，只读存储器、随机存取存储器等）。

32、第四方面，本技术实施例提供了一种计算机存储介质，该计算机存储介质存储有计算机程序，该计算机程序被处理器执行时，使得计算机执行如第一方面或第一方面的任一种可能的实现方式中描述的更新角标的方法。

33、第五方面，本技术实施例提供了一种计算机程序产品，当该计算机程序产品在通信装置上运行时，使得该通信装置执行如第一方面或第一方面的任一种可能的实现方式中描述的更新角标的方法。

34、应当理解的是，本技术中对技术特征、技术方案、有益效果或类似语言的描述并不是暗示在任意的单个实施例中可以实现所有的特点和优点。相反，可以理解的是对于特征或有益效果的描述意味着在至少一个实施例中包括特定的技术特征、技术方案或有益效果。因此，本说明书中对于技术特征、技术方案或有益效果的描述并不一定是指相同的实施例。进而，还可以任何适当的方式组合本实施例中所描述的技术特征、技术方案和有益效果。本领域技术人员将会理解，无需特定实施例的一个或多个特定的技术特征、技术方案或有益效果即可实现实施例。在其他实施例中，还可在没有体现所有实施例的特定实施例中识别出额外的技术特征和有益效果。