技术新讯 > 计算推算,计数设备的制造及其应用技术 > 使用预算感知的贝叶斯优化的超参数选择的制作方法 > 正文

使用预算感知的贝叶斯优化的超参数选择的制作方法

国知局
2024-08-05 12:21:45

背景技术：

1、机器学习(ml)算法的超参数优化(更一般地ml管线)集中于影响模型选择和/或模型训练的参数的自动调谐。已经利用贝叶斯优化、元学习和集成开发了用于基于经典ml模型的管线的各种方法。虽然在现有框架中包括神经网络(nn)作为管线选择在某种程度上发生，但是nn是比它们的经典ml对应物消耗更多计算资源用于训练的复杂架构，并且可以受益于标准管线选择问题的成本建模和预算管理扩展。

技术实现思路

1、提供了一种被配置用于针对迭代学习模型的改进的超参数选择的设备、系统、方法和计算机可读介质。超参数选择通过例如标识进一步训练将不会显著改进模型性能的时间(迭代次数)来改进现有选择技术。然后，训练模型被训练，并且基于训练更新所标识的时间。由于模型性能稳定，所以可以停止模型训练，并且可以选择下一超参数集合并将其用于训练。这允许在训练对模型的准确度的进一步改进大于阈值量的可能性很小时花费较少时间训练。

2、一种用于为迭代学习模型提供预算约束的超参数值的方法可以包括：由计算设备接收指示迭代学习模型的类型、训练样本、目标函数、最大迭代次数和预算的数据。在使用超参数向量的相应值训练所述类型的模型达一迭代次数的同时，可以记录目标函数的目标函数值和成本函数的成本函数值。超参数向量包括用于每个超参数的超参数值。所述方法可以包括将函数模型拟合到目标函数值并将成本模型拟合到成本函数值，得到经拟合的函数模型和经拟合的成本模型。所述方法可以包括基于经拟合的成本模型、经拟合的函数模型和预算来选择第二超参数向量。所述方法可以包括基于经拟合的函数模型和最大迭代次数，确定要执行的最佳迭代次数，并在最佳迭代次数之后停止使用第二超参数向量进行训练。所述方法可以包括使用第二超参数向量重新训练模型类型的模型达最佳迭代次数。所述方法可以包括提供超参数向量或第二超参数向量的最大化由目标函数定义的目标的超参数值。

3、所述方法可以包括：在使用第二超参数向量训练模型达最佳迭代次数的同时，基于记录的目标函数值和记录的成本函数值来更新最佳迭代次数。所述方法可以包括将通过在(i)第二超参数和(ii)更新后的最佳迭代次数处评估目标函数模型而提供的当前目标函数值与针对目标函数的当前最佳值相比较。所述方法可以包括如果当前目标函数值小于当前最佳值，则停止训练，或者如果当前目标函数值大于(或等于)当前最佳值，则继续利用更多迭代进行训练。确定最佳迭代次数可以包括找到最小迭代次数，在该最小迭代次数下(i)在第二超参数向量和所最大迭代次数处评估的经拟合的函数模型与(ii)在第二超参数向量和迭代次数处的经拟合的函数模型之间的差小于指定阈值。选择第二超参数向量可以包括：基于最大迭代次数，确定超参数空间中的超参数向量的邻域中的超参数的预期效用。选择第二超参数向量可以包括提供与最高预期效用对应的超参数向量作为第二超参数向量。

4、所述方法还可以包括选择超参数向量序列，其中选择第二超参数向量是选择超参数向量序列的一部分。所述方法还可以包括基于确定第二超参数向量(i)针对评估超参数向量具有最高预期即时奖励，(ii)针对评估超参数向量具有最高每单位成本奖励，或(iii)是随机选择的超参数向量，选择超参数向量序列的第二超参数向量。所述方法还可以包括：在将函数模型拟合到目标函数值并将成本模型拟合到成本函数值，得到经拟合的函数模型和经拟合的成本模型之前，通过以下之一来修剪目标函数值和成本函数值：(i)选择等间距的点，(ii)选择具有最高不确定性的点，或者(iii)选择在那些点处评估的目标函数之间的差最大的点。系统、设备和计算机可读介质可以被配置为执行所述方法。

技术特征：

1.一种用于为迭代学习模型提供预算约束的超参数值的方法，所述方法包括：

2.根据权利要求1所述的方法，还包括：在使用所述第二超参数向量训练所述模型达所述最佳迭代次数的同时，基于记录的所述目标函数值和记录的所述成本函数值来更新所述最佳迭代次数。

3.根据权利要求2所述的方法，还包括：

4.根据权利要求1所述的方法，其中确定最佳迭代次数包括找到最小迭代次数，在所述最小迭代次数下(i)在所述第二超参数向量和所述最大迭代次数处评估的所述经拟合的函数模型与(ii)在所述第二超参数向量和所述迭代次数处的所述经拟合的函数模型之间的差小于指定阈值。

5.根据权利要求1所述的方法，其中选择所述第二超参数向量包括：

6.根据权利要求1所述的方法，还包括：

7.根据权利要求1所述的方法，还包括：在将函数模型拟合到所述目标函数值并将成本模型拟合到所述成本函数值，得到经拟合的函数模型和经拟合的成本模型之前，通过以下之一来修剪所述目标函数值和所述成本函数值：(i)选择等间距的点，(ii)选择具有最高不确定性的点，或者(iii)选择在那些点处评估的所述目标函数之间的差最大的点。

8.一种系统，包括：

9.根据权利要求8所述的系统，其中所述操作还包括：在使用所述第二超参数向量训练所述模型达所述最佳迭代次数的同时，基于记录的所述目标函数值和记录的所述成本函数值来更新所述最佳迭代次数。

10.根据权利要求9所述的系统，其中所述操作还包括：

11.根据权利要求8所述的系统，其中确定最佳迭代次数包括找到最小迭代次数，在所述最小迭代次数下(i)在所述第二超参数向量和所述最大迭代次数处评估的所述经拟合的函数模型与(ii)在所述第二超参数向量和所述迭代次数处的所述经拟合的函数模型之间的差小于指定阈值。

12.根据权利要求8所述的系统，其中选择所述第二超参数向量包括：

13.根据权利要求8所述的系统，其中所述操作还包括：

14.根据权利要求8所述的系统，其中所述操作还包括：在将函数模型拟合到所述目标函数值并将成本模型拟合到所述成本函数值，得到经拟合的函数模型和经拟合的成本模型之前，通过以下之一来修剪所述目标函数值和所述成本函数值：(i)选择等间距的点，(ii)选择具有最高不确定性的点，或者(iii)选择在那些点处评估的所述目标函数之间的差最大的点。

15.一种包括指令的机器可读介质，所述指令在由机器执行时，使所述机器执行根据权利要求1至7中的一项所述的方法。

技术总结本文总体上讨论了用于标识预定义预算内的最佳超参数值的设备、系统和方法。方法可以包括：在使用超参数向量的值训练模型达一迭代次数的同时，记录目标函数的目标函数值和成本函数的成本函数值；将函数模型拟合到目标函数值，并且将成本模型拟合到成本函数值，从而产生经拟合的函数模型和经拟合的成本模型；选择第二超参数向量；确定要执行的最佳迭代次数，并且在该最佳迭代次数之后停止使用第二超参数向量进行训练；使用第二超参数向量重新训练模型类型的模型达最佳迭代次数；以及提供超参数向量或第二超参数向量的最大化由目标函数定义的目标的超参数值。技术研发人员：S·贝拉卡利亚,R·谢思,N·富西受保护的技术使用者：微软技术许可有限责任公司技术研发日：技术公布日：2024/8/1