使用 SageMaker 执行自动模型优化 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 SageMaker 执行自动模型优化

亚马逊 SageMaker 自动模型优化也称为超参数优化,它使用您指定的算法和超参数范围,在您的数据集上运行多个训练作业来查找模型的最佳版本。然后,它会选择超参数值来生成性能最佳的模型(按所选指标衡量)。

例如,假设您希望解决营销数据集上的二进制分类问题。您的目标是最大化曲线下面的区域(AUC)通过训练算法的指标XGBoost 算法模型。您不知道应该使用 etaalphamin_child_weightmax_depth 超参数的哪些值来训练最佳模型。要查找这些超参数的最佳值,可以指定以下值的范围: SageMaker 超参数优化搜索以查找导致训练作业绩最出色的值组合,并根据您选择的目标指标进行评估。超参数优化会启动训练作业,使用您指定范围中的超参数值,然后返回具有最高 auc 的训练作业。

您可以使用 SageMaker 使用内置算法、自定义算法和自动模型优化 SageMaker 用于机器学习框架的预构建容器。

亚马逊 SageMaker 在运行培训作业时,自动模型调整可以使用 Amazon EC2 竞价型实例优化成本。有关托管现场训练的更多信息,请参阅。Amazon SageMaker 中的托管的 Spot.

在开始使用超参数优化之前,您应该已经具有明确定义的机器学习问题,包括下列内容:

  • 一个数据集

  • 了解需要训练的算法的类型

  • 明确了解如何衡量成功

您还应准备数据集和算法,以便它们在其中运行。 SageMaker 并至少成功运行训练作业一次。有关设置和运行训练作业的信息,请参阅开始使用 Amazon SageMaker