使用 SageMaker 执行自动模型调优 - Amazon SageMaker

使用 SageMaker 执行自动模型调优

Amazon SageMaker 自动模型调优 (AMT) 也称为超参数调优,通过在数据集上运行大量训练作业来查找模型的最佳版本。为此,AMT 使用您指定的算法和超参数范围。然后,选择超参数值创建性能最佳的模型(按照您选择的指标衡量)。

例如,假设您希望解决营销数据集上的二进制分类问题。您的目标是通过训练 XGBoost 算法模型,最大化算法的曲线下面积 (AUC) 指标。您希望找出 etaalphamin_child_weightmax_depth 超参数的哪些值可以训练出最佳模型。为这些超参数指定值的范围。然后,SageMaker 超参数调优在这些范围内进行搜索,以找到能够创建可生成具最高 AUC 的模型的训练作业的值组合。为了节省资源或满足特定的模型质量期望,您还可以设置完成标准,以便在达到标准后停止调优。

您可以将 SageMaker AMT 与内置算法、自定义算法或 SageMaker 预构建容器结合使用于机器学习框架。

在运行训练作业时,SageMaker AMT 可以使用 Amazon EC2 竞价型实例优化成本。有关更多信息,请参阅使用 Amazon SageMaker 中的托管竞价型训练

在开始使用超参数调优之前,您应该已经具有明确定义的机器学习问题,包括下列内容:

  • 数据集

  • 了解需要训练的算法类型

  • 明确了解如何衡量成功

请准备数据集和算法,使其可用于 SageMaker 中,并至少成功运行训练作业一次。有关设置和运行训练作业的信息,请参阅开始使用