本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
对象检测超参数
在 CreateTrainingJob
请求中,您指定要使用的训练算法。您还可以指定特定于算法的超参数,用于帮助根据训练数据集估计模型的参数。下表列出了 Amazon A SageMaker I 提供的用于训练对象检测算法的超参数。有关对象训练工作原理的更多信息,请参阅对象检测的工作原理。
参数名称 | 描述 |
---|---|
num_classes |
输出类的数量。此参数定义网络输出的维度,通常设置为数据集中的类别数。 必填 有效值:正整数 |
num_training_samples |
输入数据集中的训练样本数。 注意如果此值与训练设置中的样本数不匹配,则 必填 有效值:正整数 |
base_network |
要使用的基础网络架构。 可选 有效值:“vgg-16”或“resnet-50” 默认值:“vgg-16” |
early_stopping |
可选 有效值: 默认值: |
early_stopping_min_epochs |
可以调用提前停止逻辑之前必须运行的最小纪元数。仅当 可选 有效值:正整数 默认值:10 |
early_stopping_patience |
如果在相关指标中没有改进,则在结束训练前等待的纪元数(如 可选 有效值:正整数 默认值:5 |
early_stopping_tolerance |
可选 有效值:0 ≤ 浮点值 ≤ 1 默认值:0.0 |
image_shape |
输入图像的图像大小。我们将输入图像重新缩放为具有此大小的方形图像。我们建议使用 300 和 512 来提高性能。 可选 有效值:正整数 ≥300 默认:300 |
epochs |
训练纪元数。 可选 有效值:正整数 默认:30 |
freeze_layer_pattern |
用于冻结基础网络中的层的正则表达式。例如,如果我们设置 可选 有效值:字符串 默认值:不冻结层。 |
kv_store |
分布式训练期间使用的权重更新同步模式。可对各机器同步或异步更新权重。同步更新通常比异步更新提供更好的准确率,但速度较慢。有关详细信息,请参阅分布式训练 注意此参数不适用于单个机器训练。 可选 有效值:
默认:- |
label_width |
用于跨训练和验证数据同步的强制填充标签宽度。例如,如果数据中的一个图像包含最多 10 个对象,并且每个对象的注释都指定了 5 个数字 [class_id、left、top、width、height],那么 可选 有效值:正整数,应足够大以容纳数据中最大的注释信息长度。 默认值:350 |
learning_rate |
初始学习率。 可选 有效值:(0, 1] 中的浮点值 默认值:0.001 |
lr_scheduler_factor |
用于减少学习率的比率。与定义为 可选 有效值:(0, 1) 中的浮点值 默认值:0.1 |
lr_scheduler_step |
降低学习率的纪元。在逗号分隔的字符串中列出的纪元,按照 可选 有效值:字符串 默认值:空字符串 |
mini_batch_size |
训练的批次大小。在单机多 GPU 设置中,每台GPU处理 可选 有效值:正整数 默认值:32 |
momentum |
可选 有效值:(0, 1] 中的浮点值 默认值:0.9 |
nms_threshold |
非最大抑制阈值。 可选 有效值:(0, 1] 中的浮点值 默认值:0.45 |
optimizer |
优化程序类型。有关优化器值的详细信息,请参阅MXNet。API 可选 有效值:['sgd', 'adam', 'rmsprop', 'adadelta'] 默认值:'sgd' |
overlap_threshold |
评估重叠阈值。 可选 有效值:(0, 1] 中的浮点值 默认值:0.5 |
use_pretrained_model |
指明是否使用预先训练的模型进行训练。如果设置为 1,则加载具有架构的预先训练的模型并将其用于训练。否则,从头训练网络。 可选 有效值:0 或 1 默认值:1 |
weight_decay |
可选 有效值:(0, 1) 中的浮点值 默认值:0.0005 |