Amazon でモデルをトレーニングする SageMaker - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon でモデルをトレーニングする SageMaker

次の図表は、Amazon でモデルをトレーニングおよびデプロイする方法を示しています。 SageMaker:

ラベルが付けられた領域 SageMaker の二つの要素を強調しています SageMaker: モデルトレーニングとモデル展開

でモデルをトレーニングするには SageMaker、トレーニングジョブを作成します。トレーニングジョブには次の情報が含まれます。

  • トレーニングデータが保存されている Amazon Simple Storage Service (Amazon S3) バケットの URL。

  • 必要なコンピューティングリソース SageMaker モデルトレーニングに使用します。コンピューティングリソースは、によって管理される ML コンピューティングインスタンスです SageMaker。

  • ジョブの出力を保存する S3 バケットの URL。

  • トレーニングコードが保存される Amazon Elastic コンテナレジストリのパス。詳細については、「Docker レジストリパスとサンプルコード」を参照してください。

トレーニングアルゴリズムには、次のオプションがあります。

トレーニングジョブを作成したら、 SageMaker ML コンピューティングインスタンスを起動し、トレーニングコードとトレーニングデータセットを使用してモデルをトレーニングします。結果として得られたモデルアーティファクトおよびその他の出力を、その目的で指定した S3 バケットに保存します。

トレーニングジョブを作成すると SageMaker コンソールまたは API。API を使用してトレーニングジョブを作成する方法については、「CreateTrainingJob」を参照してください。

API を使用してトレーニングジョブを作成すると、 SageMaker デフォルトでデータセット全体を ML コンピューティングインスタンスにレプリケートします。作るには SageMaker 各 ML コンピューティングインスタンスのデータのサブセットをレプリケートするには、S3DataDistributionTypeフィールド先ShardedByS3Key。このフィールドは、低レベルの SDK を使用して設定できます。詳細については、「S3DataSource」の S3DataDistributionType を参照してください。

重要

アルゴリズムコンテナがメモリを奪い合うのを防ぐため、メモリは SageMaker ML コンピューティングインスタンスの重要なプロセスであるため、お使いのインスタンスタイプにメモリすべてが割り当てられることは期待できません。