Amazon でモデルをトレーニングする SageMaker - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon でモデルをトレーニングする SageMaker

次の図は、Amazon を使用してモデルをトレーニングおよびデプロイする方法を示しています SageMaker。トレーニングコードはトレーニングデータにアクセスし、S3 バケットからモデルアーティファクトを出力します。その後、モデルのエンドポイントにリクエストを送信して推論を実行できます。Amazon Elastic Container Registry (ECR) に、トレーニングコンテナイメージと推論コンテナイメージの両方を保存できます。


            コードはモデルのトレーニングとデプロイ中に S3 バケット、エンドポイント、ECR と連携します。

次のガイドでは、 の 2 つのコンポーネント SageMakerであるモデルトレーニングとモデルデプロイに焦点を当てます。

でモデルをトレーニングするには SageMaker、トレーニングジョブを作成します。トレーニングジョブには次の情報が含まれます。

  • トレーニングデータが保存されている Amazon Simple Storage Service (Amazon S3) バケットの URL。

  • モデルトレーニング SageMaker に使用するコンピューティングリソース。コンピューティングリソースは、 によって管理される機械学習 (ML) コンピューティングインスタンスです SageMaker。

  • ジョブの出力を保存する S3 バケットの URL。

  • トレーニングコードが保存される Amazon Elastic コンテナレジストリのパス。詳細については、「Docker Registry Paths and Example Code」を参照してください。

注記

入力データセットはトレーニングジョブ AWS リージョン と同じ にある必要があります。

トレーニングアルゴリズムには、次のオプションがあります。

トレーニングジョブを作成すると、 は ML コンピューティングインスタンス SageMaker を起動し、トレーニングコードとトレーニングデータセットを使用してモデルをトレーニングします。結果として得られたモデルアーティファクトおよびその他の出力を、その目的で指定した S3 バケットに保存します。

トレーニングジョブは、 SageMaker コンソールまたは API を使用して作成できます。API を使用してトレーニングジョブを作成する方法については、「CreateTrainingJob」を参照してください。

API を使用してトレーニングジョブを作成すると、 はデフォルトで ML コンピューティングインスタンスにデータセット全体を SageMaker レプリケートします。各 ML コンピューティングインスタンスでデータのサブセットを SageMaker レプリケートするには、 S3DataDistributionTypeフィールドを に設定する必要がありますShardedByS3Key。このフィールドは、低レベルの SDK を使用して設定できます。詳細については、「S3DataSource」の S3DataDistributionType を参照してください。

重要

アルゴリズムコンテナがメモリと競合しないようにするため、ML コンピューティングインスタンスの重要な SageMaker システムプロセスのメモリが予約されるため、インスタンスタイプのすべてのメモリを確認することはできません。