Amazon でモデルをトレーニング SageMaker - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon でモデルをトレーニング SageMaker

次の図は、Amazon でモデルをトレーニングおよびデプロイする方法を示していますSageMaker。トレーニングコードはトレーニングデータにアクセスし、S3 バケットからモデルアーティファクトを出力します。その後、モデルエンドポイントにリクエストを送信して推論を実行できます。トレーニングコンテナイメージと推論コンテナイメージの両方を Amazon Elastic コンテナレジストリ (ECR) に保存できます。


            コードは、モデルのトレーニングとデプロイ中に S3 バケット、エンドポイント、ECR と相互作用します。

次のガイドでは、モデルトレーニングとモデル展開の SageMaker 2 つの要素に焦点を当てています。

SageMaker でモデルをトレーニングするには、トレーニングジョブを作成します。トレーニングジョブには次の情報が含まれます。

  • トレーニングデータが保存されている Amazon Simple Storage Service (Amazon S3) バケットの URL。

  • SageMaker がモデルトレーニングに使用するコンピューティングリソース。コンピュートリソースは、によって管理される機械学習 (ML) SageMaker コンピュートインスタンスです。

  • ジョブの出力を保存する S3 バケットの URL。

  • トレーニングコードが保存される Amazon Elastic コンテナレジストリのパス。詳細については、「Docker レジストリパスとサンプルコード」を参照してください。

注記

AWS リージョン入力データセットはトレーニングジョブと同じでなければなりません。

トレーニングアルゴリズムには、次のオプションがあります。

トレーニングジョブを作成すると、SageMaker は ML コンピューティングインスタンスを起動し、トレーニングコードとトレーニングデータセットを使用してモデルをトレーニングします。結果として得られたモデルアーティファクトおよびその他の出力を、その目的で指定した S3 バケットに保存します。

SageMaker コンソールまたは API を使用してトレーニングジョブを作成できます。API を使用してトレーニングジョブを作成する方法については、「CreateTrainingJob」を参照してください。

API を使用してトレーニングジョブを作成すると、SageMaker がデフォルトでデータセット全体を ML コンピューティングインスタンスにレプリケートします。各 ML コンピューティングインスタンスのデータのサブセットをレプリケートするように SageMaker に指示するには、S3DataDistributionType フィールドを ShardedByS3Key に設定する必要があります。このフィールドは、低レベルの SDK を使用して設定できます。詳細については、「S3DataSource」の S3DataDistributionType を参照してください。

重要

アルゴリズムコンテナがメモリを奪い合うのを防ぐため、ML SageMaker コンピュートインスタンスの重要なシステムプロセス用にメモリを確保しているため、インスタンスタイプのメモリがすべて表示されることは期待できません。