アルゴリズムを使用してトレーニングジョブを実行する (コンソール)アルゴリズムを使用してトレーニングジョブを実行する (API)アルゴリズムを使用してトレーニングジョブを実行する (Amazon SageMaker Python SDK)

アルゴリズムを使用してトレーニングジョブを実行する

アルゴリズムリソースを使用してトレーニングジョブを作成するには、Amazon SageMaker AI コンソール、低レベルの Amazon SageMaker API、または Amazon SageMaker Python SDK を使用します。

トピック

アルゴリズムを使用してトレーニングジョブを実行する (コンソール)
アルゴリズムを使用してトレーニングジョブを実行する (API)
アルゴリズムを使用してトレーニングジョブを実行する (Amazon SageMaker Python SDK)

アルゴリズムを使用してトレーニングジョブを実行する (コンソール)

アルゴリズムを使用してトレーニングジョブを実行するには (コンソール)

https://console.aws.amazon.com/sagemaker/ で SageMaker AI コンソールを開きます。
[Algorithms (アルゴリズム)] を選択します。
[My algorithms (マイアルゴリズム)] タブのリストから作成したアルゴリズムを選択するか、[AWS Marketplace subscriptions (AWS Marketplace サブスクリプション)] タブでサブスクライブしたアルゴリズムを選択します。
[トレーニングジョブの作成] を選択します。

選択したアルゴリズムが自動的に選択されます。
[トレーニングジョブの作成] ページで、以下の情報を指定します。
1. [ジョブ名] には、トレーニングジョブの名前を入力します。
2. IAM ロールの場合は、SageMaker AI でトレーニングジョブを実行するために必要なアクセス許可を持つ IAM ロールを選択するか、新しいロールの作成を選択して、SageMaker AI がAmazonSageMakerFullAccess管理ポリシーがアタッチされたロールを作成できるようにします。詳細については、SageMaker AI 実行ロールの使用方法を参照してください。
3. [リソース設定] では、以下の情報を指定します。
  1. [インスタンスタイプ] では、トレーニングに使用するインスタンスタイプを選択します。
  2. [インスタンス数] には、トレーニングジョブに使用する ML インスタンス数を入力します。
  3. [インスタンスあたりのボリュームサイズ (GB)] には、プロビジョニングする ML ストレージボリュームのサイズを入力します。ML ストレージボリュームには、モデルアーティファクトと増分ステートが保存されます。
  4. 暗号化キーで、Amazon SageMaker AI が AWS Key Management Service キーを使用してトレーニングインスタンスにアタッチされた ML ストレージボリューム内のデータを暗号化する場合は、キーを指定します。
  5. [停止条件] には、トレーニングジョブの最大実行時間を秒数、分数、時間数、または日数で指定します。
4. [VPC] には、トレーニングコンテナにアクセス権を付与する Amazon VPC を選択します。詳細については、「SageMaker AI トレーニングジョブに Amazon VPC のリソースへのアクセスを許可する」を参照してください。
5. [ハイパーパラメータ] には、トレーニングジョブに使用するハイパーパラメータの値を指定します。
6. [入力データ設定] には、トレーニングジョブに使用する入力データのチャネルごとに以下の値を指定します。アルゴリズムの [アルゴリズムの要約] ページの [チャネル仕様] セクションでは、トレーニングのサポートに使用しているアルゴリズムのチャネル、コンテンツタイプ、サポートされる圧縮タイプ、サポートされる入力モードを確認できます。
  1. [チャネル名] には、入力チャネルの名前を入力します。
  2. [コンテンツタイプ] には、アルゴリズムがチャネルに期待するデータのコンテンツタイプを入力します。
  3. [圧縮タイプ] では、使用するデータ圧縮タイプがあればそれを選択します。
  4. [レコードラッパー] では、アルゴリズムで RecordIO 形式のデータが必要な場合に [RecordIO] を選択します。
  5. [S3 データタイプ]、[S3 データディストリビューションタイプ]、および [S3 の場所] には、適切な値を指定します。これらの値の意味については、S3DataSourceを参照してください。
  6. [入力モード] では、プロビジョニングされた ML ストレージボリュームからデータをダウンロードし、ディレクトリを Docker ボリュームにマウントする場合に [ファイル] を選択します。Amazon S3 からコンテナに直接データをストリーミングする場合は [Pipe (パイプ)] を選択します。
  7. 別の入力チャネルを追加するには、[チャネルの追加] を選択します。入力チャネルの追加が完了したら、[完了] を選択します。
7. [出力] 場所には、以下の値を指定します。
  1. [S3 出力パス] では、トレーニングジョブがモデルアーティファクトなどの出力を保存する S3 の場所を選択します。
    
    注記
    この場所に保存されているモデルアーティファクトを使用して、このトレーニングジョブからモデルまたはモデルパッケージを作成します。
  2. 暗号化キーの場合、SageMaker AI が AWS KMS キーを使用して S3 の場所に保管中の出力データを暗号化するようにする場合。
8. [タグ] には、トレーニングジョブを管理するためのタグを 1 つ以上指定します。各タグは、キー、および値 (オプション) で構成されます。タグキーはリソースごとに一意である必要があります。
9. [トレーニングジョブの作成] を選択して、トレーニングジョブを実行します。

アルゴリズムを使用してトレーニングジョブを実行する (API)

アルゴリズムを使用してトレーニングジョブを実行する際に SageMaker API を使用するには、CreateTrainingJob に渡す AlgorithmSpecification オブジェクトの [AlgorithmName] フィールドにアルゴリズムの名前または Amazon リソースネーム (ARN) を指定します。SageMaker AI でのモデルのトレーニングについては、「」を参照してくださいAmazon SageMaker でモデルをトレーニングする。

アルゴリズムを使用してトレーニングジョブを実行する (Amazon SageMaker Python SDK)

で作成またはサブスクライブしたアルゴリズムを使用してトレーニングジョブ AWS Marketplace を作成し、 AlgorithmEstimator オブジェクトを作成し、algorithm_arn引数の値として Amazon リソースネーム (ARN) またはアルゴリズムの名前を指定します。その後、推定器の fit メソッドを呼び出します。以下に例を示します。


from sagemaker import AlgorithmEstimator
data_path = os.path.join(DATA_DIR, 'marketplace', 'training')

algo = AlgorithmEstimator(
algorithm_arn='arn:aws:sagemaker:us-east-2:012345678901:algorithm/my-algorithm',
        role='SageMakerRole',
        instance_count=1,
        instance_type='ml.c4.xlarge',
        sagemaker_session=sagemaker_session,
        base_job_name='test-marketplace')

train_input = algo.sagemaker_session.upload_data(
path=data_path, key_prefix='integ-test-data/marketplace/train')

algo.fit({'training': train_input})

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

アルゴリズムとモデルパッケージのリソースの使用

アルゴリズムを使用してハイパーパラメータ調整ジョブを実行する