SageMaker HyperPod リファレンス - Amazon SageMaker AI

SageMaker HyperPod リファレンス

SageMaker HyperPod の使用に関する詳細情報とリファレンスについては、以下のトピックを参照してください。

SageMaker HyperPod の料金

以下のトピックでは、SageMaker HyperPod の料金について説明します。SageMaker HyperPod インスタンスの使用に関する 1 時間あたりの料金の詳細については、Amazon SageMaker の料金」も参照してください。

キャパシティリクエスト

SageMaker HyperPod で使用できるように、SageMaker AI でオンデマンドまたはリザーブドコンピューティングキャパシティを割り当てることができます。オンデマンドクラスターを作成すると、SageMaker AI オンデマンドキャパシティプールから利用可能なキャパシティが割り当てられます。または、クォータの引き上げのためにチケットを送信することにより、リザーブドキャパシティをリクエストしてアクセスを確保することもできます。インバウンドキャパシティリクエストは SageMaker AI によって優先され、キャパシティ割り当ての推定時間が提供されます。

サービス請求

SageMaker HyperPod でコンピューティングキャパシティをプロビジョニングすると、キャパシティーの割り当て期間に対して課金されます。SageMaker HyperPod の請求は、キャパシティ割り当てのタイプ (オンデマンド、リザーブド)、インスタンスタイプ、およびインスタンスの使用に費やされた時間の明細項目を含む年間請求書に表示されます。

クォータ引き上げのチケットを送信するには、「SageMaker HyperPod クォータ」を参照してください。

SageMaker HyperPod API

次のリストは、AWS CLI または AWS SDK for Python (Boto3) を介して SageMaker に JSON 形式でアクションリクエストを送信するための SageMaker HyperPod API の完全なセットです。

SageMaker HyperPod フォーム

HyperPod で Slurm ワークロードマネージャーツールを設定するには、提供されたフォームを使用して、HyperPod に必要な Slurm 設定ファイルを作成する必要があります。

HyperPod で Slurm ノードをプロビジョニングするための設定フォーム

次のコードは、HyperPod クラスターに Slurm ノードを適切に設定するために準備する必要がある Slurm 設定フォームです。クラスターの作成時、このフォームに記入し、一連のライフサイクルスクリプトの一部としてアップロードする必要があります。HyperPod クラスターの作成プロセス全体でこのフォームを準備する方法については、「ライフサイクルスクリプトを使用して SageMaker HyperPod クラスターをカスタマイズする」を参照してください。

// Save as provisioning_parameters.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "string", "login_group": "string", "worker_groups": [ { "instance_group_name": "string", "partition_name": "string" } ], "fsx_dns_name": "string", "fsx_mountname": "string" }
  • version – 必須。これは、HyperPod プロビジョニングパラメータフォームのバージョンです。1.0.0 に保持します。

  • workload_manager – 必須。これは、HyperPod クラスターで設定するワークロードマネージャーを指定するためのものです。slurm に保持します。

  • controller_group – 必須。これは、Slurm コントローラー (ヘッド) ノードに割り当てる HyperPod クラスターインスタンスグループの名前を指定するためのものです。

  • login_group - オプション。これは、Slurm ログインノードに割り当てる HyperPod クラスターインスタンスグループの名前を指定するためのものです。

  • worker_groups – 必須。これは、HyperPod クラスターで Slurm ワーカー (コンピューティング) ノードを設定するためのものです。

    • instance_group_name – 必須。これは、Slurm ワーカー (コンピューティング) ノードに割り当てる HyperPod インスタンスグループの名前を指定するためのものです。

    • partition_name – 必須。これは、ノードにパーティション名を指定するためのものです。

  • fsx_dns_name - オプション。Amazon FSx と通信するよう HyperPod クラスターで Slurm ノードを設定する場合、FSx DNS 名を指定します。

  • fsx_mountname - オプション。Amazon FSx と通信するよう HyperPod クラスターで Slurm ノードを設定する場合、FSx マウント名を指定します。

SageMaker HyperPod DLAMI

SageMaker HyperPod は、以下に基づいて DLAMI を実行します。

SageMaker HyperPod DLAMI には、Slurm、Kubernetes、依存関係、SageMaker HyperPod クラスターソフトウェアパッケージなどのオープンソースツールをサポートするための追加のパッケージがバンドルされており、クラスターのヘルスチェックや auto-resume などの回復機能がサポートされます。HyperPod サービスチームが DLAMI を通じて配布する HyperPod ソフトウェアの更新の最新情報については、「Amazon SageMaker HyperPod リリースノート」を参照してください。

SageMaker HyperPod API アクセス許可リファレンス

重要

Amazon SageMaker Studio または Amazon SageMaker Studio Classic に Amazon SageMaker リソースの作成を許可するカスタム IAM ポリシーでは、これらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要になります。IAM ポリシーで Studio と Studio Classic によるリソースの作成が許可されていても、タグ付けが許可されていない場合は、リソースを作成しようとしたときに「AccessDenied」エラーが発生する可能性があります。詳細については、「SageMaker AI リソースにタグ付けのアクセス許可を付与する」を参照してください。

SageMaker リソースを作成するためのアクセス許可を付与する Amazon SageMaker AI 向けの AWS マネージドポリシー には、それらのリソースの作成中にタグを追加するためのアクセス許可もあらかじめ含まれています。

SageMaker HyperPod API オペレーションを実行できるようにアクセスコントロールを設定し、クラウド管理者の IAM ユーザーにアタッチできるアクセス許可ポリシーを記述する場合、次の表を参照として使用します。

Amazon SageMaker API オペレーション 必要なアクセス許可 (API アクション) リソース
CreateCluster sagemaker:CreateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DeleteCluster sagemaker:DeleteCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeCluster sagemaker:DescribeCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeClusterNode sagemaker:DescribeClusterNode arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusterNodes sagemaker:ListClusterNodes arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusters sagemaker:ListClusters arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateCluster sagemaker:UpdateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateClusterSoftware sagemaker:UpdateClusterSoftware arn:aws:sagemaker:region:account-id:cluster/cluster-id

SageMaker APIのアクセス許可とリソースタイプの詳細なリストについては、「AWS サービス認可リファレンス」の「Amazon SageMaker のアクション、リソース、条件キー」を参照してください。

AWS CLI の SageMaker HyperPod コマンド

以下は、SageMaker HyperPod がコア HyperPod API オペレーションを実行するための AWS CLI コマンドです。

AWS SDK for Python (Boto3) の SageMaker HyperPod Python モジュール

SageMaker AI がコア HyperPod API オペレーションを実行するための AWS SDK for Python (Boto3) クライアントのメソッドは次のとおりです。