翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker HyperPod リファレンス
SageMaker HyperPod の使用に関する詳細情報とリファレンスについては、以下のトピックを参照してください。
トピック
SageMaker HyperPod の料金
以下のトピックでは、SageMaker HyperPod の料金について説明します。SageMaker HyperPod インスタンスを使用するための 1 時間あたりの料金の詳細については、Amazon SageMaker料金表
キャパシティリクエスト
SageMaker HyperPod で使用する SageMaker AI を使用して、オンデマンドまたは予約されたコンピューティング容量を割り当てることができます。オンデマンドクラスターの作成では、SageMaker AI オンデマンドキャパシティプールから使用可能なキャパシティが割り当てられます。または、クォータの引き上げのためにチケットを送信することにより、リザーブドキャパシティをリクエストしてアクセスを確保することもできます。インバウンドキャパシティリクエストは SageMaker AI によって優先され、キャパシティ割り当ての推定時間を受け取ります。
サービス請求
SageMaker HyperPod でコンピューティングキャパシティをプロビジョニングすると、キャパシティーの割り当て期間に対して課金されます。SageMaker HyperPod の請求は、キャパシティ割り当てのタイプ (オンデマンド、リザーブド)、インスタンスタイプ、およびインスタンスの使用に費やされた時間の明細項目を含む年間請求書に表示されます。
クォータ引き上げのチケットを送信するには、「SageMaker HyperPod クォータ」を参照してください。
SageMaker HyperPod API
次のリストは、 AWS CLI または を介して SageMaker AI に JSON 形式のアクションリクエストを送信するための SageMaker HyperPod APIs の完全なセットです AWS SDK for Python (Boto3)。
SageMaker HyperPod フォーム
HyperPod で Slurm ワークロードマネージャーツールを設定するには、提供されたフォームを使用して、HyperPod に必要な Slurm 設定ファイルを作成する必要があります。
HyperPod で Slurm ノードをプロビジョニングするための設定フォーム
次のコードは、HyperPod クラスターに Slurm ノードを適切に設定するために準備する必要がある Slurm 設定フォームです。クラスターの作成時、このフォームに記入し、一連のライフサイクルスクリプトの一部としてアップロードする必要があります。HyperPod クラスターの作成プロセス全体でこのフォームを準備する方法については、「ライフサイクルスクリプトを使用して SageMaker HyperPod クラスターをカスタマイズする」を参照してください。
// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "
string
", "login_group": "string
", "worker_groups": [ { "instance_group_name": "string
", "partition_name": "string
" } ], "fsx_dns_name": "string
", "fsx_mountname": "string
" }
-
version
– 必須。これは、HyperPod プロビジョニングパラメータフォームのバージョンです。1.0.0
に保持します。 -
workload_manager
– 必須。これは、HyperPod クラスターで設定するワークロードマネージャーを指定するためのものです。slurm
に保持します。 -
controller_group
– 必須。これは、Slurm コントローラー (ヘッド) ノードに割り当てる HyperPod クラスターインスタンスグループの名前を指定するためのものです。 -
login_group
- オプション。これは、Slurm ログインノードに割り当てる HyperPod クラスターインスタンスグループの名前を指定するためのものです。 -
worker_groups
– 必須。これは、HyperPod クラスターで Slurm ワーカー (コンピューティング) ノードを設定するためのものです。-
instance_group_name
– 必須。これは、Slurm ワーカー (コンピューティング) ノードに割り当てる HyperPod インスタンスグループの名前を指定するためのものです。 -
partition_name
– 必須。これは、ノードにパーティション名を指定するためのものです。
-
-
fsx_dns_name
- オプション。Amazon FSx と通信するよう HyperPod クラスターで Slurm ノードを設定する場合、FSx DNS 名を指定します。 -
fsx_mountname
- オプション。Amazon FSx と通信するよう HyperPod クラスターで Slurm ノードを設定する場合、FSx マウント名を指定します。
SageMaker HyperPod DLAMI
SageMaker HyperPod は、以下に基づいて DLAMI を実行します。
-
Slurm とオーケストレーションするための AWS Deep Learning Base GPU AMI (Ubuntu 20.04)
。 -
Amazon EKS とオーケストレーションするための Amazon Linux 2 ベースの AMI。
SageMaker HyperPod DLAMI には、Slurm、Kubernetes、依存関係、SageMaker HyperPod クラスターソフトウェアパッケージなどのオープンソースツールをサポートするための追加のパッケージがバンドルされており、クラスターのヘルスチェックや自動再開などの回復機能がサポートされます。HyperPod サービスチームが DLAMI を通じて配布する HyperPod ソフトウェアの更新の最新情報については、「Amazon SageMaker HyperPod リリースノート」を参照してください。
SageMaker HyperPod API アクセス許可リファレンス
重要
Amazon SageMaker Studio または Amazon SageMaker Studio Classic に Amazon SageMaker リソースの作成を許可するカスタム IAM ポリシーでは、これらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要になります。IAM ポリシーで Studio と Studio Classic によるリソースの作成が許可されていても、タグ付けが許可されていない場合は、リソースを作成しようとしたときに「AccessDenied」エラーが発生する可能性があります。詳細については、「SageMaker AI リソースにタグ付けするためのアクセス許可を提供する」を参照してください。
SageMaker リソースを作成するためのアクセス許可を付与する AWS Amazon SageMaker AI の マネージドポリシー には、それらのリソースの作成中にタグを追加するためのアクセス許可もあらかじめ含まれています。
SageMaker HyperPod API オペレーションを実行できるようにアクセスコントロールを設定し、クラウド管理者の IAM ユーザーにアタッチできるアクセス許可ポリシーを記述する場合、次の表を参照として使用します。
Amazon SageMaker API オペレーション | 必要なアクセス許可 (API アクション) | リソース |
CreateCluster | sagemaker:CreateCluster |
arn:aws:sagemaker: |
DeleteCluster | sagemaker:DeleteCluster |
arn:aws:sagemaker: |
DescribeCluster | sagemaker:DescribeCluster |
arn:aws:sagemaker: |
DescribeClusterNode | sagemaker:DescribeClusterNode |
arn:aws:sagemaker: |
ListClusterNodes | sagemaker:ListClusterNodes |
arn:aws:sagemaker: |
ListClusters | sagemaker:ListClusters |
arn:aws:sagemaker: |
UpdateCluster | sagemaker:UpdateCluster |
arn:aws:sagemaker: |
UpdateClusterSoftware | sagemaker:UpdateClusterSoftware |
arn:aws:sagemaker: |
SageMaker APIs」のAmazon SageMakerのアクション、リソース、および条件キー」を参照してください。 AWS
の SageMaker HyperPod コマンド AWS CLI
以下は、SageMaker HyperPod がコア HyperPod API オペレーションを実行するための AWS CLI コマンドです。
AWS SDK for Python (Boto3)の SageMaker HyperPod Python モジュール
以下は、SageMaker AI がコア HyperPod API オペレーションを実行するための AWS SDK for Python (Boto3) クライアントのメソッドです。