SageMaker HyperPod 参考文献 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker HyperPod 参考文献

SageMaker HyperPod の使用に関する詳細情報と参考資料は、以下のトピックを参照してください。

SageMaker HyperPod 価格設定

以下のトピックでは、 SageMaker HyperPod 価格に関する情報を提供します。 SageMaker HyperPod インスタンス使用時の 1 時間あたりの料金の詳細については、Amazon SageMaker 料金表もご覧ください

キャパシティリクエスト

オンデマンドまたはリザーブドコンピュートキャパシティを割り当てて SageMaker 、で使用することができます。 SageMaker HyperPodオンデマンドクラスターを作成すると、 SageMakerオンデマンド容量プールから利用可能な容量が割り当てられます。または、クォータ増額のチケットを送信して、アクセスを確保するためのリザーブドキャパシティをリクエストすることもできます。受信キャパシティリクエストには優先順位が付けられ、 SageMaker キャパシティ割り当ての推定時間がわかります。

サービス請求

にコンピューティングキャパシティをプロビジョニングすると SageMaker HyperPod、キャパシティ割り当て期間分の料金が請求されます。 SageMaker HyperPod 請求は、容量割り当てのタイプ (オンデマンド、リザーブド)、インスタンスタイプ、インスタンスの使用にかかった時間などの明細項目とともに、記念日の請求書に表示されます。

クォータ増額のチケットを送信するには、を参照してくださいSageMaker HyperPod クォータ

SageMaker HyperPod API

以下のリストは、JSON SageMaker HyperPod SageMaker AWS CLI AWS SDK for Python (Boto3)形式のアクションリクエストをまたは経由で送信するための API の全セットです。

SageMaker HyperPod フォーム

Slurm ワークロードマネージャーツールを設定するには HyperPod、用意されているフォームを使用して必要な Slurm 設定ファイルを作成する必要があります。 HyperPod

に Slurm ノードをプロビジョニングするための設定フォーム HyperPod

以下のコードは、クラスターに Slurm ノードを適切に設定するために準備する必要がある Slurm 設定フォームです。 HyperPod このフォームに必要事項を記入し、クラスター作成時に一連のライフサイクルスクリプトの一部としてアップロードする必要があります。 HyperPod クラスター作成プロセス全体でこのフォームを作成する方法については、を参照してくださいSageMaker HyperPod ライフサイクル設定のベストプラクティス

// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "string", "login_group": "string", "worker_groups": [ { "instance_group_name": "string", "partition_name": "string" } ], "fsx_dns_name": "string", "fsx_mountname": "string" }
  • version – 必須。 HyperPodこれはプロビジョニングパラメータフォームのバージョンです。そのままにしておいてください1.0.0

  • workload_manager – 必須。これは、 HyperPod クラスターに設定するワークロードマネージャーを指定するためのものです。そのままにしておいてくださいslurm

  • controller_group – 必須。Slurm コントローラー (ヘッド) HyperPod ノードに割り当てたいクラスターインスタンスグループの名前を指定するためのものです。

  • login_group - オプション。Slurm HyperPod ログインノードに割り当てるクラスターインスタンスグループの名前を指定するためのものです。

  • worker_groups – 必須。これはクラスターに Slurm ワーカー (コンピュート) ノードをセットアップするためのものです。 HyperPod

    • instance_group_name – 必須。Slurm ワーカー (コンピュート) HyperPod ノードに割り当てるインスタンスグループの名前を指定するためのものです。

    • partition_name – 必須。これはノードにパーティション名を指定するためのものです。

  • fsx_dns_name - オプション。Amazon FSx HyperPod と通信するようにクラスターに Slurm ノードを設定する場合は、FSx DNS 名を指定します。

  • fsx_mountname - オプション。Amazon FSx HyperPod と通信するようにクラスターに Slurm ノードを設定する場合は、FSx マウント名を指定します。

SageMaker HyperPod DLAMI

SageMaker HyperPod エージェントは、AWS ディープラーニングベース GPU SageMaker HyperPod AMI (Ubuntu 20.04) 上に構築された DLAMI を実行します。

SageMaker HyperPod DLAMI には、Slurm や依存関係などのオープンソースツールをサポートする追加パッケージと、 SageMaker HyperPod クラスターヘルスチェックや自動再開などの機能をサポートするクラスターソフトウェアパッケージがバンドルされています。 HyperPod サービスチームが DLAMI HyperPod を通じて配布するソフトウェアアップデートをフォローアップする方法については、を参照してください。Amazon SageMaker HyperPod リリースノート

SageMaker HyperPod API 権限リファレンス

重要

Amazon SageMaker Studio または Amazon Studio Classic に Amazon SageMaker リソースの作成を許可するカスタム IAM ポリシーでは、 SageMakerそれらのリソースにタグを追加するためのアクセス権限も付与する必要があります。Studio と Studio Classic は作成したリソースに自動的にタグを付けるため、リソースにタグを追加する権限が必要です。IAM ポリシーで Studio と Studio Classic によるリソースの作成は許可されているが、タグ付けは許可されていない場合、リソースを作成しようとしたときに AccessDenied "" エラーが発生する可能性があります。詳細については、「リソースにタグ付け SageMakerするためのアクセス許可を提供する」を参照してください。

AWS Amazon の マネージドポリシー SageMaker SageMaker リソースを作成する権限を付与するものには、リソースの作成時にタグを追加する権限が既に含まれています。

SageMaker HyperPod API オペレーションの実行を許可するためのアクセスコントロールを設定し、クラウド管理者用に IAM ユーザーにアタッチできるアクセス権限ポリシーを作成する場合は、次の表を参考にしてください。

Amazon SageMaker API オペレーション 必要なアクセス許可 (API アクション) リソース
CreateCluster sagemaker:CreateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DeleteCluster sagemaker:DeleteCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeCluster sagemaker:DescribeCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeClusterNode sagemaker:DescribeClusterNode arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusterNodes sagemaker:ListClusterNodes arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusters sagemaker:ListClusters arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateCluster sagemaker:UpdateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateClusterSoftware sagemaker:UpdateClusterSoftware arn:aws:sagemaker:region:account-id:cluster/cluster-id

SageMaker API のアクセス権限とリソースタイプの一覧については、『AWS サービス認証リファレンス』の「Amazon SageMaker のアクション、リソース、および条件キー」を参照してください。

SageMaker HyperPod のコマンド AWS CLI

コア HyperPod API AWS CLI SageMaker HyperPod オペレーションを実行するためのコマンドは次のとおりです

SageMaker HyperPod にある Python モジュール AWS SDK for Python (Boto3)

コア HyperPod API AWS SDK for Python (Boto3) SageMaker 操作を実行するためのクライアントのメソッドは次のとおりです