GPU アクセラレーテッドインスタンスの使用を開始する
以下のリストに示すような最新世代の GPU アクセラレーテッドインスタンスタイプは、深層学習やハイパフォーマンスコンピューティング (HPC) アプリケーションに最良のパフォーマンス機能を提供します。機能の詳細については、インスタンスタイプのリンクを選択してください。
高速化インスタンスタイプのインスタンスタイプ仕様に関する完全なリストについては、「Amazon EC2 Instance Types」リファレンスで「Accelerated computing」を参照してください。
ソフトウェア設定
最新世代の GPU アクセラレーテッドインスタンスタイプの使用を開始する最も簡単な方法は、すべての必須ソフトウェアで事前設定されている AWS Deep Learning AMI からインスタンスを起動することです。GPU アクセラレーテッドインスタンスタイプで使用する最新の AWS Deep Learning AMIs については、「AWS Deep Learning AMIs デベロッパーガイド」の「P6 でサポートされる DLAMI」を参照してください。
深層学習または HPC アプリケーションをホストするインスタンスを起動するためにカスタム AMI を構築する必要がある場合は、ベースイメージ上に以下の最小ソフトウェアバージョンをインストールすることをお勧めします。
インスタンスタイプ | NVIDIA ドライバー | CUDA | NVIDIA GDRCopy | EFA インストーラ | NCCL | EFA K8* |
---|---|---|---|---|---|---|
P5 | 530 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.4.4 |
P5e | 550 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.5.5 |
P5en | 550 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.5.6 |
P6-B200 | 570 | 12.8 | 2.5 | 1.4.1 | 2.26.2-1 | 0.5.10 |
*「EFA K8」の列には、aws-efa-k8s-device-plugin
向けの推奨最低バージョンが含まれています。
注記
バージョン 1.4.1 の EFA インストーラを使用している場合、 aws-ofi-nccl plugin
が付属しています。以前のバージョンの EFA インストーラでは、aws-ofi-nccl plugin
バージョン 1.7.2-aws
以降を使用してください。
また、より深い C ステートを使用しないようにインスタンスを設定することをお勧めします。詳細については、Amazon Linux 2 ユーザーガイドの「より深い C ステートの制限による高パフォーマンスと低レイテンシー」を参照してください。最新の AWS Deep Learning Base GPU AMI は、より深い C ステートを使用しないように事前設定されています。
ネットワークと Elastic Fabric Adapter (EFA) 設定については、「複数のネットワークカードを使用して Amazon EC2 インスタンスのネットワーク帯域幅を最大化する」を参照してください。