GPU アクセラレーテッドインスタンスの使用を開始する - Amazon Elastic Compute Cloud

GPU アクセラレーテッドインスタンスの使用を開始する

以下のリストに示すような最新世代の GPU アクセラレーテッドインスタンスタイプは、深層学習やハイパフォーマンスコンピューティング (HPC) アプリケーションに最良のパフォーマンス機能を提供します。機能の詳細については、インスタンスタイプのリンクを選択してください。

高速化インスタンスタイプのインスタンスタイプ仕様に関する完全なリストについては、「Amazon EC2 Instance Types」リファレンスで「Accelerated computing」を参照してください。

ソフトウェア設定

最新世代の GPU アクセラレーテッドインスタンスタイプの使用を開始する最も簡単な方法は、すべての必須ソフトウェアで事前設定されている AWS Deep Learning AMI からインスタンスを起動することです。GPU アクセラレーテッドインスタンスタイプで使用する最新の AWS Deep Learning AMIs については、「AWS Deep Learning AMIs デベロッパーガイド」の「P6 でサポートされる DLAMI」を参照してください。

深層学習または HPC アプリケーションをホストするインスタンスを起動するためにカスタム AMI を構築する必要がある場合は、ベースイメージ上に以下の最小ソフトウェアバージョンをインストールすることをお勧めします。

インスタンスタイプ NVIDIA ドライバー CUDA NVIDIA GDRCopy EFA インストーラ NCCL EFA K8*
P5 530 12.1 2.3 1.24.1 2.18.3 0.4.4
P5e 550 12.1 2.3 1.24.1 2.18.3 0.5.5
P5en 550 12.1 2.3 1.24.1 2.18.3 0.5.6
P6-B200 570 12.8 2.5 1.4.1 2.26.2-1 0.5.10

*EFA K8」の列には、aws-efa-k8s-device-plugin 向けの推奨最低バージョンが含まれています。

注記

バージョン 1.4.1 の EFA インストーラを使用している場合、 aws-ofi-nccl plugin が付属しています。以前のバージョンの EFA インストーラでは、aws-ofi-nccl plugin バージョン 1.7.2-aws 以降を使用してください。

また、より深い C ステートを使用しないようにインスタンスを設定することをお勧めします。詳細については、Amazon Linux 2 ユーザーガイドの「より深い C ステートの制限による高パフォーマンスと低レイテンシー」を参照してください。最新の AWS Deep Learning Base GPU AMI は、より深い C ステートを使用しないように事前設定されています。

ネットワークと Elastic Fabric Adapter (EFA) 設定については、「複数のネットワークカードを使用して Amazon EC2 インスタンスのネットワーク帯域幅を最大化する」を参照してください。