Erste Schritte mit GPU-beschleunigten Instances - Amazon Elastic Compute Cloud

Erste Schritte mit GPU-beschleunigten Instances

GPU-beschleunigte Instance-Typen der fünften Generation, wie sie in der folgenden Liste aufgeführt sind, bieten die leistungsstärksten Funktionen für Deep-Learning- und High Performance Computing (HPC)-Anwendungen. Wählen Sie den Link zum Instancetyp aus, um mehr über seine Funktionen zu erfahren.

Eine vollständige Liste der Instance-Typspezifikationen für beschleunigte Instance-Typen finden Sie unter Beschleunigte Datenverarbeitung in der Amazon-EC2-Instance-Typen-Referenz.

Softwarekonfiguration

Der einfachste Weg, mit GPU-beschleunigten Instances der fünften Generation zu beginnen, ist der Start einer Instance aus einem AWS-Deep-Learning-AMI, das mit der gesamten erforderlichen Software vorkonfiguriert ist. Die neueste AWS Deep Learning AMIs für die Verwendung mit GPU-beschleunigten Instances finden Sie im AWS-Deep-Learning-Base-GPU-AMI (Ubuntu 20.04).

Wenn Sie ein benutzerdefiniertes AMI erstellen müssen, um Instances zu starten, die Deep-Learning- oder HPC-Anwendungen hosten, sollten Sie die folgenden Mindest-Software-Versionen installieren:

Software Instance-Typ Mindestversion
NVIDIA-Treiber P5 530
P5e, P5en 550
CUDA P5, P5e, P5en 12.1
NVIDIA GDRCopy P5, P5e, P5en 2.3
EFA-Installer P5, P5e, P5en 1.24.1
NCCL P5, P5e, P5en 2.18.3
Plug-in aws-ofi-nccl P5, P5e, P5en 1.7.2-aws

Außerdem empfiehlt es sich, die Instance so zu konfigurieren, dass keine tieferen Ruhezustände verwendet werden. Weitere Informationen finden Sie unter Hohe Performance und geringe Latenz durch die Beschränkung von tieferen C-Zuständen im Benutzerhandbuch für Amazon Linux 2. Das neueste AWS Deep Learning Base GPU AMI ist so vorkonfiguriert, dass keine tieferen Ruhezustände zum Einsatz kommen.

Informationen zu Netzwerk und Elastic Fabric Adapter (EFA)-Konfiguration finden Sie unter Maximieren der Netzwerkbandbreite auf Amazon-EC2-Instances mit mehreren Netzwerkkarten.

Spezifische Empfehlungen für Ubuntu 20.04

Die folgenden Empfehlungen für Ubuntu 20.04 tragen dazu bei, unvorhersehbare Schnittstellenbenennungen beim Booten zu verhindern:

  • Vergewissern Sie sich, dass Sie systemd 245.4-4ubuntu3.19 oder eine neuere Version verwenden, indem Sie den folgenden Befehl eingeben:

    $ systemd --version
  • Stellen Sie sicher, dass Sie GRUB konfiguriert haben:

    • Öffnen Sie die /etc/default/grub-Konfigurationsdatei in einem Texteditor.

    • Bearbeiten Sie den GRUB_CMDLINE_LINUX_DEFAULT-Eintrag so, dass er net.naming-scheme=v247 einschließt.

    • Starten Sie Ihre Instance neu, indem Sie sudo update-grub ausführen.