Installieren von NVIDIA-Treibern auf Linux-Instances - Amazon Elastic Compute Cloud

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Installieren von NVIDIA-Treibern auf Linux-Instances

Auf Instances mit einer angeschlossenen NVIDIA-GPU, z. B. P3- oder G4dn-Instances, muss der entsprechende NVIDIA-Treiber installiert sein. Abhängig vom Instance-Typ können Sie entweder einen öffentlichen NVIDIA-Treiber herunterladen, einen Treiber von Amazon S3 herunterladen, der nur für AWS-Kunden verfügbar ist, oder ein AMI verwenden, auf dem der Treiber vorinstalliert ist.

Informationen zum Installieren von AMD-Treibern auf einer Instance mit einer angeschlossenen AMD-GPU, z. B. einer G4ad-Instance, finden Sie stattdessen unter Installieren eines AMD-Treibers auf Linux-Instances.

Typen von NVIDIA-Treibern

Im Folgenden finden Sie die wichtigsten Typen von NVIDIA-Treibern, die mit GPU-basierten Instances verwendet werden können.

Tesla-Treiber

Diese Treiber sind in erster Linie für Datenverarbeitungs-Workloads gedacht, die GPUs für Rechenaufgaben wie parallelisierte Gleitkommaberechnungen für Machine Learning und schnelle Fourier-Transformationen für High Performance Computing-Anwendungen verwenden.

GRID-Treiber

Diese Treiber wurden dafür zertifiziert, dass sie optimale Leistung für professionelle Visualisierungsanwendungen bieten, die Inhalte wie 3D-Modelle oder hochauflösende Videos rendern. Sie können GRID-Treiber zur Unterstützung zweier Modi konfigurieren. Quadro Virtual Workstations bieten pro GPU Zugriff auf vier 4K-Displays. GRID vApps bieten RDSH-App-Hosting-Funktionen.

Gaming-Treiber

Diese Treiber enthalten Optimierungen für Spiele und werden häufig aktualisiert, um Leistungsverbesserungen zu bieten. Sie unterstützen ein einzelnes 4K-Display pro GPU.

NVIDIA-Steuerfeld

Das NVIDIA-Steuerfeld wird mit GRID und Gaming-Treibern unterstützt. Es wird nicht mit Tesla-Treibern unterstützt.

Unterstützte APIs für Tesla-, GRID- und Gaming-Treiber

  • OpenCL, OpenGL und Vulkan

  • NVIDIA CUDA und verwandte Bibliotheken (z. B. cuDNN, TensorRT, nvJPEG und cuBLAS)

  • NVENC für Videocodierung und NVDEC für Videodecodierung

Verfügbare Treiber nach Instance-Typ

In der folgenden Tabelle werden die unterstützten NVIDIA-Treiber für jeden GPU-Instance-Typ zusammengefasst.

Instance-Typ Tesla-Treiber GRID-Treiber Gaming-Treiber
G2 Nein Ja Nein
G3 Ja Ja Nein
G4dn Ja Ja Ja
P2 Ja Nein Nein
P3 Ja Ja † Nein

† Nur mit Marketplace-AMIs.

Installationsoptionen

Verwenden Sie eine der folgenden Optionen, um die für Ihre GPU-Instance erforderlichen NVIDIA-Treiber abzurufen.

Option 1: AMIs mit installierten NVIDIA-Treibern

AWS und NVIDIA bieten verschiedene Amazon Machine Images (AMI), auf denen die NVIDIA-Treiber bereits installiert sind.

Um die mit einem dieser AMIs installierte Treiberversion zu aktualisieren, müssen Sie die NVIDIA-Pakete von Ihrer Instance deinstallieren, um Versionskonflikte zu vermeiden. Verwenden Sie den folgenden Befehl, um die NVIDIA-Pakete zu deinstallieren:

[ec2-user ~]$ sudo yum erase nvidia cuda

Das CUDA-Toolkit-Paket weist Abhängigkeiten zu den NVIDIA-Treibern auf. Durch die Deinstallation der NVIDIA-Pakete wird das CUDA-Toolkit gelöscht. Sie müssen das CUDA-Toolkit nach der Installation des NVIDIA-Treibers erneut installieren.

Option 2: Öffentliche NVIDIA-Treiber

Die von AWS angebotenen Optionen sind mit der erforderlichen Lizenz für den Treiber ausgestattet. Alternativ können Sie die öffentlichen Treiber installieren und Ihre eigene Lizenz verwenden. Um einen öffentlichen Treiber zu installieren, laden Sie ihn wie hier beschrieben von der NVIDIA-Website herunter.

Alternativ können Sie die von AWS angebotenen Optionen anstelle der öffentlichen Treiber verwenden. Um einen GRID-Treiber auf einer P3-Instance zu verwenden, verwenden Sie die AWS Marketplace-AMIs wie in Option 1 beschrieben. Um einen GRID-Treiber auf einer G3- oder G4dn-Instance zu verwenden, verwenden Sie die AWS Marketplace-AMIs, wie in Option 1 beschrieben, oder installieren Sie die von AWS bereitgestellten NVIDIA-Treiber, wie in Option 3 beschrieben.

So laden Sie einen öffentlichen NVIDIA-Treiber herunter:

Melden Sie sich bei Ihrer Linux-Instance an und laden Sie den 64-Bit-NVIDIA-Treiber für den jeweiligen Instance-Typ von http://www.nvidia.com/Download/Find.aspx herunter. Verwenden Sie für Produkttyp Produktserie und Produkt die Optionen in der folgenden Tabelle.

Instance Produkttyp Produktserie Produkt
G2 GRID GRID-Serie GRID K520
G3 Tesla M-Klasse M60
G4dn † Tesla T-Series T4
P2 Tesla K-Serie K80
P3 Tesla V-Serie V100

† G4dn-Instances erfordern die Treiberversion 418.87 oder höher.

So installieren Sie den NVIDIA-Treiber unter Linux

Weitere Informationen zum Installieren und Konfigurieren des Treibers finden Sie im Quickstart-Handbuch für die NVIDIA Driver Installation.

Option 3: GRID-Treiber (G3- und G4dn-Instances)

Diese Downloads sind nur für AWS-Kunden verfügbar. Wenn Sie die Software herunterladen, stimmen Sie zu, diese nur für die Entwicklung von AMIs für den Einsatz auf NVIDIA Tesla T4- oder NVIDIA Tesla M60-Hardware zu verwenden. Durch die Installation der Software stimmen Sie den Bedingungen in der Endbenutzer-Lizenzvereinbarung für NVIDIA GRID Cloud zu.

Voraussetzungen

  • Installieren Sie die AWS CLI auf Ihrer Linux-Instance und konfigurieren Sie die Standardanmeldeinformationen. Weitere Informationen finden Sie unter Installieren der AWS CLI im Benutzerhandbuch für AWS Command Line Interface.

  • IAM-Benutzer müssen über die von der AmazonS3ReadOnlyAccess-Richtlinie erteilten Berechtigungen verfügen.

So installieren Sie den NVIDIA GRID-Treiber auf einer Linux-Instance

  1. Herstellen einer Verbindung mit Ihrer Linux-Instance. Installieren Sie gcc und make, falls sie noch nicht installiert sind.

  2. Aktualisieren Sie den Cache der Paketverwaltung und laden Sie die Paketaktualisierungen für Ihre Instance herunter.

    • Für Amazon Linux, CentOS und Red Hat Enterprise Linux:

      [ec2-user ~]$ sudo yum update -y
    • Für Ubuntu und Debian:

      $ sudo apt-get update -y
  3. (Ubuntu 16.04 und höher, mit dem linux-aws-Paket) Aktualisieren Sie das linux-aws-Paket, um die aktuelle Version zu erhalten.

    $ sudo apt-get upgrade -y linux-aws
  4. Starten Sie Ihre Instance neu, um die neueste Kernelversion zu laden.

    [ec2-user ~]$ sudo reboot
  5. Stellen Sie nach dem Neustart eine neue Verbindung zu Ihrer Instance her.

  6. Installieren Sie den gcc-Compiler und das Kernel-Header-Paket für die aktuell ausgeführte Kernel-Version.

    • Für Amazon Linux, CentOS und Red Hat Enterprise Linux:

      [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
    • Für Ubuntu und Debian:

      $ sudo apt-get install -y gcc make linux-headers-$(uname -r)
  7. [CentOS, Red Hat Enterprise Linux, Ubuntu, Debian] Deaktivieren Sie den nouveau-Open-Source-Treiber für NVIDIA-Grafikkarten.

    1. Fügen Sie der Negativliste in der Datei nouveau den Eintrag /etc/modprobe.d/blacklist.conf hinzu. Kopieren Sie den folgenden Codeblock und fügen Sie ihn in ein Terminalfenster ein.

      [ec2-user ~]$ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. Bearbeiten Sie die Datei /etc/default/grub und fügen Sie folgende Zeile hinzu.

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. Erstellen Sie die neue Grub-Konfiguration.

      • Für CentOS und Red Hat Enterprise Linux:

        [ec2-user ~]$ sudo grub2-mkconfig -o /boot/grub2/grub.cfg
      • Für Ubuntu und Debian:

        $ sudo update-grub
  8. Laden Sie das GRID-Treiberinstallationsprogramm anhand des folgenden Befehls herunter:

    [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .

    Mehrere Versionen des GRID-Treibers werden in diesem Bucket gespeichert. Mit dem folgenden Befehl können Sie alle verfügbaren Versionen anzeigen.

    [ec2-user ~]$ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/

    Ab GRID-Version 11.0 können Sie die Treiberpakete unter latest für G3- und für G4dn-Instances verwenden. Wir werden keine Versionen nach 11.0 zu g4/latest hinzufügen, aber die Version 11.0 und die früheren für G4dn spezifischen Versionen unter g4/latest beibehalten.

  9. Fügen Sie mit dem folgenden Befehl Berechtigungen für die Ausführung des Treiberinstallationsprogramms hinzu.

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  10. Führen Sie das Selbstinstallationsskript wie folgt aus, um den heruntergeladenen GRID-Treiber zu installieren. Beispiel:

    [ec2-user ~]$ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run

    Akzeptieren Sie bei Aufforderung die Lizenzvereinbarung und geben Sie nach Bedarf die Installationsoptionen an (Sie können die Standardoptionen akzeptieren).

  11. Starten Sie die Instance neu.

    [ec2-user ~]$ sudo reboot
  12. Vergewissern Sie sich, dass der Treiber funktioniert. In der Ausgabe des folgenden Befehls werden die installierte Version des NVIDIA-Treibers und Informationen über die GPUs angezeigt.

    [ec2-user ~]$ nvidia-smi -q | head
  13. (Optional) Je nach Anwendungsfall können Sie die folgenden optionalen Schritte ausführen. Wenn Sie diese Funktionalität nicht benötigen, führen Sie diese Schritte nicht aus.

    1. Um die Vorteile der vier Displays mit einer Auflösung von bis zu 4K zu nutzen, richten Sie das leistungsstarke Anzeigeprotokoll NICE DCV ein.

    2. Der NVIDIA Quadro Virtual Workstation-Modus ist standardmäßig aktiviert. Um die Hosting-Funktionen von GRID Virtual Applications for RDSH Application zu aktivieren, führen Sie die Aktivierungsschritte für GRID Virtual Application in Aktivieren von NVIDIA GRID Virtual Applications aus.

Option 4: NVIDIA-Gaming-Treiber (G4dn-Instances)

Diese Treiber sind nur für AWS-Kunden verfügbar. Wenn Sie sie herunterladen, verpflichten Sie sich, diese nur für die Entwicklung von AMIs für den Einsatz auf NVIDIA Tesla T4-Hardware zu verwenden. Durch die Installation der Software stimmen Sie den Bedingungen in der Endbenutzer-Lizenzvereinbarung für NVIDIA GRID Cloud zu.

Voraussetzungen

  • Installieren Sie die AWS CLI auf Ihrer Linux-Instance und konfigurieren Sie die Standardanmeldeinformationen. Weitere Informationen finden Sie unter Installieren der AWS CLI im Benutzerhandbuch für AWS Command Line Interface.

  • IAM-Benutzer müssen über die von der AmazonS3ReadOnlyAccess-Richtlinie erteilten Berechtigungen verfügen.

So installieren Sie den NVIDIA-Gaming-Treiber auf einer Linux-Instance

  1. Herstellen einer Verbindung mit Ihrer Linux-Instance. Installieren Sie gcc und make, falls sie noch nicht installiert sind.

  2. Aktualisieren Sie den Cache der Paketverwaltung und laden Sie die Paketaktualisierungen für Ihre Instance herunter.

    • Für Amazon Linux, CentOS und Red Hat Enterprise Linux:

      [ec2-user ~]$ sudo yum update -y
    • Für Ubuntu und Debian:

      $ sudo apt-get update -y
  3. (Ubuntu 16.04 und höher, mit dem linux-aws-Paket) Aktualisieren Sie das linux-aws-Paket, um die aktuelle Version zu erhalten.

    $ sudo apt-get upgrade -y linux-aws
  4. Starten Sie Ihre Instance neu, um die neueste Kernelversion zu laden.

    [ec2-user ~]$ sudo reboot
  5. Stellen Sie nach dem Neustart eine neue Verbindung zu Ihrer Instance her.

  6. Installieren Sie den gcc-Compiler und das Kernel-Header-Paket für die aktuell ausgeführte Kernel-Version.

    • Für Amazon Linux, CentOS und Red Hat Enterprise Linux:

      [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
    • Für Ubuntu und Debian:

      $ sudo apt-get install -y gcc make linux-headers-$(uname -r)
  7. [CentOS, Red Hat Enterprise Linux, Ubuntu, Debian] Deaktivieren Sie den nouveau-Open-Source-Treiber für NVIDIA-Grafikkarten.

    1. Fügen Sie der Negativliste in der Datei nouveau den Eintrag /etc/modprobe.d/blacklist.conf hinzu. Kopieren Sie den folgenden Codeblock und fügen Sie ihn in ein Terminalfenster ein.

      [ec2-user ~]$ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. Bearbeiten Sie die Datei /etc/default/grub und fügen Sie folgende Zeile hinzu.

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. Erstellen Sie die neue Grub-Konfiguration.

      • Für CentOS und Red Hat Enterprise Linux:

        [ec2-user ~]$ sudo grub2-mkconfig -o /boot/grub2/grub.cfg
      • Für Ubuntu und Debian:

        $ sudo update-grub
  8. Laden Sie das Installationsprogramm für den Gaming-Treiber anhand des folgenden Befehls herunter:

    [ec2-user ~]$ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .

    Mehrere Versionen des Gaming-Treibers werden in diesem Bucket gespeichert. Mit dem folgenden Befehl können Sie alle verfügbaren Versionen anzeigen:

    [ec2-user ~]$ aws s3 ls --recursive s3://nvidia-gaming/linux/
  9. Fügen Sie mit dem folgenden Befehl Berechtigungen für die Ausführung des Treiberinstallationsprogramms hinzu.

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  10. Führen Sie das Installationsprogramm über den folgenden Befehl aus:

    [ec2-user ~]$ sudo ./NVIDIA-Linux-x86_64*.run

    Akzeptieren Sie bei Aufforderung die Lizenzvereinbarung und geben Sie nach Bedarf die Installationsoptionen an (Sie können die Standardoptionen akzeptieren).

  11. Verwenden Sie den folgenden Befehl zum Erstellen der benötigten Konfigurationsdatei.

    [ec2-user ~]$ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  12. Laden Sie die Zertifizierungsdatei mit dem folgenden Befehl herunter und benennen Sie sie um.

    • Für Version 460.39 oder höher:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2021_10_2.cert"
    • Für Version 440.68 bis 445.48:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • Für frühere Versionen:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  13. Starten Sie die Instance neu.

    [ec2-user ~]$ sudo reboot
  14. (Optional) Um die Vorteile einer Einzelanzeige mit einer Auflösung von bis zu 4K zu nutzen, richten Sie das leistungsstarke Anzeigeprotokoll NICE DCV ein. Wenn Sie diese Funktionalität nicht benötigen, führen Sie diesen Schritt nicht aus.

Installieren einer zusätzlichen Version von CUDA

Nachdem Sie einen NVIDIA-Grafiktreiber auf Ihrer Instance installiert haben, können Sie eine andere Version von CUDA als die mit dem Grafiktreiber gebündelte Version installieren. Das folgende Verfahren veranschaulicht, wie mehrere CUDA-Versionen für die Instance konfiguriert werden.

So installieren Sie das CUDA-Toolkit

  1. Herstellen einer Verbindung mit Ihrer Linux-Instance.

  2. Öffnen Sie die NVIDIA-Website und wählen Sie die gewünschte CUDA-Version aus.

  3. Wählen Sie die Architektur, Verteilung und Version für das Betriebssystem auf Ihrer Instance aus. Wählen Sie unter Installationstyp die Option runfile (local) (runfile (lokal))aus.

  4. Folgen Sie den Anweisungen, um das Installationsskript herunterzuladen.

  5. Fügen Sie dem Installationsskript, das Sie heruntergeladen haben, Ausführungsberechtigungen mit dem folgenden Befehl hinzu.

    [ec2-user ~]$ chmod +x downloaded_installer_file
  6. Führen Sie das Installationsskript wie folgt aus, um das CUDA-Toolkit zu installieren und dem Toolkit-Pfad die CUDA-Versionsnummer hinzuzufügen.

    [ec2-user ~]$ sudo downloaded_installer_file --silent --override --toolkit --samples --toolkitpath=/usr/local/cuda-version --samplespath=/usr/local/cuda --no-opengl-lib
  7. (Optional) Legen Sie die CUDA-Standardversion wie folgt fest.

    [ec2-user ~]$ ln -s /usr/local/cuda-version /usr/local/cuda