Installation des pilotes NVIDIA sur des instances Linux - Amazon Elastic Compute Cloud

Installation des pilotes NVIDIA sur des instances Linux

Une instance avec un GPU attaché, telle qu'une instance P3 ou G4, doit avoir le pilote NVIDIA approprié installé. En fonction du type d'instance, vous pouvez télécharger un pilote NVIDIA public, télécharger un pilote depuis Amazon S3 disponible uniquement pour les clients AWS ou utiliser une AMI avec le pilote préinstallé.

Types de pilote NVIDIA

Voici les principaux types de pilote NVIDIA qui peuvent être utilisés avec des instances basées sur GPU.

Pilotes Tesla

Ces pilotes sont principalement destinés aux charges de travail de calcul, qui utilisent des GPU pour des tâches de calcul telles que les calculs parallélisés à virgule flottante pour le machine learning et les transformations de Fourier rapides pour les applications de calcul hautes performances.

Pilotes GRID

Ces pilotes sont certifiés pour fournir des performances optimales pour les applications de visualisation professionnelles qui traitent des contenus tels que des modèles 3D ou des vidéos haute résolution. Vous pouvez configurer les pilotes GRID pour prendre en charge deux modes. Les stations de travail virtuelles Quadro permettent d'accéder à quatre écrans 4K par GPU. Les vApps GRID fournissent des fonctionnalités d'hébergement RDSH App.

Pilotes de jeu

Ces pilotes contiennent des optimisations pour le jeu et sont fréquemment mis à jour pour améliorer les performances. Ils prennent en charge un seul écran 4K par GPU.

Panneau de configuration NVIDIA

Le panneau de commande NVIDIA est pris en charge avec les pilotes GRID et Gaming. Il n'est pas pris en charge avec les pilotes Tesla.

API prises en charge pour les pilotes Tesla, GRID et de jeu

  • OpenCL, OpenGL et Vulkan

  • NVIDIA CUDA et bibliothèques associées (par exemple, cuDNN, TensorRT, nvJPEG et cuBLAS)

  • NVENC pour l'encodage vidéo et NVDEC pour le décodage vidéo

Pilotes disponibles par type d'instance

Le tableau suivant récapitule les pilotes NVIDIA pris en charge pour chaque type d'instance de GPU.

Type d'instance Pilote Tesla Pilote GRID Pilote de jeu
G2 Oui Non Non
G3 Oui Oui Non
G4 Oui Oui Oui
P2 Oui Non Non
P3 Oui Oui † Non

† Utilisation d’AMI Marketplace uniquement

Options d'installation

Utilisez l'une des options suivantes pour obtenir les pilotes NVIDIA requis pour votre instance de GPU.

Option 1 : AMI avec les pilotes NVIDIA installés

AWS et NVIDIA offrent différentes AMI ’Amazon Machine Images) fournies avec des pilotes NVIDIA installés.

Pour mettre à jour la version du pilote installée à l'aide de l'une de ces AMI, vous devez désinstaller les packages NVIDIA de votre instance pour éviter les conflits de version. Utilisez cette commande pour désinstaller les packages NVIDIA :

[ec2-user ~]$ sudo yum erase nvidia cuda

Le package de boîte à outils CUDA fourni par Amazon comporte des dépendances sur les pilotes NVIDIA. La désinstallation des packages NVIDIA efface la boîte à outils CUDA. Vous devez réinstaller la boîte à outils CUDA après avoir installé le pilote NVIDIA.

Option 2 : Pilotes NVIDIA Tesla publics

Pour télécharger le pilote NVIDIA

Connectez-vous à l’instance Linux et téléchargez le pilote NVIDIA 64 bits approprié à votre type d'instance à partir de http://www.nvidia.com/Download/Find.aspx.

Instance Série de produits Produit
G2 Série K K520
G3 M-Class M60
G4 † T-Series T4
P2 Série K K80
P3 Série V V100

Les instances † G4 ont besoin d'un pilote de version 418.87 ou ultérieure.

Pour installer le pilote NVIDIA sur Linux

Pour plus d'informations sur l'installation et la configuration du pilote, reportez-vous au Guide de démarrage rapide d'installation du pilote NVIDIA.

Option 3 : Pilotes GRID (instances G3 et G4)

Ces téléchargements sont disponibles uniquement pour les clients AWS. Si vous téléchargez le pilote, vous acceptez d'employer le logiciel téléchargé uniquement pour développer des AMIs à utiliser avec le matériel NVIDIA Tesla T4 ou NVIDIA Tesla M60. Dès l'installation du logiciel, vous êtes lié par les conditions du document Contrat de licence utilisateur final NVIDIA GRID Cloud.

Prérequis

Configurez les informations d'identification par défaut pour le AWS CLI sur votre instance Windows. Pour de plus amples informations, veuillez consulter Configuration rapide de l'interface de ligne de commande AWS dans le AWS Command Line Interface Guide de l'utilisateur.

Pour installer le pilote NVIDIA GRID sur votre instance Linux

  1. Connectez-vous à votre instance Linux. Installez gcc et make, si ce n’est pas déjà fait.

  2. Mettez à jour le cache de votre package et obtenez les mises à jour de packages nécessaires pour votre instance.

    • Pour Amazon Linux, CentOS, et Red Hat Enterprise Linux :

      [ec2-user ~]$ sudo yum update -y
    • Pour Ubuntu et Debian :

      $ sudo apt-get update -y
  3. (Ubuntu 16.04 et versions ultérieures, avec le package linux-aws) Mettez à niveau le package linux-aws pour recevoir la dernière version.

    $ sudo apt-get upgrade -y linux-aws
  4. Redémarrez votre instance pour charger la dernière version du noyau.

    [ec2-user ~]$ sudo reboot
  5. Reconnectez-vous à votre instance après son redémarrage.

  6. Installez le compilateur gcc et le package d'en-têtes de noyau correspondant à la version du noyau que vous utilisez actuellement.

    • Pour Amazon Linux, CentOS, et Red Hat Enterprise Linux :

      [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
    • Pour Ubuntu et Debian :

      $ sudo apt-get install -y gcc make linux-headers-$(uname -r)
  7. [CentOS, Red Hat Enterprise Linux, Ubuntu, Debian] Désactivez le pilote open source nouveau pour les cartes graphiques NVIDIA.

    1. Ajoutez nouveau au fichier de liste noire /etc/modprobe.d/blacklist.conf. Copiez le bloc de code suivant et collez-le dans un terminal.

      [ec2-user ~]$ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. Modifiez le fichier /etc/default/grub et ajoutez la ligne suivante :

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. Générez à nouveau la configuration Grub.

      • Pour CentOS et Red Hat Enterprise Linux :

        [ec2-user ~]$ sudo grub2-mkconfig -o /boot/grub2/grub.cfg
      • Pour Ubuntu et Debian :

        $ sudo update-grub
  8. Téléchargez l'utilitaire d'installation du pilote GRID à l'aide de la commande suivante :

    • Pour les instances G3 :

      [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .
    • Pour les instances G4 :

      [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/g4/latest/ .

    Plusieurs versions du pilote GRID sont stockées dans ce compartiment. Vous pouvez voir toutes les versions disponibles à l'aide de la commande suivante.

    [ec2-user ~]$ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/
  9. Ajoutez les autorisations pour exécuter l'utilitaire d'installation du pilote à l'aide de la commande suivante.

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  10. Exécutez le script d'auto-installation comme suit pour installer le pilote GRID que vous avez téléchargé. Exemples :

    [ec2-user ~]$ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run

    Lorsque vous y êtes invité, acceptez le contrat de licence et spécifiez les options d'installation comme requis (vous pouvez accepter les options par défaut).

  11. Redémarrez l'instance.

    [ec2-user ~]$ sudo reboot
  12. Vérifiez que le pilote fonctionne. La sortie de la commande suivante affiche la version installée du pilote NVIDIA, ainsi que des détails sur les GPU.

    [ec2-user ~]$ nvidia-smi -q | head
  13. (Facultatif) Pour profiter des quatre écrans d'une résolution allant jusqu'à 4K, configurez le protocole d'affichage haute performance NICE DCV.

  14. (Facultatif) Le mode de station de travail virtuelle NVIDIA Quadro est activé par défaut. Pour activer les fonctionnalités d'hébergement de GRID Virtual Applications for RDSH Application, suivez les étapes d'activation de GRID Virtual Applications dans Activer les applications virtuelles NVIDIA GRID.

Option 4 : Pilotes de jeu NVIDIA (instances G4)

Ces pilotes sont disponibles uniquement pour les clients AWS. Si vous les téléchargez, vous acceptez d'employer le logiciel téléchargé uniquement pour développer des AMIs à utiliser avec le matériel NVIDIA Tesla T4. Dès l'installation du logiciel, vous êtes lié par les conditions du document Contrat de licence utilisateur final NVIDIA GRID Cloud.

Prérequis

Configurez les informations d'identification par défaut pour le AWS CLI sur votre instance Windows. Pour de plus amples informations, veuillez consulter Configuration rapide de l'interface de ligne de commande AWS dans le AWS Command Line Interface Guide de l'utilisateur.

Pour installer le pilote de jeu NVIDIA sur votre instance Linux

  1. Connectez-vous à votre instance Linux. Installez gcc et make, si ce n’est pas déjà fait.

  2. Mettez à jour le cache de votre package et obtenez les mises à jour de packages nécessaires pour votre instance.

    • Pour Amazon Linux, CentOS, et Red Hat Enterprise Linux :

      [ec2-user ~]$ sudo yum update -y
    • Pour Ubuntu et Debian :

      $ sudo apt-get update -y
  3. (Ubuntu 16.04 et versions ultérieures, avec le package linux-aws) Mettez à niveau le package linux-aws pour recevoir la dernière version.

    $ sudo apt-get upgrade -y linux-aws
  4. Redémarrez votre instance pour charger la dernière version du noyau.

    [ec2-user ~]$ sudo reboot
  5. Reconnectez-vous à votre instance après son redémarrage.

  6. Installez le compilateur gcc et le package d'en-têtes de noyau correspondant à la version du noyau que vous utilisez actuellement.

    • Pour Amazon Linux, CentOS, et Red Hat Enterprise Linux :

      [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
    • Pour Ubuntu et Debian :

      $ sudo apt-get install -y gcc make linux-headers-$(uname -r)
  7. [CentOS, Red Hat Enterprise Linux, Ubuntu, Debian] Désactivez le pilote open source nouveau pour les cartes graphiques NVIDIA.

    1. Ajoutez nouveau au fichier de liste noire /etc/modprobe.d/blacklist.conf. Copiez le bloc de code suivant et collez-le dans un terminal.

      [ec2-user ~]$ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. Modifiez le fichier /etc/default/grub et ajoutez la ligne suivante :

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. Générez à nouveau la configuration Grub.

      • Pour CentOS et Red Hat Enterprise Linux :

        [ec2-user ~]$ sudo grub2-mkconfig -o /boot/grub2/grub.cfg
      • Pour Ubuntu et Debian :

        $ sudo update-grub
  8. Téléchargez l'utilitaire d'installation du pilote de jeu à l'aide de la commande suivante :

    [ec2-user ~]$ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .

    Plusieurs versions du pilote de jeu sont stockées dans ce compartiment. Vous pouvez voir toutes les versions disponibles à l'aide de la commande suivante :

    [ec2-user ~]$ aws s3 ls --recursive s3://nvidia-gaming/linux/
  9. Ajoutez les autorisations pour exécuter l'utilitaire d'installation du pilote à l'aide de la commande suivante.

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  10. Exécutez le programme d'installation à l'aide de la commande suivante :

    [ec2-user ~]$ sudo ./NVIDIA-Linux-x86_64*.run

    Lorsque vous y êtes invité, acceptez le contrat de licence et spécifiez les options d'installation comme requis (vous pouvez accepter les options par défaut).

  11. Utilisez la commande suivante pour créer le fichier de configuration requis.

    [ec2-user ~]$ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  12. Utilisez la commande suivante pour télécharger et renommer le fichier de certification.

    • Pour une version 440.68 ou ultérieure :

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • Pour des versions antérieures :

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  13. Redémarrez l'instance.

    [ec2-user ~]$ sudo reboot
  14. (Facultatif) Pour profiter d’un seul écran d'une résolution allant jusqu'à 4K, configurez le protocole d'affichage haute performance NICE DCV.