View a markdown version of this page

Drivers NVIDIA - Amazon Linux 2023

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Drivers NVIDIA

O Amazon Linux 2023 fornece drivers de GPU NVIDIA e pacotes de kits de ferramentas CUDA por meio de um repositório dedicado. Esse repositório é mantido AWS e fornece recomendações de segurança por meio do Amazon Linux Security Center (ALAS).

Sobre o repositório NVIDIA

O repositório AL2023 NVIDIA espelha pacotes do repositório oficial NVIDIA CUDA para. AL2023 AWS qualifica o software NVIDIA com candidatos a AL2023 lançamento antes da redistribuição e fornece recomendações de segurança para os pacotes neste repositório.

O repositório está disponível em todas as regiões AWS comerciais, incluindo as regiões AWS GovCloud (EUA) e as regiões AWS da China.

O repositório fornece drivers gráficos e NVIDIA Tesla (computação de data center) para arquiteturas x86_64. Os drivers GRID, usados para recursos de exibição virtual e estação de trabalho remota, não estão incluídos. Para a instalação do driver GRID, consulte Instalar drivers NVIDIA no Guia do usuário do EC2.

Ativando o repositório NVIDIA

Para habilitar o repositório NVIDIA na sua AL2023 instância, instale o nvidia-release pacote. Isso adiciona a configuração do repositório e as chaves GPG ao seu sistema.

[ec2-user ~]$ sudo dnf install nvidia-release -y

Verifique se o repositório foi adicionado:

[ec2-user ~]$ dnf repolist

Você deve ver o amazonlinux-nvidia repositório na lista.

repo id repo name status amazonlinux Amazon Linux 2023 repository enabled amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled

Instalar drivers NVIDIA

Depois de habilitar o repositório, você pode instalar os pacotes de drivers da NVIDIA usando o. dnf

  1. Instale os cabeçalhos do kernel e os pacotes de desenvolvimento para seu kernel em execução:

    [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
  2. Instale o driver NVIDIA:

    [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
  3. Reinicie a instância:

    [ec2-user ~]$ sudo reboot
  4. Após a reinicialização, verifique se o driver está carregado:

    [ec2-user ~]$ nvidia-smi

Instalando o kit de ferramentas CUDA

Depois de instalar o driver NVIDIA, você pode instalar o kit de ferramentas CUDA:

[ec2-user ~]$ sudo dnf install cuda-toolkit -y
nota

Para instâncias de GPU que exigem o NVIDIA Fabric Manager (como os tipos de instância P4d, P5 e P6), instale e ative os pacotes adicionais:

[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)" [ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y [ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager [ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced

Verifique se o Fabric Manager está em execução e se GPUs eles estão conectados por meio de NVSwitch:

[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager [ec2-user ~]$ nvidia-smi topo -m

Na matriz de topologia, as conexões entre elas GPUs devem mostrar NV links, indicando NVSwitch conectividade ativa.

Para obter instruções detalhadas sobre a instalação de drivers NVIDIA em instâncias de GPU EC2, incluindo requisitos específicos do tipo de instância, consulte Instalar drivers públicos da NVIDIA no Guia do usuário do EC2.

Removendo o repositório NVIDIA

Para remover a configuração do repositório NVIDIA do seu sistema:

[ec2-user ~]$ sudo dnf remove nvidia-release -y
Importante

A remoção da configuração do repositório não remove nenhum pacote NVIDIA já instalado no sistema.