As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Drivers NVIDIA
O Amazon Linux 2023 fornece drivers de GPU NVIDIA e pacotes de kits de ferramentas CUDA por meio de um repositório dedicado. Esse repositório é mantido AWS e fornece recomendações de segurança por meio do Amazon Linux Security Center (
Tópicos
Sobre o repositório NVIDIA
O repositório AL2023 NVIDIA espelha pacotes do repositório oficial NVIDIA CUDA
O repositório está disponível em todas as regiões AWS comerciais, incluindo as regiões AWS GovCloud (EUA) e as regiões AWS da China.
O repositório fornece drivers gráficos e NVIDIA Tesla (computação de data center) para arquiteturas x86_64. Os drivers GRID, usados para recursos de exibição virtual e estação de trabalho remota, não estão incluídos. Para a instalação do driver GRID, consulte Instalar drivers NVIDIA no Guia do usuário do EC2.
Ativando o repositório NVIDIA
Para habilitar o repositório NVIDIA na sua AL2023 instância, instale o nvidia-release pacote. Isso adiciona a configuração do repositório e as chaves GPG ao seu sistema.
[ec2-user ~]$sudo dnf install nvidia-release -y
Verifique se o repositório foi adicionado:
[ec2-user ~]$dnf repolist
Você deve ver o amazonlinux-nvidia repositório na lista.
repo id repo name status
amazonlinux Amazon Linux 2023 repository enabled
amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled
Instalar drivers NVIDIA
Depois de habilitar o repositório, você pode instalar os pacotes de drivers da NVIDIA usando o. dnf
-
Instale os cabeçalhos do kernel e os pacotes de desenvolvimento para seu kernel em execução:
[ec2-user ~]$sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y -
Instale o driver NVIDIA:
[ec2-user ~]$sudo dnf install nvidia-driver-cuda -y -
Reinicie a instância:
[ec2-user ~]$sudo reboot -
Após a reinicialização, verifique se o driver está carregado:
[ec2-user ~]$nvidia-smi
Instalando o kit de ferramentas CUDA
Depois de instalar o driver NVIDIA, você pode instalar o kit de ferramentas CUDA:
[ec2-user ~]$sudo dnf install cuda-toolkit -y
nota
Para instâncias de GPU que exigem o NVIDIA Fabric Manager (como os tipos de instância P4d, P5 e P6), instale e ative os pacotes adicionais:
[ec2-user ~]$DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"[ec2-user ~]$sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y[ec2-user ~]$sudo systemctl enable --now nvidia-fabricmanager[ec2-user ~]$sudo systemctl enable --now nvidia-persistenced
Verifique se o Fabric Manager está em execução e se GPUs eles estão conectados por meio de NVSwitch:
[ec2-user ~]$sudo systemctl status nvidia-fabricmanager[ec2-user ~]$nvidia-smi topo -m
Na matriz de topologia, as conexões entre elas GPUs devem mostrar NV links, indicando NVSwitch conectividade ativa.
Para obter instruções detalhadas sobre a instalação de drivers NVIDIA em instâncias de GPU EC2, incluindo requisitos específicos do tipo de instância, consulte Instalar drivers públicos da NVIDIA no Guia do usuário do EC2.
Removendo o repositório NVIDIA
Para remover a configuração do repositório NVIDIA do seu sistema:
[ec2-user ~]$sudo dnf remove nvidia-release -y
Importante
A remoção da configuração do repositório não remove nenhum pacote NVIDIA já instalado no sistema.