기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
NVIDIA 드라이버
Amazon Linux 2023은 전용 리포지토리를 통해 NVIDIA GPU 드라이버 및 CUDA 툴킷 패키지를 제공합니다. 이 리포지토리는에서 유지 관리 AWS 하며 Amazon Linux 보안 센터(ALAS)
NVIDIA 리포지토리 정보
AL2023 NVIDIA 리포지토리는 AL2023용 공식 NVIDIA CUDA 리포지토리의
리포지토리는 GovCloud(미국) 리전 및 AWS 중국 리전을 AWS 포함한 모든 AWS 상용 리전에서 사용할 수 있습니다.
리포지토리는 x86_64 아키텍처를 위한 NVIDIA Tesla(데이터 센터 컴퓨팅) 및 그래픽 드라이버를 제공합니다. 가상 디스플레이 및 원격 워크스테이션 기능에 사용되는 GRID 드라이버는 포함되지 않습니다. GRID 드라이버 설치는 EC2 사용 설명서의 NVIDIA 드라이버 설치를 참조하세요.
NVIDIA 리포지토리 활성화
AL2023 인스턴스에서 NVIDIA 리포지토리를 활성화하려면 nvidia-release 패키지를 설치합니다. 그러면 리포지토리 구성과 GPG 키가 시스템에 추가됩니다.
[ec2-user ~]$sudo dnf install nvidia-release -y
리포지토리가 추가되었는지 확인합니다.
[ec2-user ~]$dnf repolist
목록에 amazonlinux-nvidia리포지토리가 표시되어야 합니다.
repo id repo name status
amazonlinux Amazon Linux 2023 repository enabled
amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled
NVIDIA 드라이버 설치
리포지토리를 활성화한 후를 사용하여 NVIDIA 드라이버 패키지를 설치할 수 있습니다dnf.
-
실행 중인 커널에 대한 커널 헤더 및 개발 패키지를 설치합니다.
[ec2-user ~]$sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y -
NVIDIA 드라이버를 설치합니다.
[ec2-user ~]$sudo dnf install nvidia-driver-cuda -y -
인스턴스를 재부팅합니다.
[ec2-user ~]$sudo reboot -
재부팅 후 드라이버가 로드되었는지 확인합니다.
[ec2-user ~]$nvidia-smi
CUDA 도구 키트 설치
NVIDIA 드라이버를 설치한 후 CUDA 툴킷을 설치할 수 있습니다.
[ec2-user ~]$sudo dnf install cuda-toolkit -y
참고
NVIDIA Fabric Manager가 필요한 GPU 인스턴스(예: P4d, P5 및 P6 인스턴스 유형)의 경우 추가 패키지를 설치하고 활성화합니다.
[ec2-user ~]$DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"[ec2-user ~]$sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y[ec2-user ~]$sudo systemctl enable --now nvidia-fabricmanager[ec2-user ~]$sudo systemctl enable --now nvidia-persistenced
Fabric Manager가 실행 중이고 GPUs가 NVSwitch를 통해 연결되어 있는지 확인합니다.
[ec2-user ~]$sudo systemctl status nvidia-fabricmanager[ec2-user ~]$nvidia-smi topo -m
토폴로지 매트릭스에서 GPUs 간 연결에는 활성 NVSwitch 연결을 나타내는 NV 링크가 표시되어야 합니다.
인스턴스 유형별 요구 사항을 포함하여 EC2 GPU 인스턴스에 NVIDIA 드라이버를 설치하는 방법에 대한 자세한 지침은 EC2 사용 설명서의 NVIDIA 퍼블릭 드라이버 설치를 참조하세요.
NVIDIA 리포지토리 제거
시스템에서 NVIDIA 리포지토리 구성을 제거하려면:
[ec2-user ~]$sudo dnf remove nvidia-release -y
중요
리포지토리 구성을 제거해도 시스템에 이미 설치된 NVIDIA 패키지는 제거되지 않습니다.