

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# NVIDIA 드라이버
<a name="nvidia-drivers"></a>

 Amazon Linux 2023은 전용 리포지토리를 통해 NVIDIA GPU 드라이버 및 CUDA 툴킷 패키지를 제공합니다. 이 리포지토리는에서 유지 관리 AWS 하며 [Amazon Linux 보안 센터(ALAS)](https://alas.aws.amazon.com)를 통해 보안 권고를 제공합니다.

**Topics**
+ [NVIDIA 리포지토리 정보](#nvidia-drivers-about)
+ [NVIDIA 리포지토리 활성화](#nvidia-drivers-install-repo)
+ [NVIDIA 드라이버 설치](#nvidia-drivers-install-driver)
+ [CUDA 도구 키트 설치](#nvidia-drivers-install-cuda)
+ [NVIDIA 리포지토리 제거](#nvidia-drivers-uninstall)

## NVIDIA 리포지토리 정보
<a name="nvidia-drivers-about"></a>

 AL2023 NVIDIA 리포지토리는 [AL2023용 공식 NVIDIA CUDA 리포지토리의](https://docs.nvidia.com/cuda/cuda-installation-guide-linux/#amazon-installation) 패키지를 미러링합니다.는 재배포하기 전에 AL2023 릴리스 후보로 NVIDIA 소프트웨어를 AWS 검증하고이 리포지토리의 패키지에 대한 보안 권고를 제공합니다.

 리포지토리는 GovCloud(미국) 리전 및 AWS 중국 리전을 AWS 포함한 모든 AWS 상용 리전에서 사용할 수 있습니다.

 리포지토리는 x86\_64 아키텍처를 위한 NVIDIA Tesla(데이터 센터 컴퓨팅) 및 그래픽 드라이버를 제공합니다. 가상 디스플레이 및 원격 워크스테이션 기능에 사용되는 GRID 드라이버는 포함되지 않습니다. GRID 드라이버 설치는 * EC2 사용 설명서*의 [NVIDIA 드라이버 설치를](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/install-nvidia-driver.html) 참조하세요.

## NVIDIA 리포지토리 활성화
<a name="nvidia-drivers-install-repo"></a>

 AL2023 인스턴스에서 NVIDIA 리포지토리를 활성화하려면 `nvidia-release` 패키지를 설치합니다. 그러면 리포지토리 구성과 GPG 키가 시스템에 추가됩니다.

```
[ec2-user ~]$ sudo dnf install nvidia-release -y
```

리포지토리가 추가되었는지 확인합니다.

```
[ec2-user ~]$ dnf repolist
```

목록에 `amazonlinux-nvidia`리포지토리가 표시되어야 합니다.

```
repo id                    repo name                                                status
amazonlinux                Amazon Linux 2023 repository                             enabled
amazonlinux-nvidia         Amazon Linux 2023 NVIDIA repository                      enabled
```

## NVIDIA 드라이버 설치
<a name="nvidia-drivers-install-driver"></a>

 리포지토리를 활성화한 후를 사용하여 NVIDIA 드라이버 패키지를 설치할 수 있습니다`dnf`.

1. 실행 중인 커널에 대한 커널 헤더 및 개발 패키지를 설치합니다.

   ```
   [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
   ```

1. NVIDIA 드라이버를 설치합니다.

   ```
   [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
   ```

1. 인스턴스를 재부팅합니다.

   ```
   [ec2-user ~]$ sudo reboot
   ```

1. 재부팅 후 드라이버가 로드되었는지 확인합니다.

   ```
   [ec2-user ~]$ nvidia-smi
   ```

## CUDA 도구 키트 설치
<a name="nvidia-drivers-install-cuda"></a>

 NVIDIA 드라이버를 설치한 후 CUDA 툴킷을 설치할 수 있습니다.

```
[ec2-user ~]$ sudo dnf install cuda-toolkit -y
```

**참고**  
 NVIDIA Fabric Manager가 필요한 GPU 인스턴스(예: P4d, P5 및 P6 인스턴스 유형)의 경우 추가 패키지를 설치하고 활성화합니다.  

```
[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"
[ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y
[ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager
[ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced
```
Fabric Manager가 실행 중이고 GPUs가 NVSwitch를 통해 연결되어 있는지 확인합니다.  

```
[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager
[ec2-user ~]$ nvidia-smi topo -m
```
토폴로지 매트릭스에서 GPUs 간 연결에는 활성 NVSwitch 연결을 나타내는 `NV` 링크가 표시되어야 합니다.

 인스턴스 유형별 요구 사항을 포함하여 EC2 GPU 인스턴스에 NVIDIA 드라이버를 설치하는 방법에 대한 자세한 지침은 * EC2 사용 설명서*의 [NVIDIA 퍼블릭 드라이버 설치를](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/public-nvidia-driver.html) 참조하세요.

## NVIDIA 리포지토리 제거
<a name="nvidia-drivers-uninstall"></a>

 시스템에서 NVIDIA 리포지토리 구성을 제거하려면: 

```
[ec2-user ~]$ sudo dnf remove nvidia-release -y
```

**중요**  
 리포지토리 구성을 제거해도 시스템에 이미 설치된 NVIDIA 패키지는 제거되지 않습니다.