View a markdown version of this page

Driver NVIDIA - Amazon Linux 2023

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Driver NVIDIA

Amazon Linux 2023 menyediakan driver GPU NVIDIA dan paket toolkit CUDA melalui repositori khusus. Repositori ini dikelola oleh AWS dan menyediakan saran keamanan melalui Amazon Linux Security Center (ALAS).

Tentang repositori NVIDIA

Repositori AL2023 NVIDIA mencerminkan paket dari repositori NVIDIA CUDA resmi untuk. AL2023 AWS memenuhi syarat perangkat lunak NVIDIA dengan kandidat AL2023 rilis sebelum mendistribusikan ulang, dan memberikan saran keamanan untuk paket di repositori ini.

Repositori tersedia di semua Wilayah AWS Komersil, termasuk Wilayah AWS GovCloud (AS) dan Wilayah AWS Tiongkok.

Repositori menyediakan NVIDIA Tesla (komputasi pusat data) dan driver grafis untuk arsitektur x86_64. Driver GRID, yang digunakan untuk tampilan virtual dan kemampuan workstation jarak jauh, tidak disertakan. Untuk instalasi driver GRID, lihat Menginstal driver NVIDIA di Panduan Pengguna EC2.

Mengaktifkan repositori NVIDIA

Untuk mengaktifkan repositori NVIDIA pada AL2023 instans Anda, instal paket. nvidia-release Ini menambahkan konfigurasi repositori dan kunci GPG ke sistem Anda.

[ec2-user ~]$ sudo dnf install nvidia-release -y

Verifikasi repositori telah ditambahkan:

[ec2-user ~]$ dnf repolist

Anda akan melihat amazonlinux-nvidia repositori dalam daftar.

repo id repo name status amazonlinux Amazon Linux 2023 repository enabled amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled

Menginstal driver NVIDIA

Setelah mengaktifkan repositori, Anda dapat menginstal paket driver NVIDIA menggunakan. dnf

  1. Instal header kernel dan paket pengembangan untuk kernel Anda yang sedang berjalan:

    [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
  2. Instal driver NVIDIA:

    [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
  3. Nyalakan ulang instance:

    [ec2-user ~]$ sudo reboot
  4. Setelah reboot, verifikasi driver dimuat:

    [ec2-user ~]$ nvidia-smi

Menginstal toolkit CUDA

Setelah menginstal driver NVIDIA, Anda dapat menginstal toolkit CUDA:

[ec2-user ~]$ sudo dnf install cuda-toolkit -y
catatan

Untuk instans GPU yang memerlukan NVIDIA Fabric Manager (seperti jenis instans P4d, P5, dan P6), instal dan aktifkan paket tambahan:

[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)" [ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y [ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager [ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced

Verifikasi bahwa Fabric Manager sedang berjalan dan terhubung melalui NVSwitch: GPUs

[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager [ec2-user ~]$ nvidia-smi topo -m

Dalam matriks topologi, koneksi antara GPUs harus menunjukkan NV tautan, menunjukkan konektivitas aktif NVSwitch.

Untuk petunjuk terperinci tentang cara menginstal driver NVIDIA pada instans GPU EC2, termasuk persyaratan khusus jenis instans, lihat Menginstal driver publik NVIDIA di Panduan Pengguna EC2.

Menghapus repositori NVIDIA

Untuk menghapus konfigurasi repositori NVIDIA dari sistem Anda:

[ec2-user ~]$ sudo dnf remove nvidia-release -y
penting

Menghapus konfigurasi repositori tidak menghapus paket NVIDIA yang sudah diinstal pada sistem.