Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Driver NVIDIA
Amazon Linux 2023 menyediakan driver GPU NVIDIA dan paket toolkit CUDA melalui repositori khusus. Repositori ini dikelola oleh AWS dan menyediakan saran keamanan melalui Amazon Linux Security Center (
Topik
Tentang repositori NVIDIA
Repositori AL2023 NVIDIA mencerminkan paket dari repositori NVIDIA CUDA resmi
Repositori tersedia di semua Wilayah AWS Komersil, termasuk Wilayah AWS GovCloud (AS) dan Wilayah AWS Tiongkok.
Repositori menyediakan NVIDIA Tesla (komputasi pusat data) dan driver grafis untuk arsitektur x86_64. Driver GRID, yang digunakan untuk tampilan virtual dan kemampuan workstation jarak jauh, tidak disertakan. Untuk instalasi driver GRID, lihat Menginstal driver NVIDIA di Panduan Pengguna EC2.
Mengaktifkan repositori NVIDIA
Untuk mengaktifkan repositori NVIDIA pada AL2023 instans Anda, instal paket. nvidia-release Ini menambahkan konfigurasi repositori dan kunci GPG ke sistem Anda.
[ec2-user ~]$sudo dnf install nvidia-release -y
Verifikasi repositori telah ditambahkan:
[ec2-user ~]$dnf repolist
Anda akan melihat amazonlinux-nvidia repositori dalam daftar.
repo id repo name status
amazonlinux Amazon Linux 2023 repository enabled
amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled
Menginstal driver NVIDIA
Setelah mengaktifkan repositori, Anda dapat menginstal paket driver NVIDIA menggunakan. dnf
-
Instal header kernel dan paket pengembangan untuk kernel Anda yang sedang berjalan:
[ec2-user ~]$sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y -
Instal driver NVIDIA:
[ec2-user ~]$sudo dnf install nvidia-driver-cuda -y -
Nyalakan ulang instance:
[ec2-user ~]$sudo reboot -
Setelah reboot, verifikasi driver dimuat:
[ec2-user ~]$nvidia-smi
Menginstal toolkit CUDA
Setelah menginstal driver NVIDIA, Anda dapat menginstal toolkit CUDA:
[ec2-user ~]$sudo dnf install cuda-toolkit -y
catatan
Untuk instans GPU yang memerlukan NVIDIA Fabric Manager (seperti jenis instans P4d, P5, dan P6), instal dan aktifkan paket tambahan:
[ec2-user ~]$DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"[ec2-user ~]$sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y[ec2-user ~]$sudo systemctl enable --now nvidia-fabricmanager[ec2-user ~]$sudo systemctl enable --now nvidia-persistenced
Verifikasi bahwa Fabric Manager sedang berjalan dan terhubung melalui NVSwitch: GPUs
[ec2-user ~]$sudo systemctl status nvidia-fabricmanager[ec2-user ~]$nvidia-smi topo -m
Dalam matriks topologi, koneksi antara GPUs harus menunjukkan NV tautan, menunjukkan konektivitas aktif NVSwitch.
Untuk petunjuk terperinci tentang cara menginstal driver NVIDIA pada instans GPU EC2, termasuk persyaratan khusus jenis instans, lihat Menginstal driver publik NVIDIA di Panduan Pengguna EC2.
Menghapus repositori NVIDIA
Untuk menghapus konfigurasi repositori NVIDIA dari sistem Anda:
[ec2-user ~]$sudo dnf remove nvidia-release -y
penting
Menghapus konfigurasi repositori tidak menghapus paket NVIDIA yang sudah diinstal pada sistem.