Amazon EC2 实例的 NVIDIA 驱动程序
已挂载 NVIDIA GPU 的实例(例如 P 系列或 G 系列实例类型)必须安装相应的 NVIDIA 驱动程序。根据实例类型,您可以下载公有 NVIDIA 驱动程序、从仅对 AWS 客户可用的 Amazon S3 下载驱动程序或者使用预安装了驱动程序的 AWS AMI。
要在挂载 AMD GPU 的实例(例如,G4ad 实例)上安装 AMD 驱动程序,则请参阅AMD 驱动程序。
目录
NVIDIA 驱动程序的类型
以下是可与基于 GPU 的实例一起使用的 NVIDIA 驱动程序的主要类型。
- Tesla 驱动程序
-
这些驱动程序主要用于将 GPU 用于计算任务的计算工作负载,例如适用于机器学习的并行浮点计算,以及适用于高性能计算应用的快速傅里叶变换。
- GRID 驱动程序
-
这些驱动程序经过认证,可针对渲染 3D 模型或高分辨率视频等内容的专业可视化应用程序,提供最佳性能。您可以将 GRID 驱动程序配置为支持两种模式。Quadro 虚拟工作站的每个 GPU 可支持四个 4K 显示器。GRID vApps 提供 RDSH App 托管功能。
- Gaming 驱动程序
-
这些驱动程序包含针对游戏的优化,并经常更新以提供性能增强。它们支持每个 GPU 单个 4K 显示器。
已配置模式
在 Windows 上,Tesla 驱动程序配置为在 Tesla Compute Cluster (TCC) 模式下运行。GRID 和 Gaming 驱动程序配置为在 Windows Display Driver Model (WDDM) 模式下运行。在 TCC 模式下,该卡专用于计算工作负载。在 WDDM 模式下,该卡同时支持计算和图形工作负载。
NVIDIA 控制面板
GRID 和游戏驱动程序支持 NVIDIA 控制面板。Tesla 驱动程序不支持此控制面板。
支持 Tesla、GRID 和游戏驱动程序的 API
-
OpenCL、OpenGL 和 Vulkan
-
NVIDIA CUDA 和相关库(例如,cuDNN、TensorRT、nvJPEG 和 cuBLAS)
-
用于视频编码的 NVENC 和用于视频解码的 NVDEC
-
仅限 Windows 的 API:DirectX、Direct2D、DirectX Video Acceleration、DirectX Raytracing
按实例类型列出的可用驱动程序
下表总结了各种 GPU 实例类型支持的 NVIDIA 驱动程序。
实例类型 | Tesla 驱动程序 | GRID 驱动程序 | Gaming 驱动程序 |
---|---|---|---|
G3 | 是 | 是 | 否 |
G4dn | 是 | 是 | 是 |
G5 | 支持 | 是 | 是 |
G5g | 是¹ | 否 | 否 |
G6 | 支持 | 是 | 是 |
G6e | 支持 | 是 | 是 |
G6f | 否 | 是 | 否 |
Gr6 | 支持 | 是 | 否 |
Gr6f | 否 | 是 | 否 |
P2 | 是 | 否 | 否 |
P3 | 是 | 否 | 否 |
P4d | 是 | 否 | 否 |
P4de | 是 | 否 | 否 |
P5 | 是 | 否 | 否 |
P5e | 是 | 否 | 否 |
P5en | 是 | 否 | 否 |
P6-B200 | 是 | 否 | 否 |
P6e-GB200 | 是 | 否 | 否 |
¹ 此 Tesla 驱动程序还支持特定于 ARM64 平台的优化图形应用程序
安装选项
使用以下选项之一获取 GPU 实例所需的 NVIDIA 驱动程序。
选项
选项 1:安装了 NVIDIA 驱动程序的 AMI
AWS 和 NVIDIA 随已安装的 NVIDIA 驱动程序提供了不同的亚马逊机器映像(AMI)。
要查看取决于操作系统(OS)平台的注意事项,请选择适用于您的 AMI 的选项卡。
选项 2:公共 NVIDIA 驱动程序
如果选项 1:安装了 NVIDIA 驱动程序的 AMI中所述的 AWS Marketplace AMI 不适合您的使用案例,则可以安装公共驱动程序和自带许可。要安装公共驱动程序,请按照本节所述从 NVIDIA 网站下载。
步骤 1:下载公共 NVIDIA 驱动程序
登录您的实例并从 http://www.nvidia.com/Download/Find.aspx
实例 | 产品类型 | 产品系列 | 产品 | 最低驱动程序版本 |
---|---|---|---|---|
G3 | Tesla | M-Class | M60 | -- |
G4dn | Tesla | T 系列 | T4 | -- |
G5 | Tesla | A 系列 | A10 | 470.00 或更高版本 |
G5g1 | Tesla | T 系列 | NVIDIA T4G | 470.82.01 或更高版本 |
G6 | Tesla | L 系列 | L4 | 525.0 或更高版本 |
G6e | Tesla | L 系列 | L40S | 535.0 或更高版本 |
Gr6 | Tesla | L 系列 | L4 | 525.0 或更高版本 |
P2 | Tesla | E 系列 | K80 | -- |
P3 | Tesla | V 系列 | V100 | -- |
P4d | Tesla | A 系列 | A100 | -- |
P4de | Tesla | A 系列 | A100 | -- |
P5 | Tesla | H 系列 | H100 | 530 或更高版本 |
P5e | Tesla | H 系列 | H200 | 550 或更高版本 |
P5en | Tesla | H 系列 | H200 | 550 或更高版本 |
P6-B2002 | Tesla | HGX 系列 | B200 | 570 或更高版本 |
P6e-GB200 | Tesla | HGX 系列 | B200 | 570 或更高版本 |
1 G5g 实例的操作系统是 Linux aarch64。
2 对于 P6-B200 实例类型,配置 NVIDIA Fabric Manager 有额外的安装要求。
步骤 2:安装公共驱动程序
按照您的实例类型操作系统的安装说明进行操作。
为 P6-B200 实例类型配置 Fabric Manager
P6-B200 平台的独特之处在于它将 Mellanox ConnectX 7 网络接口卡 (NIC) 作为 PCIe 设备公开给实例。这些 CX7 NIC 不充当典型的网络接口,而是充当 NVSwitch 网桥,提供控制路径来初始化和配置 NVFabric(即 GPU 互连的 NVLink 拓扑)。
要完全初始化系统,NVIDIA Fabric Manager 必须配置 NVFabric
并建立 NVSwitch 拓扑。这使得 InfiniBand 内核模块能够与 CX7 设备通信。
根据实例操作系统的不同,安装和配置步骤略有不同。按照 NVIDIA Developer 网站上的说明获取 CUDA Toolkit
-
安装 NVIDIA Link Subnet Manager 和
ibstat
。sudo dnf install nvlink5
-
启用启动时自动加载 Infiniband 模块。
echo "ib_umad" | sudo tee -a /etc/modules-load.d/modules.conf
-
在启动时启用 NVIDIA Fabric Manager 服务。
sudo dnf install nvidia-fabric-manager sudo systemctl start nvidia-fabricmanager.service
-
重启实例。
sudo reboot
-
安装
mlx5_ib
内核模块。sudo apt install linux-modules-extra-$(uname -r) -y
-
安装 NVIDIA Link Subnet Manager。
sudo apt install nvlsm
-
安装
ibstat
。sudo apt install infiniband-diags
-
启用启动时自动加载 Infiniband 模块。
echo "ib_umad" | sudo tee -a /etc/modules-load.d/modules.conf
-
在启动时启用 NVIDIA Fabric Manager 服务。
sudo apt install nvidia-fabricmanager sudo systemctl enable nvidia-fabricmanager
-
重启实例。
sudo reboot
选项 3:GRID 驱动程序(G6、Gr6、G6e、G6f、Gr6f、G5、G4dn 和 G3 实例)
这些下载仅供 AWS 客户使用。一旦开始下载,即表示您同意按照 NVIDIA GRID 云终端用户许可协议(EULA)中提及的 AWS 解决方案的要求,仅将下载的软件用来开发 AMI,以用于 NVIDIA L4、NVIDIA L40S、NVIDIA A10G、NVIDIA Tesla T4 或 NVIDIA Tesla M60 硬件。可使用 GRID 驱动程序在 AWS 环境中创建和使用 AMI。安装软件后,您将受 NVIDIA GRID 云最终用户许可协议
注意事项
-
G6f 和 Gr6f 实例需要 GRID 18.4 或更高版本。
-
G6e 实例需要 GRID 17.4 或更高版本。
-
G6 和 Gr6 实例需要 GRID 17.1 或更高版本。
-
G5 实例需要 GRID 13.1 或更高版本(或 GRID 12.4 或更高版本)。
-
要让 GRID 许可正常运行,G3 实例需要 AWS 提供的 DNS 解析。
-
IMDSv2 仅在 14.0 或更高版本的 NVIDIA 驱动程序上受支持。
-
对于 Windows 实例,如果您使用自定义 Windows AMI 启动实例,则 AMI 必须是使用 Sysprep 创建的标准化映像,以确保 GRID 驱动程序正常工作。有关更多信息,请参阅 使用 Windows Sysprep 创建 Amazon EC2 AMI。
-
GRID 17.0 及更高版本不支持 Windows Server 2019。
-
GRID 14.2 及更高版本不支持 Windows Server 2016。
-
G3 实例不支持 GRID 17.0 及更高版本。
-
对于 Linux 实例,如果 NVIDIA 安装程序失败并显示错误消息,则可能需要安装或更新软件包(例如 gcc)。具体情况取决于操作系统和内核的版本。有关更多信息,请参阅 NVIDIA 企业支持门户。
先决条件
-
(Linux) 验证 AWS CLI 是否已安装在您的实例上并配置了默认凭证。有关更多信息,请参阅AWS Command Line Interface《用户指南》中的安装 AWS CLI。
-
(Windows) 在您的实例上配置 AWS Tools for Windows PowerShell 的默认凭证。有关更多信息,请参阅《AWS Tools for PowerShell 用户指南》中的 AWS Tools for Windows PowerShell 入门。
-
用户或角色必须具有包含 AmazonS3ReadOnlyAccess 策略的授予权限。
在实例上安装 NVIDIA GRID 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo dnf update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo dnf install gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
安装内核标头软件包。
[ec2-user ~]$
sudo dnf install -y kernel-devel kernel-modules-extra -
使用以下命令下载 GRID 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。
[ec2-user ~]$
aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ -
使用以下命令添加权限以运行驱动程序安装实用程序。
[ec2-user ~]$
chmod +x NVIDIA-Linux-x86_64*.run -
如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:
[ec2-user ~]$
sudo /bin/sh ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。
[ec2-user ~]$
nvidia-smi -q | head -
如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
在实例上安装 NVIDIA GRID 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo yum install -y kernel-devel-$(uname -r) -
使用以下命令下载 GRID 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。
[ec2-user ~]$
aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ -
使用以下命令添加权限以运行驱动程序安装实用程序。
[ec2-user ~]$
chmod +x NVIDIA-Linux-x86_64*.run -
如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:
[ec2-user ~]$
sudo /bin/sh ./NVIDIA-Linux-x86_64*.run如果您使用的是具有 5.10 内核版本的 Amazon Linux 2,请使用以下命令安装 GRID 驱动程序。
[ec2-user ~]$
sudo CC=/usr/bin/gcc10-cc ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。
[ec2-user ~]$
nvidia-smi -q | head -
如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
在实例上安装 NVIDIA GRID 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install -y gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为您运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo yum install -y kernel-devel-$(uname -r) -
禁用 NVIDIA 显卡的
nouveau
开源驱动程序。-
将
nouveau
添加到/etc/modprobe.d/blacklist.conf
黑名单文件。复制下面的代码块并将其粘贴到终端中。[ec2-user ~]$
cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF -
编辑
/etc/default/grub
文件并添加以下行:GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
-
重新生成 Grub 配置。
[ec2-user ~]$
sudo grub2-mkconfig -o /boot/grub2/grub.cfg
-
-
使用以下命令下载 GRID 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。
[ec2-user ~]$
aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ -
使用以下命令添加权限以运行驱动程序安装实用程序。
[ec2-user ~]$
chmod +x NVIDIA-Linux-x86_64*.run -
如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:
[ec2-user ~]$
sudo /bin/sh ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。
[ec2-user ~]$
nvidia-smi -q | head -
如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
安装 GUI 桌面/工作站程序包。
[ec2-user ~]$
sudo yum groupinstall -y "Server with GUI"
-
在实例上安装 NVIDIA GRID 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install -y gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为您运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo dnf install -y elfutils-libelf-devel libglvnd-devel kernel-devel-$(uname -r) -
使用以下命令下载 GRID 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。
[ec2-user ~]$
aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ -
使用以下命令添加权限以运行驱动程序安装实用程序。
[ec2-user ~]$
chmod +x NVIDIA-Linux-x86_64*.run -
如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:
[ec2-user ~]$
sudo /bin/sh ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。
[ec2-user ~]$
nvidia-smi -q | head -
如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
安装 GUI 工作站程序包。
[ec2-user ~]$
sudo dnf groupinstall -y workstation
-
在 Linux 实例上安装 NVIDIA GRID 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install -y gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为您运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo dnf install -y elfutils-libelf-devel libglvnd-devel kernel-devel-$(uname -r) -
使用以下命令下载 GRID 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。
[ec2-user ~]$
aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ -
使用以下命令添加权限以运行驱动程序安装实用程序。
[ec2-user ~]$
chmod +x NVIDIA-Linux-x86_64*.run -
如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:
[ec2-user ~]$
sudo /bin/sh ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。
[ec2-user ~]$
nvidia-smi -q | head -
如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
在实例上安装 NVIDIA GRID 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
$
sudo apt-get update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo apt-get install -y gcc make -
(Ubuntu)升级
linux-aws
程序包以接收最新版本。$
sudo apt-get upgrade -y linux-aws(Debian)升级程序包以接收最新版本。
$
sudo apt-get upgrade -y -
重启实例以加载最新内核版本。
$
sudo reboot -
重启之后重新连接到实例。
-
为您当前运行的内核版本安装内核标头软件包。
$
sudo apt-get install -y linux-headers-$(uname -r) linux-modules-extra-$(uname -r) -
禁用 NVIDIA 显卡的
nouveau
开源驱动程序。-
将
nouveau
添加到/etc/modprobe.d/blacklist.conf
黑名单文件。复制下面的代码块并将其粘贴到终端中。$
cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF -
编辑
/etc/default/grub
文件并添加以下行:GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
-
重新生成 Grub 配置。
$
sudo update-grub
-
-
使用以下命令下载 GRID 驱动程序安装实用程序:
$
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。
$
aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ -
使用以下命令添加权限以运行驱动程序安装实用程序。
$
chmod +x NVIDIA-Linux-x86_64*.run -
如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:
$
sudo /bin/sh ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。
$
nvidia-smi -q | head -
如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 $
sudo touch /etc/modprobe.d/nvidia.conf$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
$
sudo reboot -
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
安装 GUI 桌面/工作站程序包。
$
sudo apt-get install -y lightdm ubuntu-desktop
-
在 Windows 实例上安装 NVIDIA GRID 驱动程序
-
连接到您的 Windows 实例并打开 PowerShell 窗口。
-
使用以下 PowerShell 命令,将驱动程序和 NVIDIA GRID Cloud 最终用户许可协议
从 Amazon S3 下载到您的桌面。 $Bucket = "ec2-windows-nvidia-drivers" $KeyPrefix = "latest" $LocalPath = "$home\Desktop\NVIDIA" $Objects = Get-S3Object -BucketName $Bucket -KeyPrefix $KeyPrefix -Region us-east-1 foreach ($Object in $Objects) { $LocalFileName = $Object.Key if ($LocalFileName -ne '' -and $Object.Size -ne 0) { $LocalFilePath = Join-Path $LocalPath $LocalFileName Copy-S3Object -BucketName $Bucket -Key $Object.Key -LocalFile $LocalFilePath -Region us-east-1 } }
此存储桶中存储了多个版本的 NVIDIA GRID 驱动程序。您可以通过删除
-KeyPrefix $KeyPrefix
选项下载桶中的所有可用 Windows 版本。有关适用于您操作系统的 NVIDIA GRID 驱动程序版本的信息,请参阅 NVIDIA 网站上的 NVIDIA Virtual GPU (vGPU) Software。 从 GRID 版本 11.0 开始,您可以对 G3 和 G4dn 实例使用
latest
下的驱动程序。我们不会将 11.0 之后的版本添加到g4/latest
中,但会将版本 11.0 和特定于 G4dn 的早期版本保留在g4/latest
下。G5 实例需要 GRID 13.1 或更高版本(或 GRID 12.4 或更高版本)。
-
导航到桌面,双击安装文件以启动它 (选择与您的实例操作系统版本对应的驱动程序版本)。按照说明安装驱动程序并根据需要重启实例。要验证 GPU 是否正常工作,请检查设备管理器。
-
(可选)使用以下命令可在控制面板中禁用授权页面以防止用户意外更改产品类型(默认情况下,将启用 NVIDIA GRID 虚拟工作站)。有关更多信息,请参阅 GRID 许可用户指南
。 PowerShell
运行以下 PowerShell 命令以创建注册表值,从而在控制面板中禁用授权页面。AWS Windows AMI 中的 AWS Tools for PowerShell 默认为 32 位版本,并且此命令将失败。相反,将使用操作系统附带的 64 位版本的 PowerShell。
New-Item -Path "HKLM:\SOFTWARE\NVIDIA Corporation\Global" -Name GridLicensing New-ItemProperty -Path "HKLM:\SOFTWARE\NVIDIA Corporation\Global\GridLicensing" -Name "NvCplDisableManageLicensePage" -PropertyType "DWord" -Value "1"
命令提示符
运行以下注册表命令以创建注册表值,从而在控制面板中禁用授权页面。您可以使用命令提示符窗口或 64 位版本的 PowerShell 运行它。
reg add "HKLM\SOFTWARE\NVIDIA Corporation\Global\GridLicensing" /v NvCplDisableManageLicensePage /t REG_DWORD /d 1
-
(可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。
-
请设置高性能显示协议 Amazon DCV,从而有助于利用四个高达 4K 分辨率的显示器的优势。
-
NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成在基于 Amazon EC2 GPU 的实例上激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。
-
选项 4:NVIDIA 游戏驱动程序(G6、G6e、G5 和 G4dn 实例)
这些驱动程序仅供 AWS 客户使用。下载即表明您同意仅将下载的软件用于开发在 NVIDIA L4、NVIDIA L40S、NVIDIA A10G、NVIDIA Tesla T4 或 NVIDIA Tesla M60 硬件上使用的 AMI。可使用 GRID 驱动程序在 AWS 环境中创建和使用 AMI。安装软件后,您将受 NVIDIA GRID 云最终用户许可协议
注意事项
-
要让 GRID 许可正常运行,G3 实例需要 AWS 提供的 DNS 解析。
-
IMDSv2 仅在 495.x 或更高版本的 NVIDIA 驱动程序上受支持。
先决条件
-
(Linux) 验证 AWS CLI 是否已安装在您的实例上并配置了默认凭证。有关更多信息,请参阅AWS Command Line Interface《用户指南》中的安装 AWS CLI。
-
用户或角色必须具有包含 AmazonS3ReadOnlyAccess 策略的授予权限。
在实例上安装 NVIDIA Gaming 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo dnf update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo dnf install gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启后重新连接到您的实例。
-
安装内核标头软件包。
[ec2-user ~]$
sudo dnf install -y kernel-devel kernel-modules-extra kernel-devel-$(uname -r) kernel-headers-$(uname -r) dkms -
使用以下命令下载 Gaming 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:
[ec2-user ~]$
aws s3 ls --recursive s3://nvidia-gaming/linux/ -
从下载的
.zip
归档中提取 Gaming 驱动程序安装实用程序。[ec2-user ~]$
unziplatest-driver-name
.zip -d nvidia-drivers -
使用以下命令添加权限以运行驱动程序安装实用程序:
[ec2-user ~]$
chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run -
使用以下命令运行安装程序:
[ec2-user ~]$
sudo ./nvidia-drivers/NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。
-
使用以下命令创建所需的配置文件。
[ec2-user ~]$
cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF -
使用以下命令下载并重命名认证文件。
-
对于 460.39 及更高版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2024_02_22.cert" -
对于 440.68 到 445.48 版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert" -
对于早期版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
-
-
如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
请使用以下命令验证 NVIDIA Gaming 许可证。
[ec2-user ~]$
nvidia-smi.exe -q在输出中,搜索
vGPU Software Licensed Product
。 -
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。
在实例上安装 NVIDIA Gaming 驱动程序
-
连接到您的实例。更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install gcc make -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启后重新连接到您的实例。
-
为您当前运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo yum install -y kernel-devel-$(uname -r) -
使用以下命令下载 Gaming 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:
[ec2-user ~]$
aws s3 ls --recursive s3://nvidia-gaming/linux/ -
从下载的
.zip
归档中提取 Gaming 驱动程序安装实用程序。[ec2-user ~]$
unziplatest-driver-name
.zip -d nvidia-drivers -
使用以下命令添加权限以运行驱动程序安装实用程序:
[ec2-user ~]$
chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run -
使用以下命令运行安装程序:
[ec2-user ~]$
sudo ./nvidia-drivers/NVIDIA-Linux-x86_64*.run如果您使用的是具有 5.10 内核版本的 Amazon Linux 2,请使用以下命令安装 NVIDIA 游戏驱动程序。
[ec2-user ~]$
sudo CC=/usr/bin/gcc10-cc ./NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项(您可以接受默认选项)。
-
使用以下命令创建所需的配置文件。
[ec2-user ~]$
cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF -
使用以下命令下载并重命名认证文件。
-
对于 460.39 及更高版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2024_02_22.cert" -
对于 440.68 到 445.48 版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert" -
对于早期版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
-
-
如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
请使用以下命令验证 NVIDIA Gaming 许可证。
[ec2-user ~]$
nvidia-smi.exe -q在输出中,搜索
vGPU Software Licensed Product
。 -
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。
在实例上安装 NVIDIA Gaming 驱动程序
-
连接到 Linux 实例。安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install -y gcc make -
更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为您当前运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo yum install -y unzip kernel-devel-$(uname -r) -
禁用 NVIDIA 显卡的
nouveau
开源驱动程序。-
将
nouveau
添加到/etc/modprobe.d/blacklist.conf
黑名单文件。复制下面的代码块并将其粘贴到终端中。[ec2-user ~]$
cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF -
编辑
/etc/default/grub
文件并添加以下行:GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
-
重新生成 Grub 配置。
[ec2-user ~]$
sudo grub2-mkconfig -o /boot/grub2/grub.cfg
-
-
使用以下命令下载 Gaming 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:
[ec2-user ~]$
aws s3 ls --recursive s3://nvidia-gaming/linux/ -
从下载的
.zip
归档中提取 Gaming 驱动程序安装实用程序。[ec2-user ~]$
unzip *Gaming-Linux-Guest-Drivers.zip -d nvidia-drivers -
使用以下命令添加权限以运行驱动程序安装实用程序:
[ec2-user ~]$
chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run -
使用以下命令运行安装程序:
[ec2-user ~]$
sudo nvidia-drivers/NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。
-
使用以下命令创建所需的配置文件。
[ec2-user ~]$
cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF -
使用以下命令下载并重命名认证文件。
-
对于 460.39 及更高版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2024_02_22.cert" -
对于 440.68 到 445.48 版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert" -
对于早期版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
-
-
如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。如果您不需要此功能,请勿完成此步骤。
在实例上安装 NVIDIA Gaming 驱动程序
-
连接到 Linux 实例。安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install -y gcc make -
更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为您当前运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo yum install -y unzip kernel-devel-$(uname -r) -
使用以下命令下载 Gaming 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:
[ec2-user ~]$
aws s3 ls --recursive s3://nvidia-gaming/linux/ -
从下载的
.zip
归档中提取 Gaming 驱动程序安装实用程序。[ec2-user ~]$
unzip *Gaming-Linux-Guest-Drivers.zip -d nvidia-drivers -
使用以下命令添加权限以运行驱动程序安装实用程序:
[ec2-user ~]$
chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run -
使用以下命令运行安装程序:
[ec2-user ~]$
sudo nvidia-drivers/NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。
-
使用以下命令创建所需的配置文件。
[ec2-user ~]$
cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF -
使用以下命令下载并重命名认证文件。
-
对于 460.39 及更高版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2024_02_22.cert" -
对于 440.68 到 445.48 版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert" -
对于早期版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
-
-
如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。
在实例上安装 NVIDIA Gaming 驱动程序
-
连接到 Linux 实例。安装 gcc 和 make(如果尚未安装)。
[ec2-user ~]$
sudo yum install -y gcc make -
更新软件包缓存并获取实例软件包更新。
[ec2-user ~]$
sudo yum update -y -
重启实例以加载最新内核版本。
[ec2-user ~]$
sudo reboot -
重启之后重新连接到实例。
-
为您当前运行的内核版本安装内核标头软件包。
[ec2-user ~]$
sudo dnf install -y unzip elfutils-libelf-devel libglvnd-devel kernel-devel-$(uname -r) -
使用以下命令下载 Gaming 驱动程序安装实用程序:
[ec2-user ~]$
aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:
[ec2-user ~]$
aws s3 ls --recursive s3://nvidia-gaming/linux/ -
从下载的
.zip
归档中提取 Gaming 驱动程序安装实用程序。[ec2-user ~]$
unzip *Gaming-Linux-Guest-Drivers.zip -d nvidia-drivers -
使用以下命令添加权限以运行驱动程序安装实用程序:
[ec2-user ~]$
chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run -
使用以下命令运行安装程序:
[ec2-user ~]$
sudo nvidia-drivers/NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。
-
使用以下命令创建所需的配置文件。
[ec2-user ~]$
cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF -
使用以下命令下载并重命名认证文件。
-
对于 460.39 及更高版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2024_02_22.cert" -
对于 440.68 到 445.48 版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert" -
对于早期版本:
[ec2-user ~]$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
-
-
如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 [ec2-user ~]$
sudo touch /etc/modprobe.d/nvidia.conf[ec2-user ~]$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
[ec2-user ~]$
sudo reboot -
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。
在实例上安装 NVIDIA Gaming 驱动程序
-
连接到 Linux 实例。安装 gcc 和 make(如果尚未安装)。
$
sudo apt-get install -y gcc make build-essential -
更新软件包缓存并获取实例软件包更新。
$
sudo apt-get update -y -
升级
linux-aws
程序包以接收最新版本。$
sudo apt-get upgrade -y linux-aws -
重启实例以加载最新内核版本。
$
sudo reboot -
重启之后重新连接到实例。
-
为您当前运行的内核版本安装内核标头软件包。
$
sudo apt install -y unzip dkms linux-headers-$(uname -r) -
禁用 NVIDIA 显卡的
nouveau
开源驱动程序。-
将
nouveau
添加到/etc/modprobe.d/blacklist.conf
黑名单文件。复制下面的代码块并将其粘贴到终端中。$
cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF -
编辑
/etc/default/grub
文件并添加以下行:GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
-
重新生成 Grub 配置。
$
sudo update-grub
-
-
使用以下命令下载 Gaming 驱动程序安装实用程序:
$
aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ .此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:
$
aws s3 ls --recursive s3://nvidia-gaming/linux/ -
从下载的
.zip
归档中提取 Gaming 驱动程序安装实用程序。$
unzip *Gaming-Linux-Guest-Drivers.zip -d nvidia-drivers -
使用以下命令添加权限以运行驱动程序安装实用程序:
$
chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run -
使用以下命令运行安装程序:
$
sudo nvidia-drivers/NVIDIA-Linux-x86_64*.run系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。
-
使用以下命令创建所需的配置文件。
$
cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF -
使用以下命令下载并重命名认证文件。
-
对于 460.39 及更高版本:
$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2024_02_22.cert" -
对于 440.68 到 445.48 版本:
$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert" -
对于早期版本:
$
sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
-
-
如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档
。 $
sudo touch /etc/modprobe.d/nvidia.conf$
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf -
重启实例。
$
sudo reboot -
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。如果您不需要此功能,请勿完成此步骤。
在实例上安装 NVIDIA 游戏驱动程序之前,除了所有游戏驱动程序提及的注意事项之外,您还必须确保满足以下先决条件。
-
如果您使用自定义 Windows AMI 启动 Windows 实例,则 AMI 必须是使用 Windows Sysprep 创建的标准化映像,以确保游戏驱动程序正常运行。有关更多信息,请参阅 使用 Windows Sysprep 创建 Amazon EC2 AMI。
-
在 Windows 实例上配置 AWS Tools for Windows PowerShell 的默认凭证。有关更多信息,请参阅 AWS Tools for Windows PowerShell 用户指南中的 AWS Tools for PowerShell 入门
在 Windows 实例上安装 NVIDIA Gaming 驱动程序
-
连接到您的 Windows 实例并打开 PowerShell 窗口。
-
使用以下 PowerShell 命令下载并安装 Gaming 驱动程序。
$Bucket = "nvidia-gaming" $KeyPrefix = "windows/latest" $LocalPath = "$home\Desktop\NVIDIA" $Objects = Get-S3Object -BucketName $Bucket -KeyPrefix $KeyPrefix -Region us-east-1 foreach ($Object in $Objects) { $LocalFileName = $Object.Key if ($LocalFileName -ne '' -and $Object.Size -ne 0) { $LocalFilePath = Join-Path $LocalPath $LocalFileName Copy-S3Object -BucketName $Bucket -Key $Object.Key -LocalFile $LocalFilePath -Region us-east-1 } }
此 S3 存储桶中存储了多个版本的 NVIDIA GRID 驱动程序。如果将
$KeyPrefix
变量的值从“windows/latest”更改为“windows”,则可以下载桶中的所有可用版本。 -
导航到桌面,双击安装文件以启动它 (选择与您的实例操作系统版本对应的驱动程序版本)。按照说明安装驱动程序并根据需要重启实例。要验证 GPU 是否正常工作,请检查设备管理器。
-
使用以下方法之一注册驱动程序。
-
在 PowerShell 中运行以下命令。这将下载认证文件,重命名文件
GridSwCert.txt
,然后将该文件移至系统驱动器上的 Public Documents(公共文档)文件夹。通常,该文件夹的路径为C:\Users\Public\Documents
。-
对于 460.39 及更高版本:
Invoke-WebRequest -Uri "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertWindows_2024_02_22.cert" -OutFile "$Env:PUBLIC\Documents\GridSwCert.txt"
-
对于 445.87 版本:
Invoke-WebRequest -Uri "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Windows_2020_04.cert" -OutFile "$Env:PUBLIC\Documents\GridSwCert.txt"
-
对于早期版本:
Invoke-WebRequest -Uri "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Windows_2019_09.cert" -OutFile "$Env:PUBLIC\Documents\GridSwCert.txt"
如果您在下载文件时收到错误,并且正在使用 Windows Server 2016 或更早的版本,则可能需要为 PowerShell 终端启用 TLS 1.2。可以使用以下命令为当前 PowerShell 会话启用 TLS 1.2,然后重试:
[Net.ServicePointManager]::SecurityProtocol = [Net.SecurityProtocolType]::Tls12
-
-
重新启动您的实例。
-
在实例上找到
nvidia-smi.exe
文件。Get-ChildItem -Path C:\ -Recurse -Filter "nvidia-smi.exe"
请使用以下命令验证 NVIDIA Gaming 许可证。将
path
替换为上一个命令输出中的文件夹名称。C:\Windows\System32\DriverStore\FileRepository\
path
\nvidia-smi.exe -q该输出值应该类似于以下内容。
vGPU Software Licensed Product Product Name : NVIDIA Cloud Gaming License Status : Licensed (Expiry: N/A)
-
(可选)请设置高性能显示协议 Amazon DCV,从而有助于利用单个高达 4K 分辨率的显示器的优势。如果您不需要此功能,请勿完成此步骤。
安装 CUDA 的附加版本
在您的实例上安装 NVIDIA 图形驱动程序后,您可以安装与图形驱动程序捆绑的版本以外的 CUDA 版本。以下过程演示如何在实例上配置多个版本的 CUDA。
按照以下步骤操作,在 Linux 上安装 CUDA 工具包:
-
连接到 Linux 实例。
-
打开 NVIDIA 网站
,然后选择所需的 CUDA 版本。 -
为您的实例上的操作系统选择架构、分发版和版本。对于安装程序类型,选择运行文件(本地)。
-
按照说明下载安装脚本。
-
将运行权限添加到您使用以下命令下载的安装脚本。
[ec2-user ~]$
chmod +xdownloaded_installer_file
-
按如下方式运行安装脚本以安装 CUDA 工具包并将 CUDA 版本号添加到工具包路径中。
[ec2-user ~]$
sudo shdownloaded_installer_file
--silent --override --toolkit --samples --toolkitpath=/usr/local/cuda-version
--samplespath=/usr/local/cuda --no-opengl-libs -
(可选)按如下方式设置默认 CUDA 版本。
[ec2-user ~]$
sudo ln -s /usr/local/cuda-version
/usr/local/cuda
按照以下步骤操作,在 Windows 上安装 CUDA 工具包:
安装 CUDA 工具包
-
连接到您的 Windows 实例。
-
打开 NVIDIA 网站
,然后选择所需的 CUDA 版本。 -
对于安装程序类型,选择 exe(本地),然后选择下载。
-
使用浏览器运行下载的安装文件。按照说明安装 CUDA 工具包。您可能需要重新启动实例。