Windows 加速计算实例 - Amazon Elastic Compute Cloud

Windows 加速计算实例

如果您需要高处理能力,您可以从使用加速计算实例中获益,这些实例可让您访问基于硬件的计算加速器,如图形处理单元 (GPU) 。加速计算实例能在计算密集型工作负载上提供更高的并行度,以实现更高的吞吐量。

基于 GPU 的实例能让您访问具有数千个计算内核的 NVIDIA GPU。可以通过基于 GPU 的加速计算实例来利用 CUDA 或开放计算语言 (OpenCL) 并行计算框架,从而为科学、工程和渲染应用程序加速。还可以将这些实例用于图形应用程序,包括游戏流式处理、3-D 应用流式处理和其他图形工作负载。

如果您的应用程序需要少量额外的图形加速,但更适合具有不同计算、内存或存储规格的实例类型,请改为使用 Elastic Graphics 加速器。有关更多信息,请参阅Amazon Elastic Graphics

您可以将加速计算实例放入集群置放群组中。集群置放群组可在单个可用区内实现实例间的低延迟和高带宽连接。有关更多信息,请参阅置放群组

有关 Linux 加速计算实例的信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例) 中的 Linux 加速计算实例

加速计算实例系列

加速计算实例系列使用硬件加速器或协处理器来执行一些功能,如浮点数计算、图形处理或数据模式匹配,比在 CPU 上运行的软件更有效。以下加速计算实例系列可供您在Amazon EC2中启动。

P3 实例

P3 实例使用 NVIDIA Tesla V100 GPU,可用于使用 CUDA 或 OpenCL 编程模型或通过机器学习框架进行的通用 GPU 计算。P3 实例提供了高带宽网络、强大的半精度\单精度\双精度浮点功能以及每 GPU 最高 32 GiB 内存,非常适合用于深度学习、计算流体动力学、计算金融、地震分析、分子建模、基因组学、渲染和其他服务器端 GPU 计算工作负载。Tesla V100 GPU 不支持图形模式。有关更多信息,请参阅 Amazon EC2 P3 实例

P3 实例支持 NVIDIA NVLink 对等传输。

要查看有关系统的拓扑信息,请运行以下命令:

nvidia-smi topo -m

有关更多信息,请参阅 NVIDIA NVLink

P2 实例

P2 实例使用 NVIDIA Tesla GPU K80 和适用于使用 CUDA 和 OpenCL 编程模型的通用 GPU 计算设计。P2 实例提供了高带宽网络、强大的单双精度浮点功能以及每个 GPU 12 GiB 的内存,非常适合深度学习、图形数据库、高性能数据库、计算流体动力学、计算金融、地震分析、分子建模、基因组学、渲染和其他服务器端 GPU 计算工作负载。

P2 实例支持 NVIDIA GPUDirect 对等传输。

要查看有关系统的拓扑信息,请运行以下命令:

nvidia-smi topo -m

有关更多信息,请参阅 NVIDIA GPUDirect

G4 实例

G4 实例使用 NVIDIA Tesla GPU,并为使用 CUDA 或机器学习框架的通用 GPU 计算以及使用 DirectX 或 OpenGL 的图形应用程序提供经济高效的高性能平台。G4 实例提供高带宽网络、强大的半精度和单精度浮点功能以及 INT8 和 INT4 精度。每个 GPU 具有 16 GiB GDDR6 内存,从而使 G4 实例非常适合机器学习推理、视频转码以及图形应用程序,例如,远程图形工作站和云中的游戏流。

G4 实例支持 NVIDIA GRID 虚拟工作站。有关更多信息,请参阅 NVIDIA Marketplace 产品

G3 实例

G3 实例使用 NVIDIA Tesla M60 GPU,为使用 DirectX 或 OpenGL 的图形应用程序提供经济高效的高性能平台。G3 实例还提供 NVIDIA GRID 虚拟工作站功能 (如 4 个分辨率高达 4096x2160 的监视器) 以及 NVIDIA GRID 虚拟应用程序。G3 实例非常适合一些应用程序,例如,3D 可视化、图形密集型远程工作站、3D 渲染、视频编码、虚拟现实以及其他需要大量并行处理能力的服务器端图形工作负载。

G3 实例支持 NVIDIA GRID 虚拟工作站和 NVIDIA GRID 虚拟应用程序。要激活任一功能,请参阅激活 NVIDIA GRID 虚拟应用程序

G2 实例

G2 实例使用 NVIDIA GRID K520 GPU,并为使用 DirectX 或 OpenGL 的图形应用程序提供经济高效的高性能平台。NVIDIA GRID GPU 还支持 NVIDIA 的快速捕获和编码 API 操作。示例应用程序包括视频创建服务、3D 可视化、流图形密集型应用程序,以及其他服务器端图形工作负载。

硬件规格

以下是加速计算实例的硬件规格摘要。

实例类型 默认 vCPU 内存 (GiB) 加速器
p2.xlarge 4 61 1
p2.8xlarge 32 488 8
p2.16xlarge 64 732 16
p3.2xlarge 8 61 1
p3.8xlarge 32 244 4
p3.16xlarge 64 488 8
p3dn.24xlarge 96 768 8
g2.2xlarge 8 15 1
g2.8xlarge 32 60 4
g3s.xlarge 4 30.5 1
g3.4xlarge 16 122 1
g3.8xlarge 32 244 2
g3.16xlarge 64 488 4
g4dn.xlarge 4 16 1
g4dn.2xlarge 8 32 1
g4dn.4xlarge 16 64 1
g4dn.8xlarge 32 128 1
g4dn.12xlarge 48 192 4
g4dn.16xlarge 64 256 1
g4dn.metal 96 384 8
f1.2xlarge 8 122 1
f1.4xlarge 16 244 2
f1.16xlarge 64 976 8

有关每种 Amazon EC2 实例类型的硬件规格的更多信息,请参阅 Amazon EC2 实例类型

有关指定 CPU 选项的更多信息,请参阅优化 CPU 选项

实例性能

通过 EBS 优化的实例,您可以消除 Amazon EBS I/O 与 实例的其他网络流量之间的争用,从而使 EBS 卷持续获得高性能。有些加速计算实例在默认情况下会进行 EBS 优化,这不会产生额外的费用。有关更多信息,请参阅Amazon EBS 优化的实例

网络性能

您可以为受支持的实例类型启用增强联网,以提供更低的延迟、更低的网络抖动和更高的每秒数据包数 (PPS) 性能。大多数应用程序并非始终需要较高的网络性能,但较高的带宽有助于其发送或接收数据。有关更多信息,请参阅 Windows 上的增强联网

以下是支持增强联网的加速计算实例的网络性能摘要。

实例类型 网络性能 增强联网
f1.2xlarge | f1.4xlarge | g3.4xlarge | p3.2xlarge 最高 10 Gbps † ENA
g3s.xlarge | g3.8xlarge | p2.8xlarge | p3.8xlarge 10Gbps ENA
g4dn.xlarge | g4dn.2xlarge | g4dn.4xlarge 最高 25 Gbps † ENA
f1.16xlarge | g3.16xlarge | p2.16xlarge | p3.16xlarge 25 Gbps ENA
g4dn.8xlarge | g4dn.12xlarge | g4dn.16xlarge 50 Gbps ENA
g4dn.metal | p3dn.24xlarge 100 Gbps ENA

† 这些实例使用一种网络 I/O 积分机制,根据平均带宽使用率为不同实例分配网络带宽。实例在带宽低于其基准带宽时会积累积分,并能够在执行网络数据传输时使用这些积分。有关更多信息,请打开一个支持案例,询问您感兴趣的特定实例类型的基准带宽。

实例功能

加速计算实例的特性汇总如下。

仅限于 EBS NVMe EBS 实例存储 置放群组

G2

SSD

G3

G4

NVMe *

P2

P3

p3dn.24xlarge:不支持

所有其他大小:是

p3dn.24xlarge:是

所有其他大小:否

p3dn.24xlarge:NVMe*

F1

NVMe *

* 根设备卷必须是 Amazon EBS 卷。

有关更多信息,请参阅下列内容:

发行说明

  • 您必须使用 HVM AMI 启动实例。

  • 基于 Nitro 系统构建的实例具有以下要求:

    当前 AWS Windows AMI 满足这些要求。

  • 除非安装了 NVIDIA 驱动程序,否则基于 GPU 的实例无法访问 GPU。有关更多信息,请参阅 在 Windows 实例上安装 NVIDIA 驱动程序

  • 启动裸机实例会启动基础服务器,包含验证所有硬件和固件组件。这意味着从实例进入运行状态直至在网络上可用需要超过 20 分钟的时间。

  • 对裸机实例附加或分离 EBS 卷或辅助网络接口需要 PCIe 本机 hotplug 支持。

  • 裸机实例使用基于 PCI 的串行设备而不是基于 I/O 端口的串行设备。上游 Linux 内核和最新 Amazon Linux AMI 支持此设备。裸机实例还提供一个 ACPI SPCR 表,使系统能够自动使用基于 PCI 的串行设备。最新 Windows AMI 自动使用基于 PCI 的串行设备。

  • 每个区域仅限 100 个 AFI。

  • 在一个区域中可以启动的实例总数存在限制,某些实例类型还存在其他限制。有关更多信息,请参阅 Amazon EC2 常见问题中的我可以在 Amazon EC2 中运行多少个实例?

  • 如果您使用在单 GPU 实例上创建的 Windows AMI 启动多 GPU 实例,则 Windows 不会为所有 GPU 自动安装 NVIDIA 驱动程序。您必须授权新 GPU 硬件的驱动程序安装。通过打开其他设备类别(非活动 GPU 不会出现在显示适配器下),您可以在“设备管理器”中手动更正此设置。对于每个非活动 GPU,请打开上下文 (右键单击) 菜单,选择更新驱动程序软件,然后选择默认自动更新选项。

  • 在使用 Microsoft 远程桌面协议 (RDP) 时,使用 WDDM 驱动程序模型的 GPU 会替换为非加速的远程桌面显示驱动程序。我们建议您使用不同的远程访问工具来访问您的 GPU,例如 Teradici Cloud Access SoftwareNICE Desktop Cloud Visualization (DCV) 或 VNC。还可以使用 AWS Marketplace 中的 GPU AMI 之一,因为它们提供支持 3D 加速的远程访问工具。