Performance - AWS Storage Gateway

Amazon S3 文件网关文档已移至什么是 Amazon S3 文件网关?

Amazon FSx 文件网关文档已移至什么是 Amazon FSx 文件网关?

磁带网关文档已移至什么是磁带网关?

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Performance

本节介绍了 Storage Gateway 性能。

优化网关性能

为了使您的网关发挥最佳性能,Storage Gateway 建议您的网关主机服务器采用以下网关配置:

  • 至少 24 个专用的物理 CPU 核心

  • 对于卷网关,您的硬件应使用以下数量的 RAM:

    • 对于缓存大小不超过 16 TiB 的网关,至少预留 16 GiB 的 RAM

    • 对于缓存大小为 16 TiB 至 32 TiB 的网关,至少预留 32 GiB 的 RAM

    • 对于缓存大小为 32 TiB 至 64 TiB 的网关,至少预留 48 GiB 的 RAM

  • 磁盘 1,用作网关缓存,如下所示:

    • 使用 NVMe 控制器的 SSD。

  • 磁盘 2,用作网关上传缓冲区,如下所示:

    • 使用 NVMe 控制器的 SSD。

  • 磁盘 3,用作网关上传缓冲区,如下所示:

    • 使用 NVMe 控制器的 SSD。

  • 在虚拟机网络 1 上配置网络适配器 1:

    • 使用 VM 网络 1 并添加 VMXnet3 (10 Gbps) 以用于提取。

  • 在虚拟机网络 2 上配置网络适配器 2:

    • 使用 VM 网络 2 并添加 VMXnet3 (10 Gbps) 以用于连接到 AWS。

在网关中添加资源

以下瓶颈可能会使的性能降至理论最大持续吞吐量(通往 AWS 云的带宽)以下:

  • CPU 核心数

  • 缓存/上传缓冲区磁盘吞吐量

  • RAM 总量

  • 网络带宽至 AWS

  • 从启动程序到网关的网络带宽

本节介绍为优化网关性能而可以采取的步骤。向网关或应用程序服务器添加资源是这些指导的基础。

您可以使用以下一种或多种方法在网关中添加资源以优化网关性能。

使用更高性能的磁盘

缓存和上传缓冲区磁盘吞吐量会限制网关的上传和下载性能。如果您的网关表现出的性能明显低于预期,请考虑通过以下方式提高缓存和上传缓冲区磁盘吞吐量:

  • 使用条带化 RAID(例如 RAID 10)来提高磁盘吞吐量,最好使用硬件 RAID 控制器。

    注意

    RAID(独立磁盘冗余阵列)或专门的磁盘条带化 RAID 配置(如 RAID 10)是将数据主体划分为块并将数据块分布到多个存储设备的过程。您使用的 RAID 级别会影响您可以达到的确切速度和容错能力。通过将 IO 工作负载划分到多个磁盘上,RAID 设备的总体吞吐量远高于任何单个成员磁盘的吞吐量。

  • 使用直接连接的高性能磁盘

    要优化网关性能,您可以添加高性能磁盘,如固态硬盘 (SSD) 和 NVMe 控制器。您还可以直接从存储区域网络 (SAN) 而不是 Microsoft Hyper-V NTFS 将虚拟磁盘连接到 VM。更高的磁盘性能通常可带来更大的吞吐量和更多的每秒输入/输出操作 (IOPS) 次数。

    要衡量吞吐量,请将ReadBytesWriteBytes指标与 Samples Amazon CloudWatch 统计数据结合使用。例如,5 分钟的采样周期内的 Samples 指标的 ReadBytes 统计数据除以 300 秒可以得出 IOPS。一般来说,查看网关的这些指标时,应注意低吞吐量和低 IOPS 趋势,以便显示与磁盘相关的瓶颈。。

    注意

    CloudWatch 并非所有网关都提供指标。有关网关指标的信息,请参阅监控 Storage Gateway

添加更多上传缓冲区磁盘

要实现更高的写入吞吐量,请添加至少两个上传缓冲区磁盘。当数据写入网关时,系统会将其写入并本地存储在上传缓冲区磁盘上。之后,将从待处理和上传到 AWS的磁盘中异步读取存储的本地数据。添加更多上传缓冲区磁盘可以减少对每个磁盘执行的并发 I/O 操作量。这可以增加网关的写入吞吐量。

使用独立物理磁盘支持网关虚拟磁盘

在预配置网关磁盘时,我们强烈建议您不要为使用相同底层物理存储磁盘的上传缓冲区和缓存存储预配置本地磁盘。例如,对于 VMware ESXi,底层物理存储资源表示为数据存储。部署网关 VM 时,您可选择用来存储 VM 文件的数据存储。在预置虚拟磁盘时(例如,作为上传缓冲区),您可以将虚拟磁盘存储在与 VM 相同的数据存储中,也可以将其存储在不同的数据存储中。

如果您有多个数据存储,则强烈建议为要创建的每个类型的本地存储选择一个数据存储。仅由一个底层物理磁盘支持的数据存储可能会导致性能下降。例如,在使用此类磁盘同时支持网关设置中的缓存存储和上传缓冲区时。同样,采用性能不太高的 RAID 配置(如 RAID 1 或 RAID 6)的数据存储可能会导致性能下降。

添加 CPU 资源到您的网关主机

网关主机服务器的最低要求是四个虚拟服务器。要优化网关性能,请确认分配给网关 VM 的每个虚拟处理器均采用一个专用的 CPU 内核。此外,还要确认您没有超额预订主机服务器的 CPU。

在将额外的 CPU 添加到网关主机服务器时,将会增加网关的处理能力。通过执行该操作,您的网关可以并行处理将应用程序中的数据存储到本地存储以及将该数据上传到 Amazon S3 的过程。更多 CPU 还可帮助确保在主机与其他 VM 共享时您的网关获得足够的 CPU 资源。提供足够的 CPU 资源通常能取得增加吞吐量的效果。

增加网关和 AWS 云之间的带宽

增加进出带宽 AWS 将提高进入网关和输出到 AWS 云端的最大数据速率。如果网速是网关配置中的限制因素,而不是磁盘速度慢或网关启动程序连接带宽不足等其他因素,那么这样可以提高网关性能。

注意

由于还存在此处列出的其他限制因素(例如缓存/上传缓冲区磁盘吞吐量、CPU 内核数、RAM 总量或启动程序和网关之间的带宽),您观察到的网关性能很可能会低于您的网络带宽。此外,网关的正常运行涉及为保护数据而执行的许多操作,这可能会导致观察到的性能低于您的网络带宽。

更改卷配置

对于卷网关,如果您发现向网关添加更多的存储卷会降低到网关的吞吐量,则应考虑将卷添加到单独的网关。具体而言,如果卷用于高吞吐量应用程序,则应考虑为高吞吐量应用程序另行创建网关。但一般而言,您不应该将一个网关用于所有的高吞吐量应用程序,另一个网关用于所有的低吞吐量应用程序。要测量卷吞吐量,请使用 ReadBytesWriteBytes 指标。

有关这些指标的更多信息,请参阅 衡量您的应用程序和网关间的性能。

优化 iSCSI 设置

您可以优化 iSCSI 启动程序上的 iSCSI 设置,以实现更高的 I/O 性能。我们建议为 MaxReceiveDataSegmentLengthFirstBurstLength 选择 256 KiB,为 MaxBurstLength 选择 1 MiB。有关配置 iSCSI 设置的更多信息,请参阅自定义 iSCSI 设置

注意

这些建议的设置有助于实现更出色的整体性能。但是,优化性能所需的具体 iSCSI 设置因您使用的备份软件而异。有关详细信息,请参阅备份软件文档。

向应用程序环境添加资源

提高应用程序服务器和网关之间的带宽

iSCSI 启动程序和网关之间的连接可能会限制您的上传和下载性能。如果您的网关的性能明显低于预期,并且您已经提高了 CPU 核心数量和磁盘吞吐量,请考虑:

  • 升级网络电缆,使启动程序和网关之间具有更高的带宽。

要优化网关性能,请确保应用程序和网关之间的网络带宽可满足您的应用程序需求。您可以使用网关的 ReadBytesWriteBytes 指标来测量总数据吞吐量。

对于您的应用程序,请将测得的吞吐量与所需的吞吐量进行比较。如果测得吞吐量小于预期吞吐量,那么如果网络是瓶颈,提高应用程序和网关间的带宽可改善性能。同样地,您可以增加 VM 和本地磁盘之间的带宽 (如果它们不是直接连接的)。

向应用程序环境添加 CPU 资源

如果您的应用程序可以使用额外的 CPU 资源,则添加更多 CPU 可以帮助您的应用程序扩展其 I/O 负载。

将 VMware vSphere High Availability 与 Storage Gateway 结合使用

Storage Gateway 通过一组与 VMware vSphere High Availability (VMware HA) 集成的应用程序级运行状况检查,在 VMware 上提供高可用性。此方法有助于保护存储工作负载免受硬件、管理程序或网络故障的影响。它还有助于防止软件错误,例如连接超时和文件共享或卷不可用。

vSphere HA 的工作原理是将虚拟机及其所在的主机集中到集群中以实现冗余。集群中的主机将受到监控,如果出现故障,故障主机上的虚拟机将在备用主机上重新启动。通常,恢复速度很快,不会丢失数据。有关 vSphere HA 的更多信息,请参阅 VMware 文档中的 vSphere HA 的工作原理

注意

重新启动出现故障的虚拟机并在新主机上重新建立 iSCSI 连接所需的时间取决于许多因素,例如主机操作系统和资源负载、磁盘速度、网络连接以及 SAN/存储基础架构。

要将 VMware HA 与 Storage Gateway 结合使用,请执行下面列出的步骤。

配置您的 vSphere VMware HA 集群

如果您尚未创建 VMware 集群,请先创建一个。有关如何创建 VMware 集群的信息,请参阅 VMware 文档中的创建 vSphere HA 集群

接下来,配置要与 Storage Gateway 结合使用的 VMware 集群。

配置 VMware 集群
  1. 在 VMware vSphere 的 Edit Cluster Settings (编辑集群设置) 页面上,确保为 VM 和应用程序监控配置 VM 监控。为此,请设置下面列出的选项:

    • Host Failure Response (主机故障响应)Restart VMs (重新启动 VM)

    • Response for Host Isolation (主机隔离的响应)Shut down and restart VMs (关闭并重新启动 VM)

    • Datastore with PDL (具有 PDL 的数据存储)Disabled (已禁用)

    • Datastore with APD (具有 APD 的数据存储)Disabled (已禁用)

    • VM Monitoring (VM 监控)VM and Application Monitoring (VM 和应用程序监控)

    有关示例,请参阅下面的屏幕截图。

    配置了 VM 和应用程序监控选项的 VMware vSphere 编辑集群设置屏幕。
  2. 通过调整以下值来微调集群的敏感度:

    • 故障间隔 - 在此间隔之后,如果未收到 VM 检测信号,则将重新启动 VM。

    • 最短正常运行时间 - 在 VM 开始监控 VM 工具的检测信号之后,集群等待的时间。

    • 每个 VM 的最大重置次数 - 集群在最大重置时段内重启 VM 的最大次数。

    • 最大重置次数的时段 - 计算每个 VM 的最大重置次数的时段。

    如果您不确定要设置的值,请使用以下示例设置:

    • Failure interval (故障间隔)30

    • Minimum uptime (最短正常运行时间)120

    • Maximum per-VM resets (每个 VM 的最大重置次数)3

    • Maximum resets time window (最长重置时段)1 小时

如果您在集群上运行了其他 VM,则可能需要专门为您的 VM 设置这些值。在从 .ova 部署 VM 之前,无法执行此操作。有关设置这些值的更多信息,请参阅 (可选)为集群上的其他 VM 添加覆盖选项

从 Storage Gateway 控制台下载 .ova 映像

下载适用于您的网关的 .ova 映像
  • 在 Storage Gateway 控制台的设置网关页面上,选择您的网关类型和主机平台,然后使用控制台中提供的链接来下载 .ova,如设置卷网关中所述。

部署网关

在已配置的集群中,将 .ova 映像部署到集群的主机之一。

部署网关 .ova 映像
  1. 将 .ova 映像部署到集群中的主机之一。

  2. 确保为根磁盘和缓存选择的数据存储对集群中的所有主机可用。在 VMware 或本地环境中部署 Storage Gateway .ova 文件时,这些磁盘描述为半虚拟化 SCSI 磁盘。半虚拟化 是一种模式,在此模式下,网关 VM 使用主机操作系统来让控制台标识您添加到 VM 的虚拟磁盘。

    如需将 VM 配置为使用半虚拟化的控制器

    1. 在 VMware vSphere 客户端中,打开网关 VM 的上下文 (右键单击) 菜单,然后选择 Edit Settings

    2. Virtual Machine Properties 对话框中,选择 Hardware 选项卡,再选择 SCSI controller 0,然后选择 Change Type

    3. Change SCSI Controller Type 对话框中,选择 VMware Paravirtual SCSI 控制器类型,然后选择 OK

(可选)为集群上的其他 VM 添加覆盖选项

如果您在集群上运行了其他 VM,则可能需要专门为每个 VM 设置集群值。

为集群上的其他 VM 添加覆盖选项
  1. 在 VMware vSphere 中的 Summary (摘要) 页面上,选择您的集群以打开集群页面,然后选择 Configure (配置)

  2. 选择 Configuration (配置) 选项卡,然后选择 VM Overrides (VM 覆盖)

  3. 添加新的 VM 覆盖选项来更改每个值。

    有关覆盖选项,请参阅下面的屏幕截图。

    配置了覆盖选项的 VMware vSphere 添加虚拟机覆盖集群屏幕。

激活网关

在部署适用于网关的 .ova 后,激活网关。有关每个网关类型的不同之处的说明。

激活网关

测试您的 VMware High Availability 配置

激活网关后,请测试您的配置。

测试 VMware HA 配置
  1. 打开 Storage Gateway 控制台,网址为 https://console.aws.amazon.com/storagegateway/home

  2. 在导航窗格上,选择 Gateways (网关),然后选择要针对 VMware HA 测试的网关。

  3. 对于 Actions (操作),请选择 Verify VMware HA (验证 VMware HA)

  4. 在显示的 Verify VMware High Availability Configuration (验证 VMware High Availability 配置) 框中,选择 OK (确定)

    注意

    测试 VMware HA 配置将重新启动网关 VM 并中断与网关的连接。该测试可能需要几分钟才能完成。

    如果测试成功,则控制台中网关的详细信息选项卡中将显示 Verified (已验证) 状态。

  5. 请选择 Exit(退出)。

您可以在 Amazon CloudWatch 日志组中找到有关 VMware HA 事件的信息。有关更多信息,请参阅获取卷网关运行状况日志