使用 Amazon 进行监控 CloudWatch - FSx适用于 Windows 文件服务器的亚马逊

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon 进行监控 CloudWatch

Amazon CloudWatch 收集来自您FSx的 Windows 文件服务器文件系统的原始数据,并将其处理为可读的、近乎实时的指标。这些统计数据会保留 15 个月,使您可以访问历史信息,从而深入了解您的工作流程或文件系统的运行情况。

FSx适用于 Windows 文件服务器在以下域中发布 CloudWatch 指标:

  • 网络 I/O 指标衡量访问文件系统的客户端和文件服务器之间的活动。

  • 文件服务器指标衡量网络吞吐量利用率、文件服务器CPU和内存以及文件服务器磁盘吞吐量和IOPS利用率。

  • 磁盘 I/O 指标衡量文件服务器和存储卷之间的活动。

  • 存储量指标衡量存储卷的HDD磁盘吞吐量IOPS利用率和SSD存储卷的利用率。

  • 存储容量指标衡量存储使用量,包括重复数据删除带来的存储节省。

下图说明了 Window FSx s 文件服务器文件系统、其组件和度量域。

FSx适用于 Windows 文件服务器的报告指标用于监控网络 I/O、文件服务器性能和存储卷性能。 CloudWatch

默认情况下,Amazon for Windows 文件服务器以 1 分钟FSx为周期发送指标数据,但以下例外情况每隔 5 分钟发送一次: CloudWatch

  • FileServerDiskThroughputBalance

  • FileServerDiskIopsBalance

有关的更多信息 CloudWatch,请参阅 Amazon 是什么 CloudWatch? 在《亚马逊 CloudWatch 用户指南》中。

对于单可用区文件系统,在文件系统维护或基础设施组件更换期间,可能不会发布指标;对于多可用区文件系统,在主文件服务器和辅助文件服务器之间进行失效转移和失效自动恢复期间,可能不会发布指标。

有些 Amazon FSx CloudWatch 指标报告为原始字节。字节数不会舍入到十进制或二进制单位倍数。

CloudWatch 指标和维度

FSx适用于 Windows File Server 的所有文件系统将以下指标发布到亚马逊AWS/FSx CloudWatch 命名空间中:

  • DataReadBytes

  • DataWriteBytes

  • DataReadOperations

  • DataWriteOperations

  • MetadataOperations

  • FreeStorageCapacity

FSxWindows File Server 针对吞吐量至少为 32 的文件系统,将以下各节中描述的指标发布到 Amazon CloudWatch 的AWS/FSx命名空间中MBps。

网络 I/O 指标

AWS/FSx 命名空间包括以下 网络 I/O 指标。

指标 描述
DataReadBytes

访问文件系统的客户端的读取操作字节数。

单位:字节

有效统计数据:Sum

DataWriteBytes

访问文件系统的客户端的写入操作字节数。

单位:字节

有效统计数据:Sum

DataReadOperations

访问文件系统的客户端的读取操作数。

单位:计数

有效统计数据:Sum

DataWriteOperations

访问文件系统的客户端的写入操作数。

单位:计数

有效统计数据:Sum

MetadataOperations

访问文件系统的客户端的元数据操作数。

单位:计数

有效统计数据:Sum

ClientConnections

客户端与文件服务器之间的活动连接数。

单位:计数

文件服务器指标

AWS/FSx 命名空间包括以下文件服务器指标。

指标 描述
NetworkThroughputUtilization

访问文件系统的客户端的网络吞吐量,表示为预调配限制的百分比。

单位:百分比

CPUUtilization

文件服务器CPU资源的利用率百分比。

单位:百分比

MemoryUtilization

文件服务器内存资源的利用率百分比。

单位:百分比

FileServerDiskThroughputUtilization

文件服务器与其存储卷之间的磁盘吞吐量,表示为由吞吐能力决定的预调配限制的百分比。

单位:百分比

FileServerDiskThroughputBalance

文件服务器与其存储卷之间磁盘吞吐量的可用突增点数百分比。适用于预置吞吐量为 256 MBps 或更小的文件系统。

单位:百分比

FileServerDiskIopsUtilization

文件服务器和存储卷IOPS之间的磁盘,占预配置限制的百分比,由吞吐量决定。

单位:百分比

FileServerDiskIopsBalance

文件服务器与其存储卷IOPS之间可用磁盘突发积分的百分比。适用于预置吞吐量为 256 MBps 或更小的文件系统。

单位:百分比

磁盘 I/O 指标

AWS/FSx 命名空间包括以下磁盘 I/O 指标。

指标 描述
DiskReadBytes

访问存储卷的读取操作字节数。

单位:字节

有效统计数据:Sum

DiskWriteBytes

访问存储卷的写入操作字节数。

单位:字节

有效统计数据:Sum

DiskReadOperations

访问存储卷的文件服务器的读取操作数。

单位:计数

有效统计数据:Sum

DiskWriteOperations

访问存储卷的文件服务器的写入操作数。

单位:计数

有效统计数据:Sum

FSx适用于 Windows 存储量指标

AWS/FSx 命名空间包括以下存储卷指标。

指标 描述
DiskThroughputUtilization

(HDD仅限)您的文件服务器与其存储卷之间的磁盘吞吐量,占预配置限制的百分比,由存储卷决定。

单位:百分比

DiskThroughputBalance

(HDD仅限)用于磁盘吞吐量的可用突发积分和存储卷的磁盘IOPS的可用突发积分的百分比。

单位:百分比

DiskIopsUtilization

(SSD仅限)文件服务器和存储卷IOPS之间的磁盘,占预配置IOPS限制的百分比,由存储卷决定。

单位:百分比

存储容量指标

AWS/FSx 命名空间包括以下存储容量指标。

指标 描述
FreeStorageCapacity

可用存储容量的大小。

单位:字节

有效统计数据:AverageMinimum

StorageCapacityUtilization

已用物理存储容量,表示为总存储容量的百分比。

单位:百分比

DeduplicationSavedStorage

启用了重复数据删除时节省的存储空间量。

单位:字节

Windows 文件服务器指标的FSx命名空间和维度

FSx对于 Windows 文件服务器指标,请使用FSx命名空间并提供单个维度的指标FileSystemId。您可以使用describe-file-systems AWS CLI 命令或命令查找文件系统的 DescribeFileSystemsAPIID。文件系统 ID 的形式为 fs-0123456789abcdef0.

使用文件系统指标

每个 Amazon FSx 文件系统都有两个主要的架构组件:

  • 文件服务器,用于为访问文件系统的客户端提供数据。

  • 存储卷,用于托管文件系统中的数据。

FSx适用于 Windows File Server 的报告指标用于跟踪文件系统的文件服务器和存储卷的性能和资源利用率。 CloudWatch 下图说明了 Amazon FSx 文件系统及其架构组件以及可供监控的性能和资源 CloudWatch 指标。针对一组指标显示的关键属性是文件系统属性,用于确定这些指标的容量。调整该属性会修改该组指标的文件系统性能。

FSx适用于 Windows 文件服务器的报告指标用于监控网络 I/O、文件服务器性能和存储卷性能。 CloudWatch

使用 Amazon FSx 控制台中的 “监控和性能” 面板查看下表中描述的 Windows 文件服务器 CloudWatch 指标。FSx

“监控和性能”面板 如何… 图表 相关指标
Summary

... 确定我的文件系统的总数IOPS?

总计 IOPS

SUM(DataReadOperations+ DataWriteOperations +MetadataOperations) /周期(以秒为单位)

…确定文件系统的总吞吐量?

总吞吐量

SUM(DataReadBytes+DataWriteBytes) /周期(以秒为单位)

…确定文件系统上的可用存储容量大小? 可用存储容量 FreeStorageCapacity
…客户端与文件服务器之间建立的连接数? 客户端连接 ClientConnections
存储 …确定已用物理磁盘空间量(表示为文件系统总存储容量的百分比)? 存储容量利用率 StorageCapacityUtilization
…确定通过重复数据删除节省的物理磁盘空间量? 通过重复数据删除节省的存储容量 DeduplicationSavedStorage
性能 – 文件服务器 …确定访问文件系统的客户端的网络吞吐量(表示为文件系统预调配吞吐量的百分比)? 网络吞吐量利用率 NetworkThroughputUtilization1
…确定文件服务器与其存储卷之间的磁盘吞吐量(表示为由吞吐能力决定的预调配限制的百分比)? 磁盘吞吐量利用率 FileServerDiskThroughputUtilization1
…确定文件服务器与其存储卷之间磁盘吞吐量的可用突增点数百分比? 磁盘吞吐量突增平衡 FileServerDiskThroughputBalance
... 确定文件服务器和存储卷IOPS之间的磁盘量,占预配置限制的百分比由吞吐量容量决定? 磁盘IOPS利用率 FileServerDiskIopsUtilization
... 确定文件服务器和存储卷IOPS之间可用磁盘突发积分的百分比? 磁盘IOPS突发平衡 FileServerDiskIopsBalance
... 确定文件服务器的CPU利用率百分比? CPU利用率 CPUUtilization
…确定文件服务器的内存利用率百分比? 内存利用率 MemoryUtilization
性能 – 存储卷 ... 确定访问存储卷的操作的吞吐量,占由HDD存储容量确定的预配置限制的百分比? 磁盘吞吐量利用率 (HDD) DiskThroughputUtilization
... 确定访问HDD存储卷的操作的可用吞吐量和IOPS突发积分的百分比? 磁盘吞吐量突发平衡 (HDD) DiskThroughputBalance2
... 确定访问存储卷IOPS的操作占预配置限制的百分比,由HDD存储容量决定? 磁盘IOPS利用率 (HDD) SUM(DiskReadOperations+DiskWriteOperations)/Period(以秒为单位)/(12 * 预配置的HDD存储容量,以 TiB 为单位)
... 确定访问存储卷IOPS的操作占预配置限制的百分比,由SSD存储容量决定? 磁盘IOPS利用率 (SSD) DiskIopsUtilization
注意

1 我们建议您将平均吞吐量容量利用率保持在 50% 以下,以确保有足够的备用吞吐量容量来应对工作负载的意外高峰以及任何后台 Windows 存储操作(例如存储同步、重复数据删除或卷影副本)。

2 个HDD存储卷可能会遇到明显的性能差异,具体取决于工作负载。突然出现峰值IOPS或吞吐量会导致磁盘性能下降。有关更多信息,请参阅 HDD爆发性能

性能警告和建议

FSxWindows 版会针对配置为至少 32 的吞吐容量的文件系统提供性能警告MBps。每当其中一个 CloudWatch 指标连续多个数据点接近或超过预先确定的阈值时,Amazon 就会FSx显示一组指标的警告。这些警告会为您提供切实可行的建议,您可以使用这些建议来优化文件系统的性能。

可以在监控和性能控制面板的多个区域内访问警告。所有活动或最近的 Amazon FSx 性能警告以及为文件系统配置的所有处于ALARM状态的 CloudWatch 警报都会显示在 “监控和性能” 面板的 “摘要” 部分中。仪表板中显示指标图表的部分也会显示警告。

您可以为任何 Amazon FSx 指标创建 CloudWatch 警报。有关更多信息,请参阅 创建 CloudWatch 警报

使用性能警告提高文件系统的性能

Amazon FSx 提供切实可行的建议,您可以使用这些建议来优化文件系统的性能。这些建议介绍了如何解决潜在的性能瓶颈。如果您希望继续进行活动,或者该活动对文件系统的性能造成了影响,您可以采取建议的操作。根据触发警告的指标,您可以通过增加文件系统的吞吐能力或存储容量来解决警告,如下表所述。

如果有针对此指标的警告 请执行该操作
网络吞吐量 – 利用率 增加吞吐能力
文件服务器 > 磁盘 IOPS-利用率
文件服务器 > 磁盘吞吐量 – 利用率
文件服务器 > 磁盘 IOPS-突发平衡
文件服务器 > 磁盘吞吐量 – 突增余额
存储容量利用率 增加存储容量
存储卷 > 磁盘吞吐量-利用率 (HDD) 增加存储容量切换到SDD存储类型
存储量 > 磁盘吞吐量-突发平衡 (HDD)
存储卷 > 磁盘 IOPS-利用率 (SSD) 增加 SSD IOPS
注意

某些文件系统事件可能会消耗磁盘 I/O 性能资源,并可能触发性能警告。例如:

  • 存储容量扩展的优化阶段会增加磁盘吞吐量,如 增加存储容量并提升文件系统性能 中所述

  • 对于多可用区文件系统,吞吐能力扩展、硬件更换或可用区中断等事件会导致自动失效转移和失效自动恢复事件。在此期间发生的任何数据更改都需要在主文件服务器和辅助文件服务器之间进行同步,Windows Server 运行的数据同步作业可能会消耗磁盘 I/O 资源。有关更多信息,请参阅 正在管理 Windows 文件服务器文件系统的吞吐容量 FSx

有关文件系统性能的更多信息,请参阅 FSx用于 Windows 文件服务器的性能