监控磁带网关 - AWS Storage Gateway

Amazon S3 文件网关文档已移至什么是 Amazon S3 文件网关?

Amazon FSx 文件网关文档已移至什么是 Amazon FSx 文件网关?

卷网关文档已移至什么是卷网关?

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控磁带网关

本节介绍如何监控您的磁带网关、与磁带网关关联的虚拟磁带、缓存存储和上传缓冲区。您可以使用 AWS Management Console 来查看您的磁带网关的指标。借助指标,您可以跟踪磁带网关的运行状况并设置警报,以便在一个或多个指标超出定义的阈值时通知您。

Storage Gateway 免费提供 CloudWatch 指标。记录为期两周的 Storage Gateway 指标。通过使用这些指标,您可以访问历史信息并更好地了解您的磁带网关和虚拟磁带的性能。有关详细信息 CloudWatch,请参阅 Amazon CloudWatch 用户指南

通过 CloudWatch 日志组获取磁带网关运行状况日志

您可以使用 Amaz CloudWatch on Logs 来获取有关磁带网关和相关资源运行状况的信息。您可以使用日志来监控网关遇到的错误。此外,您还可以使用 Amazon CloudWatch 订阅筛选器实时自动处理日志信息。有关更多信息,请参阅 Amazon CloudWatch 用户指南中的通过订阅实时处理日志数据

例如,假设您的网关已部署到激活了 VMware HA 的集群中,并且您需要了解任何错误情况。您可以配置 CloudWatch 日志组来监控您的网关,并在网关遇到错误时收到通知。您可以在激活网关时或在激活网关并运行后配置组。有关如何在激活网关时配置 CloudWatch 日志组的信息,请参阅配置您的磁带网关。有关 CloudWatch 日志组的一般信息,请参阅 Amazon CloudWatch 用户指南中的使用日志组和日志流

有关如何排查和修复此类错误的信息,请参阅对虚拟磁带问题进行故障排除

以下过程说明如何在激活网关后配置 CloudWatch 日志组。

将 CloudWatch 日志组配置为与您的文件网关配合使用
  1. 登录 AWS Management Console 并打开 Storage Gateway 控制台,网址为 https://console.aws.amazon.com/storagegateway/home

  2. 在导航窗格中,选择 Gateways,然后选择要为其配置 CloudWatch 日志组的网关。

  3. 在 “操作” 中,选择 “编辑网关信息”,或者在 “详细信息” 选项卡上,在 “健康日志” 和 “未启用” 下,选择 “配置日志组” 以打开 CustomerGatewayName编辑” 对话框。

  4. 对于网关运行状况日志组,请选择以下选项之一:

    • 如果您不想使用@@ 日志组监控网关,请禁用 CloudWatch 日志记录。

    • 创建新的日志组以创建新的 CloudWatch 日志组。

    • 使用现有日志组使用已存在的 CloudWatch 日志组。

      现有日志组列表中选择一个日志组。

  5. 选择 ‬保存更改

  6. 要查看网关的运行状况日志,请执行以下操作:

    1. 在导航窗格中,选择 Gateways,然后选择您为其配置 CloudWatch 日志组的网关。

    2. 选择 “详细信息” 选项卡,然后在 “Healt h Logs” 下,选择 “CloudWatch 日志”。日志组详细信息页面将在 CloudWatch控制台中打开。

以下是发送到的磁带网关事件消息的示例 CloudWatch。此示例显示了一条 TapeStatusTransition 消息。

{ "severity": "INFO", "source": "FZTT16FCF5", "type": "TapeStatusTransition", "gateway": "sgw-C51DFEAC", "timestamp": "1581553463831", "newStatus": "RETRIEVED" }

使用 Amazon CloudWatch 指标

您可以使用 AWS Management Console 或 CloudWatch API 获取磁带网关的监控数据。控制台将根据来自 CloudWatch API 的原始数据显示一系列图表。该 CloudWatch API 也可以通过亚马逊 AWS 软件开发套件 (SDK)亚马逊 CloudWatch API 工具使用。根据您的需求差异,您可能倾向于使用控制台中显示的图表,也可能倾向于检索自 API 的图表。

无论选择何种方法使用指标,您都必须指定下列信息:

  • 要使用的指标维度。维度 是帮助您对某指标进行唯一标识的名称/值对。Storage Gateway 的维度为 GatewayIdGatewayName。在 CloudWatch 控制台中,您可以使用 Gateway Metrics 视图来轻松选择特定于网关和特定于磁带的维度。有关尺寸的更多信息,请参阅 Amazon CloudWatch 用户指南中的尺寸

  • 指标名称,如 ReadBytes

下表总结了可供您使用的 Storage Gateway 指标数据的类型。

Amazon CloudWatch 命名空间 维度 描述
AWS/StorageGateway GatewayId, GatewayName

这些维度筛选描述磁带网关各个方面的指标数据。您可以通过指定 GatewayIdGatewayName 维度来标识要使用的磁带网关。

磁带网关的吞吐量和延迟数据基于磁带网关中的所有虚拟磁带。

数据在 5 分钟期间内自动可用,无需收费。

网关和磁带指标的使用方式类似于其他服务指标。您可以在下面所列的 CloudWatch 文档中找到一个有关某些最常见的指标任务的讨论:

了解虚拟磁带指标

您可以在下面找到有关包含虚拟磁带的 Storage Gateway 指标的信息。每个磁带均有与其关联的一组指标。

某些特定于磁带的指标可能与某些特定于网关的指标同名。这些指标代表同类度量,但其范围限于磁带,而非网关。在开始工作之前,请指定要使用网关指标还是磁带指标。在使用磁带指标时,请为要查看其指标的磁带指定磁带 ID。有关更多信息,请参阅使用 Amazon CloudWatch 指标

注意

某些指标仅在最近的监控期内生成了新数据时才会返回数据点。

下表描述了可用来获取磁带相关信息的 Storage Gateway 指标。

指标 描述
CachePercentDirty

磁带在未传送到 AWS的网关缓存的总体比例中的占比。样本在报告周期结束时采用。

使用网关的 CachePercentDirty 指标来查看未传送到 AWS的网关缓存总体比例。有关更多信息,请参阅了解网关指标

单位:百分比

CloudTraffic

上传的字节数以及从云下载到磁带的字节数。

单位:字节

IoWaitPercent

磁带当前使用的已分配 IoWait 单元的百分比。

单位:百分比

HealthNotification

由磁带发送的运行状况通知的数量。

单位:计数

MemUsedBytes

磁带当前所使用的已分配内存的百分比。

单位:字节

MemTotalBytes

磁带当前所用的总内存的百分比。

单位:字节

ReadBytes

文件共享的报告周期内从本地应用程序读取的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

UserCpuPercent

磁带当前所使用的为用户分配的 CPU 计算单位的百分比。

单位:百分比

WriteBytes

报告周期内写入到场内应用程序的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

测量您的磁带网关和之间的性能 AWS

您可以通过数据吞吐量、数据延迟和每秒操作数这三个衡量指标来了解使用磁带网关的应用程序存储的性能状况。当您使用正确的聚合统计数据时,可使用提供给您的 Storage Gateway 指标来衡量这些值。

统计数据 是某指标在指定时间内的集合。在中查看指标值时 CloudWatch,使用Average统计数据表示数据延迟(毫秒),使用Samples统计数据表示每秒输入/输出操作数 (IOPS)。有关更多信息,请参阅 Amazon CloudWatch 用户指南中的统计数据

下表总结了用来测量磁带网关与 AWS之间的吞吐量、延迟和 IOPS 的指标以及相应的统计数据。

关注项 如何测量
延迟 ReadTimeWriteTime 指标结合 Average CloudWatch 统计数据使用。例如,Average 指标的 ReadTime 值为您提供采样周期内的每个操作的延迟时间。
吞吐量到 AWS Sum CloudWatch 统计数据中使用CloudBytesDownloadedCloudBytesUploaded指标。例如,5 分钟采样周期内的CloudBytesDownloaded指标Sum值除以 300 秒,得出从磁带网关到磁带网关的吞吐量, AWS 以每秒字节为单位。
数据延迟到 AWS CloudDownloadLatency 指标与 Average 统计数据结合使用。例如,Average 指标的 CloudDownloadLatency 统计数据为您提供每操作延迟。
测量从磁带网关到的上传数据吞吐量 AWS
  1. 打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/

  2. 请选择 Metrics(指标)选项卡。

  3. 选择 StorageGateway:网关指标维度,然后找到要使用的磁带网关。

  4. 选择 CloudBytesUploaded 指标。

  5. 对于 Time Range,请选择一个值。

  6. 选择 Sum 统计数据。

  7. 对于 Period,请选择值 5 分钟或更长的时间。

  8. 在得出的按时间排序的数据点集中,将各个数据点除以周期 (以秒为单位) 获得该样本周期当时的吞吐量。

下图使用 CloudBytesUploaded 统计数据显示了网关磁带的 Sum 指标。在图中,将光标悬浮在数据点上就会显示该数据点信息,包括其值和上传的字节数。将该值除以 Period 值 (5 分钟) 得出采样点当时的吞吐量。为了突出显示的一点,从磁带网关到的吞吐量 AWS 为 555,544,576 字节除以 300 秒,即每秒 1.7 兆字节。


                网关的上传云字节数示例指标图表,其中包含总和统计数据。
测量从磁带网关到的数据延迟 AWS
  1. 打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/

  2. 请选择 Metrics(指标)选项卡。

  3. 选择StorageGateway: GatewayMetrics维度,然后找到要使用的磁带网关。

  4. 选择 CloudDownloadLatency 指标。

  5. 对于 Time Range,请选择一个值。

  6. 选择 Average 统计数据。

  7. 对于 Period,请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含以秒为单位的延迟。

将磁带网关吞吐量的上限阈值警报设置为 AWS
  1. 打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/

  2. 选择 Create Alarm (创建警报) 可启动“Create Alarm (创建警报)”向导。

  3. 选择 StorageGateway:网关指标维度,然后找到要使用的磁带网关。

  4. 选择 CloudBytesUploaded 指标。

  5. 通过定义 CloudBytesUploaded 指标在指定时间段大于或等于指定值时的警报状态,定义警报。例如,可定义 CloudBytesUploaded 指标在 60 分钟内大于 10MB 时的警报状态。

  6. 针对该警报状态配置要采取的行动。例如,可获得向您发送的电子邮件通知。

  7. 选择创建警报

要设置上限阈值警报,以便从中读取数据 AWS
  1. 打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/

  2. 选择 Create Alarm (创建警报) 可启动“Create Alarm (创建警报)”向导。

  3. 选择 StorageGateway:网关指标维度,然后找到要使用的磁带网关。

  4. 选择 CloudDownloadLatency 指标。

  5. 通过定义 CloudDownloadLatency 指标在指定时间段大于或等于指定值时的警报状态,定义警报。例如,您可以定义 CloudDownloadLatency 在 2 小时内大于 60000 毫秒时的警报状态。

  6. 针对该警报状态配置要采取的行动。例如,可获得向您发送的电子邮件通知。

  7. 选择创建警报