应监控哪些指标? - Amazon 内存 DB

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

应监控哪些指标?

以下 CloudWatch 指标可以很好地深入了解 MemoryDB 的性能。在大多数情况下,我们建议您为这些指标设置 CloudWatch 警报,以便在出现性能问题之前采取纠正措施。

CPUUtilization

这是以百分比形式报告的主机级指标。有关更多信息,请参阅 主机级指标

对于有 2 个或更少 vCPU 的较小节点类型,可使用 CPUUtilization 指标来监控工作负载。

一般来说,我们建议您将阈值设置为可用 CPU 的 90%。由于 Redis OSS 是单线程的,因此实际阈值应按节点总容量的一小部分计算。例如,假设您使用具有两个核心的节点类型。在这种情况下,CPU 使用率的阈值为 90/2,或 45%。要查找您的节点类型具有的核心(vCPU)数量,请参阅 MemoryDB 定价

您需要根据所使用的节点中的核心数,来确定自己的阈值。如果超过此阈值,并且主要工作负载来自读取请求,则请通过添加只读副本来扩展集群。如果主要工作负载来自写入请求,我们建议您添加更多分片,以在更多主节点中分配写入工作负载。

提示

与其使用主机级指标CPUUtilization,不如使用 Redis OSS 指标EngineCPUUtilization,该指标报告 Redis OSS 引擎核心的使用百分比。要了解此指标在您的节点上是否可用并了解更多信息,请参阅 MemoryDB 的指标

对于拥有 4vCPU 或更多的大型节点类型,您可能需要使用该EngineCPUUtilization指标,该指标报告 Redis OSS 引擎核心的使用百分比。要了解此指标在您的节点上是否可用并了解更多信息,请参阅 MemoryDB 的指标

EngineCPUUtilization

对于拥有 4vCPU 或更多的大型节点类型,您可能需要使用该EngineCPUUtilization指标,该指标报告 Redis OSS 引擎核心的使用百分比。要了解此指标在您的节点上是否可用并了解更多信息,请参阅 MemoryDB 的指标

SwapUsage

这是以字节为单位报告的主机级指标。有关更多信息,请参阅 主机级指标

此指标不应超过 50 MB。

移出

这是引擎指标。我们建议您根据应用程序需求,为此指标确定自己的警报阈值。

CurrConnections

这是引擎指标。我们建议您根据应用程序需求,为此指标确定自己的警报阈值。

越来越多的CurrConnections可能表明您的应用程序存在问题;您需要调查应用程序行为才能解决此问题。

内存

内存是 Redis OSS 的核心方面。了解集群的内存利用率对于避免数据丢失和适应数据集的未来增长是必要的。有关节点内存利用率的统计信息可在 Redis OSS INFO 命令的内存部分找到。

网络

集群网络带宽容量的决定因素之一是您选择的节点类型。有关节点的网络容量的更多信息,请参阅 Amazon MemoryDB 定价

复制

可通过 ReplicationBytes 指标了解被复制的数据量。您可以根据复制吞吐量监控 MaxReplicationThroughput。建议在达到最大复制吞吐量时添加更多分片。

ReplicationDelayedWriteCommands 还可以提示工作负载是否超过最大复制吞吐量。有关在 MemoryDB 中使用复制的更多信息,请参阅了解 MemoryDB 复制