Valkey 和 Redis OSS 的指标

Amazon ElastiCache 命名空间包括以下 Valkey 和 Redis OSS 指标。使用 Valkey 引擎时，这些指标是相同的。

除了ReplicationLag、、和之外 EngineCPUUtilization SuccessfulWriteRequestLatencySuccessfulReadRequestLatency，这些指标都是从info命令中派生出来的。每项指标均是按照缓存节点级计算的。

有关该info命令的完整文档，请参阅 http://valkey。 io/commands/info。

另请参阅

主机级指标

指标	描述	单位
`ActiveDefragHits`	活动碎片整理进程每分钟执行的值重新分配数。这是根据 INFO 的 `active_defrag_hits` 统计数据得出的。	数字
`AuthenticationFailures`	使用 AUTH 命令对 Valkey 或 Redis OSS 进行身份验证时的总失败尝试次数。您可以使用 ACL LOG 命令查找有关个人身份验证失败的更多信息。我们建议为此设置告警以检测未经授权的访问尝试。	计数
`BytesUsedForCache`	Valkey 或 Redis OSS 为所有目的（包括数据集、缓冲区等）分配的字节的总数。	字节
	在数据分层 ElastiCache 中使用 `Dimension: Tier=Memory` for Valkey 或 Redis OSS 集群：内存所使用的总字节数。这是 INFO 的 `used_memory` 统计数据的值。	字节
	在数据分层 ElastiCache 中使用 `Dimension: Tier=SSD` for Valkey 或 Redis OSS 集群：内存所使用的总字节数。	字节
`BytesReadFromDisk`	每分钟从磁盘读取的总字节数。仅支持使用数据分层 ElastiCache功能的集群。	字节
`BytesWrittenToDisk`	每分钟写入磁盘的总字节数。仅支持使用数据分层 ElastiCache功能的集群。	字节
`CacheHits`	主字典中成功的只读键查找次数。这是根据 INFO 的 `keyspace_hits` 统计数据得出的。	计数
`CacheMisses`	主字典中失败的只读键查找次数。这是根据 INFO 的 `keyspace_misses` 统计数据得出的。	计数
`CommandAuthorizationFailures`	用户运行其无权限调用的命令的失败尝试次数。您可以使用 ACL LOG 命令查找有关个人身份验证失败的更多信息。我们建议为此设置告警以检测未经授权的访问尝试。	计数
`CacheHitRate`	表示 Valkey 或 Redis OSS 实例的使用效率。如果缓存比率低于 0.8 左右，则意味着大量的密钥被移出、过期或不存在。这是使用 `cache_hits` 和 `cache_misses` 统计数据按以下方式计算的：`cache_hits /(cache_hits + cache_misses)`。	百分比
`ChannelAuthorizationFailures`	用户访问其无权限访问的通道的失败尝试次数。您可以使用 ACL LOG 命令查找有关个人身份验证失败的更多信息。我们建议为此指标设置告警以检测未经授权的访问尝试。	计数
`CurrConnections`	客户端连接数，不包括来自只读副本的连接。 ElastiCache 在每种情况下都使用 4 到 6 个连接来监视集群。这是根据 INFO 的 `connected_clients` 统计数据得出的。	计数
`CurrItems`	缓存中的项目数。这是根据 `keyspace` 统计数据得出的，方法是计算整个键空间中所有键的总和。	计数
	`Dimension: Tier=Memory`（对于使用数据分层 ElastiCache功能的集群）。内存中的项目数。	计数
	`Dimension: Tier=SSD`（固态硬盘）（对于使用数据分层 ElastiCache功能的 Redis 集群）。SSD 中的项目数。	计数
`CurrVolatileItems`	所有数据库中具有 ttl 集的键的总数。这是根据 `expires` 统计数据得出的，方法是计算整个键空间中有 ttl 集的所有键的总和。	计数
`DatabaseCapacityUsagePercentage`	集群的总数据容量中正在使用的百分比。在数据分层实例上，指标的计算方式为 `(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity)`，其中 `used_memory` 和 `maxmemory` 取自 INFO。在所有其他情况下，使用 `used_memory/maxmemory` 计算指标。	百分比
`DatabaseCapacityUsageCountedForEvictPercentage`	集群的总数据容量中正在使用的百分比（不含用于开销和 COB 的内存）。该指标的计算方式如下： `used_memory - mem_not_counted_for_evict/maxmemory` 在数据分层实例上，该指标的计算方式如下： `(used_memory + SSD used) / (maxmemory + SSD total capacity)` 其中，`used_memory` 和 `maxmemory` 取自 INFO	百分比
`DatabaseMemoryUsagePercentage`	集群中正在使用的内存的百分比。这是使用 `used_memory/maxmemory` 从 INFO 计算得出的。	百分比
`DatabaseMemoryUsageCountedForEvictPercentage`	集群中正在使用的内存的百分比（不含用于开销和 COB 的内存）。这是使用 `used_memory-mem_not_counted_for_evict/maxmemory` 从 INFO 计算得出的。	百分比
`DB0AverageTTL`	根据 INFO 命令中的 `keyspace` 统计数据公开 DBO 的 `avg_ttl`。副本不会使密钥过期，而是等待主节点使密钥过期。当主节点使密钥过期（或由于 LRU 而将其逐出）时，它将合成一个 `DEL` 命令，该命令将传送到所有副本。因此，对于副本节点，DB0AverageTTL 为 0，因为它们不会使密钥过期，因而不会跟踪 TTL。	毫秒
`EngineCPUUtilization`	提供 Valkey 或 Redis OSS 引擎线程的 CPU 使用率。由于 Valkey 和 Redis OSS 为单线程，您可以使用该指标来分析该进程本身的负载。`EngineCPUUtilization` 指标更精确地呈现了该进程。您可以将其与 `CPUUtilization` 指标配合使用。`CPUUtilization` 公开服务器实例整体的 CPU 使用率，包括其他操作系统和管理流程。对于具有四个 v CPUs 或更大的较大节点类型，请使用该`EngineCPUUtilization`指标来监控和设置扩展阈值。注意在 ElastiCache 主机上，后台进程监视主机以提供托管数据库体验。这些后台进程可能会占用很大一部分 CPU 工作负载。这对于超过两个 v 的大型主机来说并不重要CPUs。但它可能会影响 2v CPUs 或更低电压的小型主机。如果仅监控 `EngineCPUUtilization` 指标，您将无法发现因 Valkey 或 Redis OSS 的 CPU 使用率过高或后台监控进程的 CPU 使用率过高而导致主机过载的情况。因此，我们建议监控两个 v CPUs 或更小的主机的`CPUUtilization`指标。	百分比
`Evictions`	由于 `maxmemory` 限制而被驱逐的密钥数。这是根据 INFO 的 `evicted_keys` 统计数据得出的。	计数
`GlobalDatastoreReplicationLag`	此为辅助区域的主节点与主区域的主节点之间的滞后。对于已启用集群模式的 Valkey 或 Redis OSS，滞后表示分片之间的最大延迟。	秒
`IamAuthenticationExpirations`	已过期的经过 IAM 身份验证的 Valkey 或 Redis OSS 连接总数。您可以在用户指南中找到有关使用 IAM 进行身份验证的更多信息。	计数
`IamAuthenticationThrottling`	受限的经过 IAM 身份验证的 Valkey 或 Redis OSS AUTH 或 HELLO 请求的总数。您可以在用户指南中找到有关使用 IAM 进行身份验证的更多信息。	计数
`IsMaster`	指示节点是否为当前分片/集群的主节点。指标可以是 0（非主节点）或 1（主节点）。	计数
`KeyAuthorizationFailures`	用户访问其无权限访问的密钥的失败尝试次数。您可以使用 ACL LOG 命令查找有关个人身份验证失败的更多信息。我们建议为此设置告警以检测未经授权的访问尝试。	计数
`KeysTracked`	Valkey 或 Redis OSS 键跟踪所跟踪的键数占 `tracking-table-max-keys` 的百分比。密钥跟踪用于帮助客户端侧缓存，并在修改密钥时通知客户端。	计数
`MemoryFragmentationRatio`	表示 Valkey 或 Redis OSS 引擎的内存分配效率。某些阈值将表示不同的行为。建议的值是让碎片化大于 1.0。这是根据 INFO 的 `mem_fragmentation_ratio statistic` 计算得出的。	数字
`NewConnections`	在此期间，服务器接受的连接总数。这是根据 INFO 的 `total_connections_received` 统计数据得出的。注意如果您使用 ElastiCache 的是 Redis OSS 版本 5 或更低版本，则使用此指标报告的两到四个连接 ElastiCache 来监控集群。但是，在 Redis OSS 版本 6 或更高版本中使用 ElastiCache 时， ElastiCache 用于监控集群的连接不包含在此指标中。	计数
`NumItemsReadFromDisk`	每分钟从磁盘检索的项目总数。仅支持使用数据分层 ElastiCache功能的集群。	计数
`NumItemsWrittenToDisk`	每分钟写入磁盘的项目总数。仅支持使用数据分层 ElastiCache功能的集群。	计数
`MasterLinkHealthStatus`	此状态有两个值：0 或 1。值为 0 表示 ElastiCache主节点中的数据与开启的 Valkey 或 Redis OSS 不同步。 EC2值为 1 表示数据已同步。要完成迁移，请使用 CompleteMigrationAPI 操作。	布尔值
`Reclaimed`	密钥过期事件的总数。这是根据 INFO 的 `expired_keys` 统计数据得出的。	计数
`ReplicationBytes`	对于重复配置中的节点，`ReplicationBytes` 报告主项向其所有副本发送的字节数。此指标代表复制组上的写入负载。这是根据 INFO 的 `master_repl_offset` 统计数据得出的。	字节
`ReplicationLag`	该指标仅适用于作为只读副本运行的节点。它代表副本在应用主节点的改动方面滞后的时间（以秒为单位）。对于 Valkey 7.2 及更高版本以及 Redis OSS 5.0.6 及更高版本，延迟可以用毫秒来衡量。	秒
`SaveInProgress`	只要背景保存（forked 或 forkless）在进行中，此二进制指标均返回 1，否则会返回 0。在快照和同步期间，通常使用背景保存进程。这些操作会导致性能下降。使用 `SaveInProgress` 指标，您可以诊断性能下降是否由背景保存进程造成。这是根据 INFO 的 `rdb_bgsave_in_progress` 统计数据得出的。	布尔值
`TrafficManagementActive`	指示 Redis OSS 是否 ElastiCache 通过调整分配给传入命令、监控或复制的流量来主动管理流量。当发送到节点的命令多于 Valkey 或 Redis OSS 可以处理的命令时，流量就会受到管理，并用于保持引擎的稳定性和最佳运行状态。任何为 1 的数据点都可能表示节点对于所提供的工作负载而言规模过小。注意如果此指标持续处于活动状态，请评估集群以确定是否需要纵向扩展或横向扩展。相关指标包括 `NetworkBandwidthOutAllowanceExceeded` 和 `EngineCPUUtilization`。	布尔值
`SuccessfulWriteRequestLatency`	成功写入请求的延迟。有效统计数据：平均值、总和、最小值、最大值、样本数、p0 和 p100 之间的任何百分位数。样本计数仅包括成功执行的命令。	微秒
`SuccessfulReadRequestLatency`	成功读取请求的延迟。有效统计数据：平均值、总和、最小值、最大值、样本数、p0 和 p100 之间的任何百分位数。样本计数仅包括成功执行的命令。	微秒
`ErrorCount`	在指定时间段内失败的命令总数。有效统计数据：平均值、总和、最小值、最大值	计数

发动机CPUUtilization 可用性

AWS 以下列出的区域适用于所有支持的节点类型。

区域	区域名称
`us-east-2`	美国东部（俄亥俄州）
`us-east-1`	美国东部（弗吉尼亚州北部）
`us-west-1`	美国西部（加利福尼亚北部）
`us-west-2`	美国西部（俄勒冈）
`ap-northeast-1`	亚太地区（东京）
`ap-northeast-2`	亚太地区 (首尔)
`ap-northeast-3`	亚太地区（大阪）
`ap-east-1`	亚太地区（香港）
`ap-south-1`	Asia Pacific (Mumbai)
`ap-southeast-1`	亚太地区（新加坡）
`ap-southeast-2`	亚太地区（悉尼）
`ap-southeast-3`	亚太地区（雅加达）
`ca-central-1`	加拿大（中部）
`cn-north-1`	中国（北京）
`cn-northwest-2`	中国（宁夏）
`me-south-1`	中东（巴林）
`eu-central-1`	欧洲地区（法兰克福）
`eu-west-1`	欧洲地区（爱尔兰）
`eu-west-2`	欧洲地区（伦敦）
`eu-west-3`	欧洲地区（巴黎）
`eu-south-1`	欧洲地区（米兰）
`af-south-1`	非洲（开普敦）
`eu-north-1`	欧洲地区（斯德哥尔摩）
`sa-east-1`	南美洲（圣保罗）
`us-gov-west-1`	AWS GovCloud （美国西部）
`us-gov-east-1`	AWS GovCloud （美国东部）

以下是一些类型的命令的集合，派生自 info commandstats。commandstats 部分提供基于命令类型的统计数据，包括调用次数、这些命令消耗的总 CPU 时间以及每个命令执行所消耗的平均 CPU 时间。对于每种命令类型，都会添加以下行：cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX。

下面列出的延迟指标是使用 INFO 中的 commandstats 统计数据计算得出的。计算方式如下：delta(usec)/delta(calls)。delta 计算为一分钟内的差异。延迟定义为处理命令所花费 ElastiCache 的 CPU 时间。请注意，对于使用数据分层的集群，这些测量值并未包含从 SSD 提取项目所需的时间。

有关可用命令的完整列表，请参阅 Valkey 文档中的命令。

指标	描述	单位
`ClusterBasedCmds`	基于集群的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于集群（`cluster info`、`cluster slot` 等）的命令的总和。	计数
`ClusterBasedCmdsLatency`	基于集群的命令的延迟。	微秒
`EvalBasedCmds`	基于 eval 的命令的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算 eval、evalsha 的总和。	计数
`EvalBasedCmdsLatency`	基于 Eval 的命令的延迟。	微秒
`GeoSpatialBasedCmds`	基于地理空间的命令的命令总数。这是根据 `commandstats` 统计数据得出的。它是通过汇总所有地理类型的命令的总和得出的：geoadd、geodist、geohash、geopos、georadius 和 georadiusbymember。	计数
`GeoSpatialBasedCmdsLatency`	基于地理空间的命令的延迟。	微秒
`GetTypeCmds`	read-only 类型命令的总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有 read-only 类型命令（get、hget、scard、lrange 等）的总和。	计数
`GetTypeCmdsLatency`	读取命令的延迟。	微秒
`HashBasedCmds`	基于哈希的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于一个或多个哈希的命令（hget、hkeys、hvals、hdel 等）的总和。	计数
`HashBasedCmdsLatency`	基于哈希的命令的延迟。	微秒
`HyperLogLogBasedCmds`	基于 `HyperLogLog` 的命令的总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有 pf 类型的命令（pfadd、pfcount、pfmerge 等）的总和。	计数
`HyperLogLogBasedCmdsLatency`	HyperLogLog基于命令的延迟。	微秒
`JsonBasedCmds`	JSON 命令的总数，包括读取和写入命令。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于 JSON 键的 JSON 命令的总和。	计数
`JsonBasedCmdsLatency`	所有 JSON 命令的延迟，包括读取和写入命令。	微秒
`JsonBasedGetCmds`	JSON 只读命令的总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于 JSON 键的 JSON 读取命令的总和。	计数
JsonBasedGetCmdsLatency	JSON 只读命令的延迟。	微秒
JsonBasedSetCmds	JSON 写入命令的总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于 JSON 键的 JSON 写入命令的总和。	计数
JsonBasedSetCmdsLatency	JSON 写入命令的延迟。	微秒
`KeyBasedCmds`	基于密钥的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于多个数据结构中的一个或多个键的命令（del、expire、rename 等）的总和。	计数
`KeyBasedCmdsLatency`	基于键的命令的延迟。	微秒
`ListBasedCmds`	基于列表的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于一个或多个列表的命令（lindex、lrange、lpush、ltrim 等）的总和。	计数
`ListBasedCmdsLatency`	基于列表的命令的延迟。	微秒
NonKeyTypeCmds	不基于键的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有不作用于某个键的命令（例如 acl、dbsize 或 info 等）的总和。	计数
NonKeyTypeCmdsLatency	non-key-based命令延迟。	微秒
`PubSubBasedCmds`	pub/sub 功能命令总数。这是从`commandstats`统计数据中得出的，方法是将所有用于 pub/sub 功能的命令相加：psubscribepublish、pubsub、punsubscribe、ssubscribe、、sunsubscribe、spublishsubscribe、和unsubscribe。	计数
`PubSubBasedCmdsLatency`	PubSub-based 命令的延迟。	微秒
`SetBasedCmds`	基于设置的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于一个或多个集合的命令（scard、sdiff、sadd、sunion 等）的总和。	计数
`SetBasedCmdsLatency`	基于集合的命令的延迟。	微秒
`SetTypeCmds`	write 类型命令的总数。这是根据 `commandstats` 统计数据得出的，方法是计算对数据执行操作的所有 mutative 类型的命令（set、hset、sadd、lpop 等）的总和。	计数
`SetTypeCmdsLatency`	写入命令的延迟。	微秒
`SortedSetBasedCmds`	基于设置的已排序命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于一个或多个已排序集合的命令（zcount、zrange、zrank、zadd 等）的总和。	计数
`SortedSetBasedCmdsLatency`	基于排序的命令的延迟。	微秒
`StringBasedCmds`	基于字符串的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于一个或多个字符串的命令（strlen、setex、setrange 等）的总和。	计数
`StringBasedCmdsLatency`	基于字符串的命令的延迟。	微秒
`StreamBasedCmds`	基于流的命令总数。这是根据 `commandstats` 统计数据得出的，方法是计算所有作用于一个或多个流数据类型的命令（xrange、xlen、xadd、xdel 等）的总和。	计数
`StreamBasedCmdsLatency`	基于流的命令的延迟。	微秒

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

主机级指标

Memcached 的指标