

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 指标参考
<a name="msk-replicator-metrics-ref"></a>

以下指标描述了 MSK 复制器的性能或连接指标。

AuthError 指标不包括主题级别的身份验证错误。要监控 MSK Replicator 的主题级身份验证错误，请监控 Replicator 的 ReplicationLatency 指标和源集群的主题级指标。 MessagesInPerSec如果主题 ReplicationLatency 降至 0，但该主题仍有数据正在生成给它，则表示 Replicator 在该主题上存在身份验证问题。检查 Replicator 的服务执行 IAM 角色是否有足够的权限访问该主题。


****  


- **性能**
  - **指标:** ReplicationLatency
  - **说明:** 将记录从源集群复制到目标集群所花费的时间；源集群的记录生成时间与复制到目标集群之间的间隔。如果 ReplicationLatency 增加，请检查集群是否有足够的分区来支持复制。当分区数太低而无法实现高吞吐量时，可能会出现较高的复制延迟。
  - **Dimensions:** ReplicatorName / **单位:** 毫秒 / **原始指标粒度:** 分区 / **原始指标聚合统计数据:** 最大值
  - **Dimensions:** ReplicatorName，话题 / **单位:** 毫秒 / **原始指标粒度:** 分区 / **原始指标聚合统计数据:** 最大值

- **性能**
  - **指标:** MessageLag
  - **说明:** 监控 MSK 复制器和源集群之间的同步。 MessageLag 表示向源集群生成的消息与复制器使用的消息之间的延迟。这不是源集群与目标集群之间的延迟。即使源集群不可用/中断，复制器也会完成将其已消费的消息写入目标集群。中断后， MessageLag 显示一个增加的消息，表示复制器位于源集群后面的消息数量，可以对其进行监控，直到消息数为 0，这表明复制器已经赶上了源集群。
  - **Dimensions:** ReplicatorName / **单位:** 计数 / **原始指标粒度:** 分区 / **原始指标聚合统计数据:** 总和
  - **Dimensions:** ReplicatorName，话题 / **单位:** 计数 / **原始指标粒度:** 分区 / **原始指标聚合统计数据:** 总和

- **性能**
  - **指标:** ReplicatorBytesInPerSec
  - **说明:** 复制器每秒处理的平均字节数。MSK 复制器处理的数据包括 MSK 复制器接收的所有数据，其中包括复制到目标集群的数据和 MSK 复制器筛选的数据（仅当您的复制器配置了相同主题名称配置时），以防止将数据复制回其源自的同一主题。如果您的复制器配置了“带前缀”主题名称配置，则 ReplicatorBytesInPerSec 和 ReplicatorThroughput 指标都将具有相同的值，因为 MSK 复制器不会筛选任何数据。
  - **Dimensions:** ReplicatorName
  - **单位:** BytesPerSecond
  - **原始指标粒度:** ReplicatorName
  - **原始指标聚合统计数据:** 总和

- **性能**
  - **指标:** ReplicatorThroughput
  - **说明:** 每秒复制的平均字节数。如果某个 ReplicatorThroughput 主题被删除，请检查 KafkaClusterPingSuccessCount 和 AuthError 指标以确保 Replicator 可以与集群通信，然后检查集群指标以确保集群没有关闭。
  - **Dimensions:** ReplicatorName / **单位:** BytesPerSecond / **原始指标粒度:** 分区 / **原始指标聚合统计数据:** 总和
  - **Dimensions:** ReplicatorName，话题 / **单位:** BytesPerSecond / **原始指标粒度:** 分区 / **原始指标聚合统计数据:** 总和

- **性能**
  - **指标:** ReplicationFailures
  - **说明:** 复制失败次数。对于正常复制，应为 0。非零可能表示邮件大小限制、时间戳违规或记录批量大小问题。
  - **Dimensions:** ReplicatorName
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

- **Debug**
  - **指标:** AuthError
  - **说明:** 每秒身份验证失败的连接数。如果此指标大于 0，则可以检查复制器的服务执行角色策略是否有效，并确保没有为集群权限设置任何拒绝权限。根据 clusterAlias 维度，您可以确定源集群或目标集群是否遇到身份验证错误。
  - **Dimensions:** ReplicatorName, ClusterAlias
  - **单位:** 计数
  - **原始指标粒度:** 工作线程
  - **原始指标聚合统计数据:** 总和

- **Debug**
  - **指标:** ThrottleTime
  - **说明:** 集群上的代理限制请求的平均时间（以毫秒为单位）。设置节流以避免 MSK 复制器使集群不堪重负。如果此指标为 0，replicationLatency 不高，并且 replicatorThroughput 符合预期，则表示节流按预期运行。如果该指标大于 0，则可以相应地调整节流。
  - **Dimensions:** ReplicatorName, ClusterAlias
  - **单位:** 毫秒
  - **原始指标粒度:** 工作线程
  - **原始指标聚合统计数据:** 最大值

- **Debug**
  - **指标:** ReplicatorFailure
  - **说明:** 复制器遇到的故障数。
  - **Dimensions:** ReplicatorName
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

- **Debug**
  - **指标:** KafkaClusterPingSuccessCount
  - **说明:** 表示与 kafka 集群的复制器连接的运行状况。如果该值为 1，则表示连接正常。如果该值为 0 或没有数据点，则连接不正常。如果该值为 0，则可以检查 Kafka 集群的网络或 IAM 权限设置。根据 ClusterAlias 维度，您可以确定该指标是针对源集群还是目标集群。
  - **Dimensions:** ReplicatorName, ClusterAlias
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

- **消费者组**
  - **指标:** ConsumerGroupCount
  - **说明:** 正在同步的消费组数量。验证它是否与预期的消费者群体相匹配。
  - **Dimensions:** ReplicatorName
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

- **消费者组**
  - **指标:** ConsumerGroupOffsetSyncFailure
  - **说明:** 消费组偏移同步失败的次数。应该是 0。如果大于 0，请检查使用者组是否处于活动状态并验证权限。
  - **Dimensions:** ReplicatorName
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

- **消费者组**
  - **指标:** OffsetLag （MSK 集群）
  - **说明:** MSK 目标集群上的分区级使用者滞后。与 OffsetLag （非 MSK 群集）进行比较以验证延迟是否相等。
  - **Dimensions:** 分区
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

- **消费者组**
  - **指标:** OffsetLag （非 MSK 集群）
  - **说明:** 自管理（非 MSK）源集群上的分区级使用者滞后。与 OffsetLag （MSK 集群）进行比较。
  - **Dimensions:** 分区
  - **单位:** 计数
  - **原始指标粒度:** 
  - **原始指标聚合统计数据:** 总和

