View a markdown version of this page

メトリクスのリファレンス - Amazon Managed Streaming for Apache Kafka

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

メトリクスのリファレンス

次のメトリクスは、MSK レプリケーターのパフォーマンスまたは接続のメトリクスを示しています。

AuthError メトリクスには、トピックレベルの認証エラーは含まれません。MSK レプリケーターのトピックレベルの認証エラーをモニタリングするには、レプリケーターの ReplicationLatency メトリクスとソースクラスターのトピックレベルのメトリクス MessagesInPerSec をモニタリングします。トピックの ReplicationLatency が 0 にドロップされたが、トピックにまだデータが生成されている場合は、レプリケーターにトピックに対する認証の問題があることを示します。レプリケーターのサービス実行 IAM ロールに、トピックにアクセスするための十分なアクセス許可があることを確認します。

メトリクスのタイプ メトリクス 説明 ディメンション Unit 未加工メトリクスの細分性 未加工メトリクスの集計統計
パフォーマンス ReplicationLatency ソースクラスターからターゲットクラスターにレコードをレプリケートするのにかかる時間。ソースでレコードが作成されてからターゲットにレプリケートされるまでの時間。ReplicationLatency が増加した場合は、クラスターにレプリケーションをサポートするのに十分なパーティションがあるかどうかを確認してください。パーティション数が少なすぎて高スループットに対応できない場合、レプリケーションのレイテンシーが高くなる可能性があります。 ReplicatorName ミリ秒 パーティション 最大値
ReplicatorName、Topic ミリ秒 パーティション 最大値
パフォーマンス MessageLag MSK レプリケーターとソースクラスター間の同期をモニタリングします。MessageLag は、ソースクラスターに生成されたメッセージとレプリケーターによって消費されたメッセージ間の遅延を示します。ソースクラスターとターゲットクラスター間の遅延ではありません。ソースクラスターが使用不可または中断された場合でも、レプリケーターはターゲットクラスターへの消費したメッセージの書き込みを完了させます。停止後、MessageLag は増加して、レプリケーターがソースクラスターに対して遅れているメッセージ数を示します。これは、メッセージ数が 0 になる (レプリケーターがソースクラスターにキャッチアップしたことを示す) までモニタリングできます。 ReplicatorName カウント パーティション 合計
ReplicatorName、Topic カウント パーティション 合計
パフォーマンス ReplicatorBytesInPerSec 1 秒あたりのレプリケーターによって処理された平均バイト数。MSK Replicator によって処理されるデータは、MSK Replicator が受け取るすべてのデータで構成されます。これには、ターゲットクラスターにレプリケートされたデータと、データが元の同じトピックにコピーされないように MSK Replicator によってフィルタリングされたデータ (レプリケーターが同一トピック名設定で設定されている場合のみ) が含まれます。レプリケーターが「プレフィクス付き」トピック名設定で設定されている場合、MSK Replicator によってデータがフィルタリングされないため、ReplicatorBytesInPerSecReplicatorThroughput メトリクスの両方が同じ値になります。 ReplicatorName BytesPerSecond ReplicatorName 合計
パフォーマンス ReplicatorThroughput 1 秒あたりのレプリケートされた平均バイト数。トピックの ReplicatorThroughput が低下した場合は、KafkaClusterPingSuccessCount と AuthError メトリクスをチェックして、レプリケーターがクラスターと通信できることを確認してから、クラスターメトリクスをチェックしてクラスターがダウンしていないことを確認します。 ReplicatorName BytesPerSecond パーティション 合計
ReplicatorName、Topic BytesPerSecond パーティション 合計
パフォーマンス ReplicationFailures レプリケーションの失敗の数。正常なレプリケーションの場合は 0 にする必要があります。ゼロ以外の場合は、メッセージサイズの制限、タイムスタンプ違反、またはレコードバッチサイズの問題を示している可能性があります。 ReplicatorName カウント 合計
デバッグ AuthError 1 秒あたりの認証に失敗した接続の数。このメトリクスが 0 より大きい場合は、レプリケーターのサービス実行ロールポリシーが有効かどうかを確認し、クラスターのアクセス許可に対して拒否アクセス許可が設定されていないことを確認できます。clusterAlias ディメンションに基づいて、ソースクラスターまたはターゲットクラスターで認証エラーが発生しているかどうかを識別できます。 ReplicatorName、ClusterAlias カウント ワーカー 合計
デバッグ ThrottleTime クラスター上でブローカーによってリクエストがスロットリングされた平均時間 (ミリ秒単位)。MSK レプリケーターがクラスターを圧迫しないように、スロットリングを設定します。このメトリクスが 0 で、replicationLatency が高くなく、replicatorThroughput が期待どおりであれば、スロットリングは期待どおりに機能しています。このメトリクスが 0 より大きい場合は、それに応じてスロットリングを調整できます。 ReplicatorName、ClusterAlias ミリ秒 ワーカー 最大値
デバッグ ReplicatorFailure レプリケーターで発生している障害の数。 ReplicatorName カウント 合計
デバッグ KafkaClusterPingSuccessCount

Kafka クラスターへのレプリケーター接続の正常性を示します。この値が 1 の場合、接続は正常です。値が 0 またはデータポイントがない場合、接続は異常です。値が 0 の場合は、Kafka クラスターのネットワークまたは IAM アクセス許可設定を確認してください。ClusterAlias ディメンションに基づいて、このメトリクスがソースクラスター用かターゲットクラスター用かを識別できます。

ReplicatorName、ClusterAlias カウント 合計
コンシューマーグループ ConsumerGroupCount 同期されているコンシューマーグループの数。予想されるコンシューマーグループと一致することを確認します。 ReplicatorName カウント 合計
コンシューマーグループ ConsumerGroupOffsetSyncFailure コンシューマーグループのオフセット同期失敗の数。0 にする必要があります。0 より大きい場合は、コンシューマーグループがアクティブであることを確認し、アクセス許可を確認します。 ReplicatorName カウント 合計
コンシューマーグループ OffsetLag (MSK クラスター) MSK ターゲットクラスターのパーティションレベルのコンシューマーラグ。OffsetLag (非 MSK クラスター) と比較して、遅延が等しいことを確認します。 パーティション カウント 合計
コンシューマーグループ OffsetLag (非 MSK クラスター) セルフマネージド (MSK 以外) ソースクラスターのパーティションレベルのコンシューマーラグ。OffsetLag (MSK クラスター) と比較します。 パーティション カウント 合計