翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ターゲットクラスターリージョンhttps://console.aws.amazon.com/cloudwatch/ReplicationLatency
、、MessageLag
、および のメトリクスを、各 Amazon MSK Replicator のReplicatorThroughput
トピックおよび集計レベルで表示できます。メトリクスは、AWS「/Kafka」名前空間ReplicatorNameの の下に表示されます。また、ReplicatorFailure
、AuthError
、ThrottleTime
メトリクスを参照して、問題がないかを確認することもできます。
MSK コンソールには、各MSKレプリケーターの CloudWatch メトリクスのサブセットが表示されます。コンソールの [レプリケーター] リストから、レプリケーターの名前を選択し、[モニタリング] タブを選択します。
MSK レプリケーターメトリクス
次のメトリクスは、 MSK レプリケーターのパフォーマンスまたは接続メトリクスを示しています。
AuthError メトリクスは、トピックレベルの認証エラーをカバーしません。MSK レプリケーターのトピックレベルの認証エラーをモニタリングするには、レプリケーターの ReplicationLatency メトリクスとソースクラスターのトピックレベルのメトリクスをモニタリングします MessagesInPerSec。トピックが 0 に ReplicationLatency ドロップされたが、トピックにまだデータが生成されている場合は、レプリケーターにトピックに対する認証の問題があることを示します。レプリケーターのサービス実行IAMロールに、トピックにアクセスするための十分なアクセス許可があることを確認します。
メトリクスのタイプ | メトリクス | 説明 | ディメンション | [単位] | 未加工メトリクスの細分性 | 未加工メトリクスの集計統計 |
---|---|---|---|---|---|---|
パフォーマンス | ReplicationLatency | ソースクラスターからターゲットクラスターにレコードをレプリケートするのにかかる時間。ソースでレコードが作成されてからターゲットにレプリケートされるまでの時間。 ReplicationLatency が増加する場合は、クラスターにレプリケーションをサポートするのに十分なパーティションがあるかどうかを確認します。パーティション数が少なすぎて高スループットに対応できない場合、レプリケーションのレイテンシーが高くなる可能性があります。 | ReplicatorName | ミリ秒 | パーティション | 最大値 |
ReplicatorName、トピック | ミリ秒 | パーティション | 最大値 | |||
パフォーマンス | MessageLag | MSK レプリケーターとソースクラスター間の同期をモニタリングします。 は、ソースクラスターに生成されたメッセージとレプリケーターが消費したメッセージの間の遅延 MessageLag を示します。ソースクラスターとターゲットクラスター間の遅延ではありません。ソースクラスターが使用不可または中断された場合でも、レプリケーターはターゲットクラスターへの消費したメッセージの書き込みを完了させます。停止後、 はレプリケーターがソースクラスターの背後にあるメッセージの数を示す増加 MessageLag を示し、メッセージ数が 0 になるまでモニタリングでき、レプリケーターがソースクラスターに追いついたことを示します。 | ReplicatorName | Count | パーティション | Sum |
ReplicatorName、トピック | Count | パーティション | Sum | |||
パフォーマンス | ReplicatorBytesInPerSec | 1 秒あたりのレプリケーターによって処理された平均バイト数。MSK レプリケーターによって処理されるデータは、MSKレプリケーターが受け取るすべてのデータで構成されます。これには、ターゲットクラスターにレプリケートされたデータとMSK、レプリケーターによってフィルタリングされたデータ (レプリケーターが同一のトピック名設定で設定されている場合のみ) が含まれ、データが元の同じトピックにコピーされるのを防ぎます。レプリケーターが「プレフィックス付き」トピック名設定で設定されている場合、MSKレプリケーターによってデータがフィルタリングされないため、 ReplicatorBytesInPerSec と ReplicatorThroughput メトリクスの両方が同じ値になります。 |
ReplicatorName | BytesPerSecond | ReplicatorName | Sum |
パフォーマンス | ReplicatorThroughput | 1 秒あたりのレプリケートされた平均バイト数。がトピックに対して ReplicatorThroughput を削除した場合は、 KafkaClusterPingSuccessCount および AuthError メトリクスをチェックしてレプリケーターがクラスターと通信できることを確認し、クラスターメトリクスをチェックしてクラスターがダウンしていないことを確認します。 | ReplicatorName | BytesPerSecond | パーティション | Sum |
ReplicatorName、トピック | BytesPerSecond | パーティション | Sum | |||
デバッグ | AuthError | 1 秒あたりの認証に失敗した接続の数。このメトリクスが 0 より大きい場合は、レプリケーターのサービス実行ロールポリシーが有効かどうかを確認し、クラスターのアクセス許可に対して拒否アクセス許可が設定されていないことを確認できます。 clusterAlias ディメンションに基づいて、ソースクラスターまたはターゲットクラスターで認証エラーが発生しているかどうかを特定できます。 | ReplicatorName, ClusterAlias | Count | ワーカー | Sum |
デバッグ | ThrottleTime | クラスター上でブローカーによってリクエストがスロットリングされた平均時間 (ミリ秒単位)。MSK レプリケーターがクラスターに負担をかけないように、スロットリングを設定します。このメトリクスが 0 replicationLatency で、高くなく、期待 replicatorThroughput どおりに動作している場合、スロットリングは期待どおりに動作します。このメトリクスが 0 より大きい場合は、それに応じてスロットリングを調整できます。 | ReplicatorName, ClusterAlias | ミリ秒 | ワーカー | 最大値 |
デバッグ | ReplicatorFailure | レプリケーターで発生している障害の数。 | ReplicatorName | Count | Sum | |
デバッグ | KafkaClusterPingSuccessCount |
Kafka クラスターへのレプリケーター接続の正常性を示します。この値が 1 の場合、接続は正常です。値が 0 またはデータポイントがない場合、接続は異常です。値が 0 の場合、Kafka クラスターのネットワークまたはIAMアクセス許可の設定を確認できます。 ClusterAlias ディメンションに基づいて、このメトリクスがソースクラスター用かターゲットクラスター用かを特定できます。 |
ReplicatorName, ClusterAlias | Count | Sum |