Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Riferimento per le metriche
I parametri seguenti descrivono i parametri delle prestazioni o delle connessioni per il replicatore MSK.
AuthError le metriche non coprono gli errori di autenticazione a livello di argomento. Per monitorare gli errori di autenticazione a livello di argomento di MSK Replicator, monitorate le metriche di Replicator e le metriche a livello di argomento del ReplicationLatency cluster di origine,. MessagesInPerSec Se un argomento viene ReplicationLatency ridotto a 0 ma l'argomento contiene ancora dati in corso, significa che il Replicator ha un problema di autenticazione con l'argomento. Verifica che il ruolo IAM per l'esecuzione del servizio del Replicator disponga di autorizzazioni sufficienti per accedere all'argomento.
| Tipo di metrica | Metrica | Description | Dimensioni | Unità | Granularità dei parametri grezzi | Statistiche di aggregazione dei parametri grezzi |
|---|---|---|---|---|---|---|
| Performance | ReplicationLatency | Tempo impiegato dai record per la replica dal cluster di origine a quello di destinazione; tempo che intercorre tra l'ora di produzione di un record all'origine e l'ora di replica alla destinazione. Se ReplicationLatency aumenta, controlla se i cluster hanno partizioni sufficienti per supportare la replica. Una latenza di replica elevata può verificarsi quando il numero di partizioni è troppo basso per una velocità di trasmissione effettiva elevata. | ReplicatorName | Millisecondi | Partizione | Massimo |
| ReplicatorName, Argomento | Millisecondi | Partizione | Massimo | |||
| Performance | MessageLag | Monitora la sincronizzazione tra MSK Replicator e il cluster di origine. MessageLag indica il ritardo tra i messaggi prodotti nel cluster di origine e i messaggi consumati dal replicatore. Non è il ritardo tra il cluster di origine e quello di destinazione. Anche se il cluster di origine non è disponibile/interrotto, il replicatore finirà di scrivere il messaggio che ha utilizzato nel cluster di destinazione. Dopo un'interruzione, MessageLag mostra un aumento che indica il numero di messaggi che il replicatore si trova dietro al cluster di origine e questo può essere monitorato fino a quando il numero di messaggi non raggiunge 0, a dimostrazione del fatto che il replicatore ha raggiunto il cluster di origine. | ReplicatorName | Conteggio | Partizione | Somma |
| ReplicatorName, Argomento | Conteggio | Partizione | Somma | |||
| Performance | ReplicatorBytesInPerSec | Numero medio di byte elaborati dal replicatore al secondo. I dati elaborati da MSK Replicator sono costituiti da tutti i dati ricevuti da MSK Replicator, inclusi i dati replicati nel cluster di destinazione e i dati filtrati da MSK Replicator (solo se il Replicator è configurato con la configurazione del nome dell'argomento identico) per evitare che i dati vengano copiati nuovamente sullo stesso argomento da cui hanno avuto origine. Se il Replicator è configurato con la configurazione del nome dell'argomento «con prefisso», entrambe le ReplicatorBytesInPerSec ReplicatorThroughput metriche avranno lo stesso valore in quanto nessun dato verrà filtrato da MSK Replicator. |
ReplicatorName | BytesPerSecond | ReplicatorName | Somma |
| Performance | ReplicatorThroughput | Numero medio di byte replicati al secondo. Se si ReplicatorThroughput tratta di un argomento, di un controllo KafkaClusterPingSuccessCount e di AuthError parametri per garantire che il Replicator sia in grado di comunicare con i cluster, controllate i parametri del cluster per assicurarvi che il cluster non sia inattivo. | ReplicatorName | BytesPerSecond | Partizione | Somma |
| ReplicatorName, Argomento | BytesPerSecond | Partizione | Somma | |||
| Performance | ReplicationFailures | Numero di errori di replica. Dovrebbe essere 0 per una replica corretta. Un valore diverso da zero può indicare limitazioni alla dimensione dei messaggi, violazioni del timestamp o problemi relativi alla dimensione dei batch di record. | ReplicatorName | Conteggio | Somma | |
| Esegui il debug | AuthError | Il numero di connessioni con autenticazione non riuscita al secondo. Se questo parametro è superiore a 0, puoi verificare se la policy del ruolo di esecuzione del servizio per il replicatore è valida e assicurarti che non siano impostate autorizzazioni di rifiuto per le autorizzazioni del cluster. In base alla dimensione clusterAlias, è possibile verificare se è il cluster di origine o di destinazione a presentare errori di autenticazione. | ReplicatorName, ClusterAlias | Conteggio | Worker | Somma |
| Esegui il debug | ThrottleTime | Il tempo medio, espresso in millisecondi, per il quale i broker del cluster hanno limitato la larghezza di banda della rete per una richiesta. Imposta la limitazione della larghezza di banda della rete per evitare che il replicatore MSK sovraccarichi il cluster. Se questo parametro è 0, replicationLatency non è elevato e replicatorThroughput è come previsto, allora la limitazione della larghezza di banda della rete funziona come previsto. Se questo parametro è superiore a 0, è possibile regolare la limitazione della larghezza di banda della rete di conseguenza. | ReplicatorName, ClusterAlias | Millisecondi | Worker | Massimo |
| Esegui il debug | ReplicatorFailure | Numero di errori riscontrati dal replicatore. | ReplicatorName | Conteggio | Somma | |
| Esegui il debug | KafkaClusterPingSuccessCount | Indica lo stato della connessione del replicatore al cluster Kafka. Se questo valore è 1, la connessione è integra. Se il valore è 0 o nessun punto di dati, la connessione non è integra. Se il valore è 0, puoi controllare le impostazioni di rete o di autorizzazione IAM per il cluster Kafka. In base alla ClusterAlias dimensione, è possibile identificare se questa metrica si riferisce al cluster di origine o di destinazione. |
ReplicatorName, ClusterAlias | Conteggio | Somma | |
| Gruppo di consumatori | ConsumerGroupCount | Numero di gruppi di consumatori sincronizzati. Verifica che corrisponda ai gruppi di consumatori previsti. | ReplicatorName | Conteggio | Somma | |
| Gruppo di consumatori | ConsumerGroupOffsetSyncFailure | Numero di errori di sincronizzazione dell'offset per gruppi di consumatori. Dovrebbe essere 0. Se maggiore di 0, controlla che i gruppi di consumatori siano attivi e verifica le autorizzazioni. | ReplicatorName | Conteggio | Somma | |
| Gruppo di consumatori | OffsetLag (Cluster MSK) | Ritardo dei consumatori a livello di partizione sul cluster di destinazione MSK. Confronta con OffsetLag (cluster non MSK) per verificare che il ritardo sia uguale. | Partizione | Conteggio | Somma | |
| Gruppo di consumatori | OffsetLag (Cluster non MSK) | Consumer lag a livello di partizione sul cluster di origine autogestito (non MSK). Confronta con (MSK Cluster). OffsetLag | Partizione | Conteggio | Somma |