Monitoraggio degli endpoint interattivi - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio degli endpoint interattivi

Con Amazon EMR nella EKS versione 6.10 e successive, gli endpoint interattivi emettono parametri CloudWatch Amazon per il monitoraggio e la risoluzione dei problemi delle operazioni del ciclo di vita del kernel. Le metriche vengono attivate da client interattivi, come Studio o notebook Jupyter ospitati autonomamente. EMR A ciascuna delle operazioni supportate dagli endpoint interattivi sono associati parametri. Le operazioni sono modellate come dimensioni per ogni parametro, come mostrato nella tabella seguente. Le metriche emesse dagli endpoint interattivi sono visibili in un namespace personalizzato, nel tuo account. EMRContainers

Parametro Descrizione Unità

RequestCount

Numero cumulativo di richieste di un'operazione elaborate dall'endpoint interattivo.

Conteggio

RequestLatency

Il tempo trascorso tra l'arrivo di una richiesta all'endpoint interattivo e l'invio di una risposta da parte dell'endpoint interattivo.

Millisecondi

4 XXError

Emesso quando una richiesta di operazione genera un errore 4xx durante l'elaborazione.

Conteggio

5 XXError

Emesso quando una richiesta di operazione genera un errore 5xx lato server.

Conteggio

KernelLaunchSuccess

Applicabile solo per l' CreateKernel operazione. Indica il numero cumulativo di avvii del kernel riusciti fino alla presente richiesta (inclusa).

Conteggio

KernelLaunchFailure

Applicabile solo per l' CreateKernel operazione. Indica il numero cumulativo di errori di avvio del kernel fino alla presente richiesta (inclusa).

Conteggio

A ogni parametro di endpoint interattivo sono allegate le seguenti dimensioni:

  • ManagedEndpointId: identificatore dell'endpoint interattivo

  • OperationName: l'operazione attivata dal client interattivo

I valori possibili della dimensione OperationName sono riportati nella tabella seguente:

operationName Descrizione dell'operazione

CreateKernel

Per richiedere che l'endpoint interattivo avvii un kernel.

ListKernels

Per richiedere che l'endpoint interattivo elenchi i kernel che sono stati avviati in precedenza utilizzando lo stesso token di sessione.

GetKernel

Per richiedere che l'endpoint interattivo ottenga i dettagli su un kernel specifico che è stato avviato in precedenza.

ConnectKernel

Per richiedere che l'endpoint interattivo stabilisca la connettività tra il client del notebook e il kernel.

ConfigureKernel

Per pubblicare %%configure magic request su un kernel pyspark.

ListKernelSpecs

Per richiedere che l'endpoint elenchi le specifiche di kerner disponibili.

GetKernelSpec

Per richiedere che l'endpoint interattivo ottenga le specifiche di kernel di un kernel specifico che è stato avviato in precedenza.

GetKernelSpecResource

Per richiedere che l'endpoint interattivo ottenga risorse specifiche associate alle specifiche di kernel avviate in precedenza.

Esempi

Per accedere al numero totale di kernel avviati per un endpoint interattivo in un determinato giorno:

  1. Seleziona lo spazio dei nomi personalizzato: EMRContainers

  2. Seleziona il tuo ManagedEndpointId, OperationName – CreateKernel

  3. Il parametro RequestCount con la statistica SUM e il periodo 1 day fornirà tutte le richieste di avvio di kernel effettuate nelle ultime 24 ore.

  4. KernelLaunchSuccess metric with statistic SUM and period 1 day fornirà tutte le richieste di avvio del kernel effettuate con successo nelle ultime 24 ore.

Per accedere al numero totale di errori relativi a kernel per un endpoint interattivo in un determinato giorno:

  1. Seleziona lo spazio dei nomi personalizzato: EMRContainers

  2. Seleziona il tuo ManagedEndpointId, OperationName – CreateKernel

  3. Il parametro KernelLaunchFailure con la statistica SUM e il periodo 1 day fornirà tutte le richieste di avvio di kernel non riuscite effettuate nelle ultime 24 ore. Puoi anche selezionare il parametro 4XXError e 5XXError per sapere che tipo di errore di avvio di kernel si è verificato.