Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Monitoreo y depuración de trabajo
Puede recopilar métricas acerca de losAWS Glue trabajos de y visualizarlas en las CloudWatch consolas deAWS Glue y Amazon para identificar y solucionar problemas. La generación de perfiles en sus trabajos de AWS Glue requiere los siguientes pasos:
Habilite la opción Job metrics (Métricas del trabajo) en la definición de trabajo. Puede habilitar la creación de perfiles en la consola de AWS Glue o como parámetro del trabajo. Para obtener más información, consulte Definición de propiedades de trabajo para trabajos de Spark o Parámetros de los trabajos de AWS Glue.
Confirme que el script de trabajo inicializa
GlueContext
. Por ejemplo, el siguiente fragmento de script inicializaGlueContext
y muestra en qué parte del script se sitúa el código con perfil. Este formato general se usa en las situaciones de depuración siguientes.import sys from awsglue.transforms import * from awsglue.utils import getResolvedOptions from pyspark.context import SparkContext from awsglue.context import GlueContext from awsglue.job import Job import time ## @params: [JOB_NAME] args = getResolvedOptions(sys.argv, ['JOB_NAME']) sc = SparkContext() glueContext = GlueContext(sc) spark = glueContext.spark_session job = Job(glueContext) job.init(args['JOB_NAME'], args) ... ...
code-to-profile
... ... job.commit()Ejecute el trabajo.
Visualice las métricas en la consola de AWS Glue e identifique las métricas que están fuera de lo normal de
driver
oexecutor
.Acote la causa raíz mediante la métrica identificada.
Opcionalmente, confirme la causa raíz mediante el flujo de registros del controlador o el ejecutor de trabajo identificado.