Surveillance à l'aide de métriques d'observabilité AWS Glue - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance à l'aide de métriques d'observabilité AWS Glue

Note

Les métriques d’observabilité AWS Glue sont disponibles dans AWS Glue 4.0 et les versions ultérieures.

Utilisez les métriques d'observabilité AWS Glue pour générer des informations sur ce qui se passe au sein de votre AWS Glue pour les tâches Apache Spark afin d'améliorer le triage et l'analyse des problèmes. Les métriques d'observabilité sont visualisées via des tableaux de bord Amazon CloudWatch et peuvent être utilisées pour analyser les causes racines des erreurs et pour diagnostiquer les goulots d'étranglement en matière de performance. Vous pouvez réduire le temps passé à déboguer les problèmes à l'échelle afin de vous concentrer sur leur résolution plus rapide et plus efficace.

AWS GlueL'observabilité fournit des Amazon CloudWatch métriques classées dans les quatre groupes suivants :

  • Fiabilité (par exemple, classes d'erreurs) : identifier facilement les motifs d'échec les plus courants sur une plage de temps donnée que vous souhaiterez remédier.

  • Performance (par exemple, asymétrie) : identifier un goulot d'étranglement en matière de performance et appliquer des techniques de réglage. Par exemple, lorsque vos performances sont dégradées en raison de l'asymétrie des tâches, vous pouvez activer l'Exécution adaptative des requêtes Spark et affiner le seuil de jointure asymétrique.

  • Débit (c'est-à-dire le débit par source/récepteur) : surveiller les tendances en matière de lecture et d'écriture de données. Vous pouvez également configurer des Amazon CloudWatch alarmes en cas d'anomalie.

  • Utilisation des ressources (c'est-à-dire utilisation du personnel, de la mémoire et du disque) : trouver de manière efficace les tâches dont l'utilisation des capacités est faible. Vous souhaiterez peut-être activer la mise à l'échelle automatique AWS Glue pour ces tâches.

Mise en route avec les métriques d'observabilité AWS Glue

Note

Les nouvelles métriques sont disponibles par défaut dans la console AWS Glue Studio.

Pour configurer les métriques d’observabilité dans AWS Glue Studio :
  1. Connectez-vous à la console AWS Glue et choisissez les tâches ETL dans le menu de la console.

  2. Choisissez une tâche en cliquant sur le nom de la tâche dans la section Vos tâches.

  3. Sélectionnez l'onglet Job details (Détails de la tâche).

  4. Faites défiler l'écran vers le bas et choisissez Propriétés avancées, puis Metriques d'observabilité de la tâche.

    La capture d'écran montre l'onglet Détails de la tâche Propriétés avancées. L'option Metriques d'observabilité de la tâche est mise en surbrillance.
Pour activer les métriques AWS Glue d'observabilité à l'aide AWS CLI de :
  • Ajoutez à la carte --default-arguments la valeur clé suivante dans le fichier JSON d'entrée :

    --enable-observability-metrics, true

Utiliser l'observabilité AWS Glue

Les métriques AWS Glue d'observabilité étant fournies via Amazon CloudWatch, vous pouvez utiliser la Amazon CloudWatch console AWS CLI, le SDK ou l'API pour interroger les points de données des métriques d'observabilité. Consultez la rubrique Utilisation de l’observabilité Glue pour surveiller l’utilisation des ressources afin de réduire les coûts pour un exemple de cas d’utilisation des métriques d’observabilité AWS Glue.

Utilisation de l'AWS Glueobservabilité dans la console Amazon CloudWatch

Pour interroger et visualiser les métriques dans la Amazon CloudWatch console, procédez comme suit :
  1. Ouvrez la Amazon CloudWatch console et choisissez Toutes les mesures.

  2. Sous Espaces de noms personnalisés, sélectionnez AWS Glue.

  3. Choisissez les métriques d'observabilité de la tâche, les métriques d'observabilité par source ou les métriques d'observabilité par récepteur.

  4. Recherchez le nom de la métrique, le nom de la tâche, l'ID d'exécution de la tâche spécifiques, puis sélectionnez-les.

  5. Sous l'onglet Métriques sous forme de graphique, configurez vos statistiques, périodes et autres options préférées.

    La capture d'écran montre la Amazon CloudWatch console et le graphique des métriques.
Pour interroger une métrique d'observabilité à l'aide AWS CLI de :
  1. Créez un fichier JSON de définition de métrique et remplacez your-Glue-job-name et your-Glue-job-run-id par les vôtres.

    $ cat multiplequeries.json [ { "Id": "avgWorkerUtil_0", "MetricStat": { "Metric": { "Namespace": "Glue", "MetricName": "glue.driver.workerUtilization", "Dimensions": [ { "Name": "JobName", "Value": "<your-Glue-job-name-A>" }, { "Name": "JobRunId", "Value": "<your-Glue-job-run-id-A>" }, { "Name": "Type", "Value": "gauge" }, { "Name": "ObservabilityGroup", "Value": "resource_utilization" } ] }, "Period": 1800, "Stat": "Minimum", "Unit": "None" } }, { "Id": "avgWorkerUtil_1", "MetricStat": { "Metric": { "Namespace": "Glue", "MetricName": "glue.driver.workerUtilization", "Dimensions": [ { "Name": "JobName", "Value": "<your-Glue-job-name-B>" }, { "Name": "JobRunId", "Value": "<your-Glue-job-run-id-B>" }, { "Name": "Type", "Value": "gauge" }, { "Name": "ObservabilityGroup", "Value": "resource_utilization" } ] }, "Period": 1800, "Stat": "Minimum", "Unit": "None" } } ]
  2. Exécutez la commande get-metric-data :

    $ aws cloudwatch get-metric-data --metric-data-queries file: //multiplequeries.json \ --start-time '2023-10-28T18: 20' \ --end-time '2023-10-28T19: 10' \ --region us-east-1 { "MetricDataResults": [ { "Id": "avgWorkerUtil_0", "Label": "<your-label-for-A>", "Timestamps": [ "2023-10-28T18:20:00+00:00" ], "Values": [ 0.06718750000000001 ], "StatusCode": "Complete" }, { "Id": "avgWorkerUtil_1", "Label": "<your-label-for-B>", "Timestamps": [ "2023-10-28T18:50:00+00:00" ], "Values": [ 0.5959183673469387 ], "StatusCode": "Complete" } ], "Messages": [] }

Métriques d'observabilité

AWS GlueL'observabilité établit des profils et envoie les métriques suivantes Amazon CloudWatch toutes les 30 secondes, et certaines de ces métriques peuvent être visibles sur la page de surveillance des AWS Glue Studio Job Runs.

Métrique Description Catégorie
glue.driver.skewness.stage

Catégorie de métrique : job_performance

Asymétrie de l’exécution des étapes Spark : cette métrique capture l’asymétrie d’exécution, qui peut être causée par une asymétrie des données d’entrée ou par une transformation (par exemple, une jointure asymétrique). Les valeurs de cette métrique se situent dans l’intervalle [0, infini], où 0 signifie que le rapport entre le temps d’exécution maximum et médian des tâches, parmi toutes les tâches de l’étape, est inférieur à un certain facteur d’asymétrie d’étape. Le facteur d’asymétrie d’étape par défaut est « 5 » et il peut être modifié via la configuration Spark : spark.metrics.conf.driver.source.glue.jobPerformance.skewnessFactor

Une valeur d’asymétrie d’étape de 1 signifie que le rapport est le double du facteur d’asymétrie d’étape.

La valeur de l’asymétrie d’étape est mise à jour toutes les 30 secondes pour refléter l’asymétrie actuelle. La valeur en fin d’étape reflète l’asymétrie finale de l’étape.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (job_performance)

Statistiques valides : moyenne, maximum, minimum, centile

Unité : nombre

job_performance
glue.driver.skewness.job

Catégorie de métrique : job_performance

L’asymétrie de la tâche est la moyenne pondérée de l’asymétrie des étapes de la tâche. La moyenne pondérée donne plus de poids aux étapes dont l’exécution prend plus de temps. Cela permet d’éviter le cas particulier où une étape très asymétrique s’exécute en réalité pendant un temps très court par rapport aux autres étapes (et donc son asymétrie n’est pas significative pour la performance globale de la tâche et ne mérite pas l’effort de tenter de corriger son asymétrie).

Cette métrique est mise à jour à la fin de chaque étape. La dernière valeur reflète donc l’asymétrie globale réelle de la tâche.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (job_performance)

Statistiques valides : moyenne, maximum, minimum, centile

Unité : nombre

job_performance
glue.succeed.ALL

Catégorie de métrique : erreur

Nombre total d’exécutions de tâches réussies, pour compléter le tableau des catégories d’échec

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (nombre) et ObservabilityGroup (erreur)

Statistiques valides : SUM

Unité : nombre

error
glue.error.ALL

Catégorie de métrique : erreur

Nombre total d’erreurs d’exécution de tâche, pour compléter le tableau des catégories d’échec

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (nombre) et ObservabilityGroup (erreur)

Statistiques valides : SUM

Unité : nombre

error
glue.error.[error category]

Catégorie de métrique : erreur

Il s’agit en fait d’un ensemble de métriques, qui sont mises à jour uniquement lorsqu’une exécution de tâche échoue. La catégorisation des erreurs facilite le triage et le débogage. Lorsqu’une exécution de tâche échoue, l’erreur à l’origine de l’échec est catégorisée et la métrique de la catégorie d’erreur correspondante est définie à 1. Cela permet d’effectuer une analyse des échecs au fil du temps, ainsi qu’une analyse des erreurs sur l’ensemble des tâches, afin d’identifier les catégories d’échec les plus courantes et de commencer à y remédier. AWS Glue compte 28 catégories d’erreur, dont OUT_OF_MEMORY (manque de mémoire) (pilote et exécuteur), PERMISSION (autorisation), SYNTAX (syntaxe) et THROTTLING (limitation). Les catégories d’erreur incluent également les catégories d’erreur COMPILATION, LAUNCH et TIMEOUT.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (nombre) et ObservabilityGroup (erreur)

Statistiques valides : SUM

Unité : nombre

error
glue.driver.workerUtilization

Catégorie de métrique : resource_utilization

Le pourcentage des travailleurs affectés qui sont réellement utilisés. Si ce n’est pas bon, l’autoscaling peut vous aider.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne, maximum, minimum, centile

Unité : pourcentage

resource_utilization
glue.driver.memory.heap.[available | used]

Catégorie de métrique : resource_utilization

Tas disponible/utilisé par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation de la mémoire, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à la mémoire.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : octets

resource_utilization
glue.driver.memory.heap.used.percentage

Catégorie de métrique : resource_utilization

Tas utilisé (%) par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation de la mémoire, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à la mémoire.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.driver.memory.non-heap.[available | used]

Catégorie de métrique : resource_utilization

Mémoire hors tas disponible/utilisée par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation de la mémoire, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à la mémoire.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : octets

resource_utilization
glue.driver.memory.non-heap.used.percentage

Catégorie de métrique : resource_utilization

Mémoire hors tas utilisée (%) par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation de la mémoire, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à la mémoire.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.driver.memory.total.[available | used]

Catégorie de métrique : resource_utilization

Mémoire totale disponible/utilisée par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation de la mémoire, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à la mémoire.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : octets

resource_utilization
glue.driver.memory.total.used.percentage

Catégorie de métrique : resource_utilization

Mémoire totale utilisée (%) par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation de la mémoire, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à la mémoire.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.ALL.memory.heap.[available | used]

Catégorie de métrique : resource_utilization

Tas disponible/utilisé par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : octets

resource_utilization
glue.ALL.memory.heap.used.percentage

Catégorie de métrique : resource_utilization

Tas utilisé (%) par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.ALL.memory.non-heap.[available | used]

Catégorie de métrique : resource_utilization

Mémoire hors tas disponible/utilisée par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : octets

resource_utilization
glue.ALL.memory.non-heap.used.percentage

Catégorie de métrique : resource_utilization

Mémoire hors tas /utilisée (%) par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.ALL.memory.total.[available | used]

Catégorie de métrique : resource_utilization

Mémoire totale disponible/utilisée par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : octets

resource_utilization
glue.ALL.memory.total.used.percentage

Catégorie de métrique : resource_utilization

Mémoire totale utilisée (%) par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.driver.disk.[available_GB | used_GB]

Catégorie de métrique : resource_utilization

Espace disque disponible/utilisé par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation du disque, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à un espace disque insuffisant.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : gigaoctets

resource_utilization
glue.driver.disk.used.percentage]

Catégorie de métrique : resource_utilization

Espace disque disponible/utilisé par le pilote pendant l’exécution de la tâche. Cela aide à comprendre les tendances d’utilisation du disque, particulièrement au fil du temps, ce qui peut contribuer à éviter des échecs potentiels, en plus de déboguer les échecs liés à un espace disque insuffisant.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.ALL.disk.[available_GB | used_GB]

Catégorie de métrique : resource_utilization

Espace disque disponible/utilisé par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : gigaoctets

resource_utilization
glue.ALL.disk.used.percentage

Catégorie de métrique : resource_utilization

Espace disque disponible/utilisé/utilisé (%) par les exécuteurs. ALL signifie tous les exécuteurs.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (gauge) et ObservabilityGroup (resource_utilization)

Statistiques valides : moyenne

Unité : pourcentage

resource_utilization
glue.driver.bytesRead

Catégorie de métrique : débit

Nombre d’octets lus par source d’entrée lors de cette exécution de tâche, ainsi que pour TOUTES les sources. Cela aide à comprendre le volume de données et ses variations au fil du temps, ce qui est utile pour résoudre des problèmes tels que l’asymétrie des données.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (jauge), ObservabilityGroup (resource_utilization) et la source (emplacement des données source)

Statistiques valides : moyenne

Unité : octets

débit
glue.driver.[recordsRead | filesRead]

Catégorie de métrique : débit

Nombre d’enregistrements/fichiers lus par source d’entrée lors de cette exécution de tâche, ainsi que pour TOUTES les sources. Cela aide à comprendre le volume de données et ses variations au fil du temps, ce qui est utile pour résoudre des problèmes tels que l’asymétrie des données.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (jauge), ObservabilityGroup (resource_utilization) et la source (emplacement des données source)

Statistiques valides : moyenne

Unité : nombre

débit
glue.driver.partitionsRead

Catégorie de métrique : débit

Nombre de partitions lues par source d’entrée Amazon S3 dans cette exécution de tâche, ainsi que pour TOUTES les sources.

Dimensions valides : JobName (le nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), le type (jauge), ObservabilityGroup (resource_utilization) et la source (emplacement des données source)

Statistiques valides : moyenne

Unité : nombre

débit
glue.driver.bytesWrittten

Catégorie de métrique : débit

Nombre d’octets écrits par récepteur de sortie dans cette exécution de tâche, ainsi que pour TOUS les récepteurs. Cela aide à comprendre le volume de données et son évolution au fil du temps, ce qui est utile pour résoudre des problèmes tels que l’asymétrie de traitement.

Dimensions valides : JobName (nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), Type (gauge), (resource_utilization) et Sink ObservabilityGroup (emplacement des données du récepteur)

Statistiques valides : moyenne

Unité : octets

débit
glue.driver.[recordsWritten | filesWritten]

Catégorie de métrique : débit

Nombre d’enregistrements/fichiers écrits par récepteur de sortie dans cette exécution de tâche, ainsi que pour TOUS les récepteurs. Cela aide à comprendre le volume de données et son évolution au fil du temps, ce qui est utile pour résoudre des problèmes tels que l’asymétrie de traitement.

Dimensions valides : JobName (nom du AWS Glue Job), JobRunId (l' JobRun ID ou ALL), Type (gauge), (resource_utilization) et Sink ObservabilityGroup (emplacement des données du récepteur)

Statistiques valides : moyenne

Unité : nombre

débit

Catégories d’erreur

Catégories d’erreur Description
COMPILATION_ERROR Des erreurs surviennent lors de la compilation du code Scala.
CONNECTION_ERROR Des erreurs surviennent lors de la connexion à un service/à un hôte distant/à un service de base de données, etc.
DISK_NO_SPACE_ERROR

Des erreurs surviennent lorsqu’il n’y a plus d’espace disponible sur le disque du pilote/de l’exécuteur.

OUT_OF_MEMORY_ERROR Des erreurs surviennent lorsqu’il n’y a plus d’espace disponible dans la mémoire du pilote/de l’exécuteur.
IMPORT_ERROR Des erreurs surviennent lors de l’importation de dépendances.
INVALID_ARGUMENT_ERROR Des erreurs surviennent lorsque les arguments d'entrée sont invalides/illégaux.
PERMISSION_ERROR Les erreurs surviennent en cas d’absence d’autorisation d’accès au service, aux données, etc.
RESOURCE_NOT_FOUND_ERROR

Des erreurs surviennent lorsque les données, l’emplacement, etc. ne sont pas disponibles.

QUERY_ERROR Des erreurs surviennent lors de l’exécution de requêtes SQL dans Spark.
SYNTAX_ERROR Des erreurs surviennent lorsqu’il y a une erreur de syntaxe dans le script.
THROTTLING_ERROR Des erreurs surviennent lorsqu’une limite de simultanéité de service est atteinte ou qu’une limitation de quota de service est dépassée.
DATA_LAKE_FRAMEWORK_ERROR Des erreurs surviennent à partir d’un environnement de lac de données pris en charge nativement par AWS Glue, comme Hudi, Iceberg, etc.
UNSUPPORTED_OPERATION_ERROR Des erreurs surviennent lors d’une opération non prise en charge.
RESOURCES_ALREADY_EXISTS_ERROR Des erreurs surviennent lorsqu’une ressource à créer ou à ajouter existe déjà.
GLUE_INTERNAL_SERVICE_ERROR Les erreurs surviennent lorsqu’il y a un problème de service interne de AWS Glue.
GLUE_OPERATION_TIMEOUT_ERROR Des erreurs surviennent lorsqu’une opération AWS Glue dépasse le délai imparti.
GLUE_VALIDATION_ERROR Des erreurs surviennent lorsqu’une valeur requise ne peut pas être validée pour la tâche AWS Glue.
GLUE_JOB_BOOKMARK_VERSION_MISMATCH_ERROR Des erreurs surviennent lorsqu’une même tâche s’exécute dans le même compartiment source et écrit simultanément vers la même destination ou une destination différente (simultanéité >1)
LAUNCH_ERROR Des erreurs surviennent lors de la phase de lancement de la tâche AWS Glue.
DYNAMODB_ERROR Les erreurs génériques proviennent du Amazon DynamoDB service.
GLUE_ERROR Les erreurs génériques proviennent du service AWS Glue.
LAKEFORMATION_ERROR Les erreurs génériques proviennent du AWS Lake Formation service.
REDSHIFT_ERROR Les erreurs génériques proviennent du Amazon Redshift service.
S3_ERROR Les erreurs génériques proviennent du service Amazon S3.
SYSTEM_EXIT_ERROR Erreur de sortie du système générique.
TIMEOUT_ERROR Des erreurs génériques surviennent lorsque la tâche échoue en raison du dépassement du délai d’exécution de l’opération.
UNCLASSIFIED_SPARK_ERROR Les erreurs génériques proviennent de Spark.
UNCLASSIFIED_ERROR Catégorie d’erreur par défaut.

Limites

Note

glueContext doit être initialisé pour publier les métriques.

Dans la dimension source, la valeur est soit le chemin Amazon S3, soit le nom de la table, selon le type de source. En outre, si la source est JDBC et que l’option de requête est utilisée, la chaîne de requête est définie dans la dimension source. Si la valeur est supérieure à 500 caractères, elle est réduite à 500  caractères maximum. Les limites de la valeur sont les suivantes :

  • Les caractères non ASCII seront supprimés.

  • Si le nom de la source ne contient aucun caractère ASCII, il est converti en <non-ASCII input>.

Limites et considérations relatives aux métriques de débit

  • DataFrame et DataFrame basés DynamicFrame (par exemple JDBC, lecture depuis parquet sur Amazon S3) sont pris en charge, mais les fichiers basés sur RDD DynamicFrame (par exemple, lecture de csv, de json sur Amazon S3, etc.) ne sont pas pris en charge. Techniquement, toutes les lectures et écritures visibles sur l’interface utilisateur de Spark sont prises en charge.

  • La métrique recordsRead sera émise si la source de données est une table de catalogue et que le format est JSON, CSV, texte ou Iceberg.

  • Les métriques glue.driver.throughput.recordsWritten, glue.driver.throughput.bytesWritten et glue.driver.throughput.filesWritten ne sont pas disponibles dans les tables JDBC et Iceberg.

  • Les métriques peuvent être retardées. Si le travail se termine dans environ une minute, il se peut qu'il n'y ait aucune métrique de débit dans Amazon CloudWatch Metrics.