EmrCluster - AWS Data Pipeline

AWS Data Pipeline n'est plus disponible pour les nouveaux clients. Les clients existants de AWS Data Pipeline peut continuer à utiliser le service normalement. En savoir plus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

EmrCluster

Représente la configuration d'un EMR cluster Amazon. Cet objet est utilisé par EmrActivity et HadoopActivity pour lancer un cluster.

Schedulers

Les planificateurs fournissent un moyen de spécifier l'allocation des ressources et de définir les priorités de travail au sein d'un cluster Hadoop. Les administrateurs ou les utilisateurs peuvent choisir un planificateur pour différentes classes d'utilisateurs et d'applications. Un planificateur peut utiliser les files d'attente pour allouer des ressources aux utilisateurs et aux applications. Vous configurez ces files d'attente lorsque vous créez le cluster. Vous pouvez ensuite configurer la priorité de certains types de travail et d'utilisateur par rapport à d'autres. Vous bénéficiez ainsi d'une utilisation efficace des ressources du cluster, tout en permettant à plus d'un utilisateur de soumettre des tâches au cluster. Il existe trois types de planificateur disponibles :

  • FairScheduler— Tente de planifier les ressources de manière uniforme sur une longue période.

  • CapacityScheduler— Utilise des files d'attente pour permettre aux administrateurs de clusters d'affecter les utilisateurs à des files d'attente dont la priorité et l'allocation des ressources varient.

  • Par défaut : utilisé par le cluster, ce qui peut être configuré par votre site.

Versions EMR publiées par Amazon

Une EMR version d'Amazon est un ensemble d'applications open source issues de l'écosystème des mégadonnées. Chaque version comprend différentes applications, composants et fonctionnalités Big Data que vous sélectionnez pour qu'Amazon EMR installe et configure lorsque vous créez un cluster. Vous spécifiez la version à l'aide de l'étiquette de version. Les étiquettes de version sont sous la forme emr-x.x.x. Par exemple, emr-5.30.0. Amazon EMR se base sur l'étiquette de publication emr-4.0.0 et utilise ultérieurement cette releaseLabel propriété pour spécifier l'étiquette de version d'un EmrCluster objet. Les versions antérieures utilisent la propriété amiVersion.

Important

Tous les EMR clusters Amazon créés à l'aide de la version 5.22.0 ou ultérieure utilisent Signature version 4 pour authentifier les demandes adressées à Amazon S3. Certaines versions antérieures utilisent Signature Version 2. La prise en charge de Signature Version 2 est interrompue. Pour de plus amples informations, veuillez consulter Mise à jour Amazon S3 — Période d'obsolescence SigV2 étendue et modifiée. Nous vous recommandons vivement d'utiliser une EMR version Amazon compatible avec Signature Version 4. Pour les versions antérieures, à commencer par la version EMR 4.7.x, la version la plus récente de la série a été mise à jour pour prendre en charge la version 4 de Signature. Lorsque vous utilisez une EMR version antérieure, nous vous recommandons d'utiliser la dernière version de la série. En outre, évitez les versions antérieures à la EMR version 4.7.0.

Considérations et restrictions

Utilisez la dernière version de Task Runner

Si vous utilisez un EmrCluster objet autogéré doté d'une étiquette de version, utilisez le dernier Task Runner. Pour plus d'informations sur Task Runner, consultez Travailler avec Task Runner. Vous pouvez configurer les valeurs des propriétés pour toutes les classifications EMR de configuration Amazon. Pour plus d'informations, consultez la section Configuration des applications dans le guide de EMR version d'Amazon, ainsi que les EmrConfiguration références aux Propriété objets et aux objets.

Support pour IMDSv2

Auparavant, uniquement AWS Data Pipeline pris en chargeIMDSv1. Désormais, AWS Data Pipeline compatible avec IMDSv2 Amazon EMR 5.23.1, 5.27.1 et 5.32 ou version ultérieure, et Amazon 6.2 ou version ultérieure. EMR IMDSv2utilise une méthode axée sur les sessions pour mieux gérer l'authentification lors de la récupération d'informations de métadonnées à partir d'instances. Vous devez configurer vos instances pour qu'elles passent des IMDSv2 appels en créant des ressources gérées par les utilisateurs à l'aide de TaskRunner -2.0.

Amazon EMR 5.32 ou version ultérieure et Amazon 6.x EMR

Les séries de versions Amazon EMR 5.32 ou ultérieures et 6.x utilisent la version 3.x de Hadoop, qui a introduit des changements radicaux dans la façon dont le chemin de classe de Hadoop est évalué par rapport à la version 2.x de Hadoop. Les bibliothèques courantes telles que Joda-Time ont été supprimées du classpath.

Si EmrActivity ou HadoopActivity exécute un fichier Jar qui dépend d'une bibliothèque supprimée dans Hadoop 3.x, l'étape échoue avec l'erreur ou. java.lang.NoClassDefFoundError java.lang.ClassNotFoundException Cela peut se produire pour les fichiers Jar qui s'exécutent sans problème avec les versions EMR 5.x d'Amazon.

Pour résoudre le problème, vous devez copier les dépendances du fichier Jar dans le chemin de classe Hadoop d'un EmrCluster objet avant de démarrer le ou le. EmrActivity HadoopActivity Pour ce faire, nous fournissons un script bash. Le script bash est disponible à l'emplacement suivant, où MyRegion est la AWS région dans laquelle s'exécute votre EmrCluster objet, par exempleus-west-2.

s3://datapipeline-MyRegion/MyRegion/bootstrap-actions/latest/TaskRunner/copy-jars-to-hadoop-classpath.sh

Le mode d'exécution du script varie selon qu'EmrActivityil HadoopActivity s'exécute sur une ressource gérée par AWS Data Pipeline ou sur une ressource autogérée.

Si vous utilisez une ressource gérée par AWS Data Pipeline, ajoutez un bootstrapAction à l'EmrClusterobjet. bootstrapActionSpécifie le script et les fichiers Jar à copier en tant qu'arguments. Vous pouvez ajouter jusqu'à 255 bootstrapAction champs par EmrCluster objet, et vous pouvez ajouter un bootstrapAction champ à un EmrCluster objet qui possède déjà des actions d'amorçage.

Pour spécifier ce script en tant qu'action d'amorçage, utilisez la syntaxe suivante, où se JarFileRegion trouve la région dans laquelle le fichier Jar est enregistré, et chaque MyJarFilen est le chemin absolu dans Amazon S3 d'un fichier Jar à copier dans le classpath Hadoop. Ne spécifiez pas les fichiers Jar qui se trouvent dans le chemin de classe Hadoop par défaut.

s3://datapipeline-MyRegion/MyRegion/bootstrap-actions/latest/TaskRunner/copy-jars-to-hadoop-classpath.sh,JarFileRegion,MyJarFile1,MyJarFile2[, ...]

L'exemple suivant spécifie une action bootstrap qui copie deux fichiers Jar dans Amazon S3 : my-jar-file.jar et leemr-dynamodb-tool-4.14.0-jar-with-dependencies.jar. La région utilisée dans cet exemple est us-west-2.

{ "id" : "MyEmrCluster", "type" : "EmrCluster", "keyPair" : "my-key-pair", "masterInstanceType" : "m5.xlarge", "coreInstanceType" : "m5.xlarge", "coreInstanceCount" : "2", "taskInstanceType" : "m5.xlarge", "taskInstanceCount": "2", "bootstrapAction" : ["s3://datapipeline-us-west-2/us-west-2/bootstrap-actions/latest/TaskRunner/copy-jars-to-hadoop-classpath.sh,us-west-2,s3://path/to/my-jar-file.jar,s3://dynamodb-dpl-us-west-2/emr-ddb-storage-handler/4.14.0/emr-dynamodb-tools-4.14.0-jar-with-dependencies.jar"] }

Vous devez enregistrer et activer le pipeline pour que la modification apportée bootstrapAction au nouveau soit prise en compte.

Si vous utilisez une ressource autogérée, vous pouvez télécharger le script sur l'instance de cluster et l'exécuter depuis la ligne de commande à l'aide SSH de. Le script crée un répertoire nommé /etc/hadoop/conf/shellprofile.d et un fichier nommé datapipeline-jars.sh dans ce répertoire. Les fichiers jar fournis en tant qu'arguments de ligne de commande sont copiés dans un répertoire nommé créé par le script. /home/hadoop/datapipeline_jars Si votre cluster est configuré différemment, modifiez le script de manière appropriée après l'avoir téléchargé.

La syntaxe d'exécution du script sur la ligne de commande est légèrement différente de celle bootstrapAction utilisée dans l'exemple précédent. Utilisez des espaces plutôt que des virgules entre les arguments, comme indiqué dans l'exemple suivant.

./copy-jars-to-hadoop-classpath.sh us-west-2 s3://path/to/my-jar-file.jar s3://dynamodb-dpl-us-west-2/emr-ddb-storage-handler/4.14.0/emr-dynamodb-tools-4.14.0-jar-with-dependencies.jar

EMRAutorisations Amazon

Lorsque vous créez un IAM rôle personnalisé, considérez attentivement les autorisations minimales nécessaires pour que votre cluster puisse effectuer son travail. Assurez-vous d'accorder l'accès aux ressources requises, telles que les fichiers dans Amazon S3 ou les données dans AmazonRDS, Amazon Redshift ou DynamoDB. Si vous souhaitez définir visibleToAllUsers avec la valeur False, votre rôle doit avoir les autorisations appropriées pour le faire. Notez que DataPipelineDefaultRole ne dispose pas de ces autorisations. Vous devez soit fournir une union des DataPipelineDefaultRole rôles DefaultDataPipelineResourceRole et en tant que rôle EmrCluster objet, soit créer votre propre rôle à cette fin.

Syntaxe

Champs d'invocation de l'objet Description Type d'option
schedule Cet objet est appelé dans le cadre de l'exécution d'un intervalle de planification. Spécifiez une référence de planification à un autre objet pour définir l'ordre d'exécution des dépendances de l'objet. Vous pouvez répondre à cette exigence en définissant explicitement une planification sur l'objet, par exemple, en spécifiant "schedule": {"ref": "DefaultSchedule"}. Dans la plupart des cas, il est préférable de placer la planification de référence sur l'objet de pipeline par défaut de manière à ce que tous les objets héritent cette planification. Ou, si le pipeline dispose d'une arborescence de planifications (planifications au sein de la planification maître), vous pouvez créer un objet parent ayant une référence de planification. Pour plus d'informations sur les exemples de configurations de planification facultatives, consultez https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html. Objet de référence, par exemple, "schedule":{"ref":"myScheduleId"}

Champs facultatifs Description Type d'option
actionOnResourceDéfaillance Action effectuée après une défaillance de ressource pour cette ressource. Les valeurs valides sont « retryall », valeur qui retente toutes les tâches sur le cluster pendant la durée spécifiée, et « retrynone ». Chaîne
actionOnTaskDéfaillance Action effectuée après l'échec d'une tâche pour cette ressource. Les valeurs valides sont « continue », qui signifie de ne pas mettre fin au cluster, et « terminate ». Chaîne
additionalMasterSecurityGroupIds Identifiant des groupes de sécurité principaux supplémentaires du EMR cluster, au format sg-01XXXX6a. Pour plus d'informations, consultez Amazon EMR Additional Security Groups dans le Amazon EMR Management Guide. Chaîne
additionalSlaveSecurityGroupIds Identifiant des groupes de sécurité esclaves supplémentaires du EMR cluster, qui suit le formulairesg-01XXXX6a. Chaîne
amiVersion Version Amazon Machine Image (AMI) EMR utilisée par Amazon pour installer les nœuds du cluster. Pour plus d'informations, consultez le guide EMR de gestion Amazon. Chaîne
applications Applications à installer dans le cluster avec les arguments séparés par des virgules. Par défaut Hive et Pig sont installés. Ce paramètre s'applique uniquement aux EMR versions 4.0 et ultérieures d'Amazon. Chaîne
attemptStatus État de l'activité à distance le plus récemment rapporté. Chaîne
attemptTimeout Délai d'achèvement de la tâche à distance. Si une valeur est définie, une activité à distance qui n'est pas exécutée dans le cadre de la période de départ définie peut être retentée. Période
availabilityZone Zone de disponibilité dans laquelle exécuter le cluster. Chaîne
bootstrapAction Action à exécuter lorsque le cluster démarre. Vous pouvez spécifier des arguments séparés par des virgules. Pour spécifier plusieurs actions (jusqu'à 255), ajoutez plusieurs champs bootstrapAction. Le comportement par défaut consiste à lancer le cluster sans actions d'amorçage. Chaîne
configuration Configuration pour le EMR cluster Amazon. Ce paramètre s'applique uniquement aux EMR versions 4.0 et ultérieures d'Amazon. Objet de référence, par exemple, "configuration":{"ref":"myEmrConfigurationId"}
coreInstanceBidPrix Le prix spot maximum que vous êtes prêt à payer pour les EC2 instances Amazon. Si un prix d'offre est spécifié, Amazon EMR utilise des instances Spot pour le groupe d'instances. Spécifié dansUSD. Chaîne
coreInstanceCount Nombre de nœuds principaux à utiliser pour le cluster. Entier
coreInstanceType Type d'EC2instance Amazon à utiliser pour les nœuds principaux. Consultez Instances Amazon EC2 prises en charge pour les clusters Amazon EMR . Chaîne
coreGroupConfiguration Configuration du groupe d'instances principal du EMR cluster Amazon. Ce paramètre s'applique uniquement aux EMR versions 4.0 et ultérieures d'Amazon. Objet de référence, par exemple, “configuration”: {“ref”: “myEmrConfigurationId”}
coreEbsConfiguration Configuration des EBS volumes Amazon qui seront attachés à chacun des nœuds principaux du groupe principal du EMR cluster Amazon. Pour plus d'informations, consultez la section Types d'instances qui supportent EBS l'optimisation dans le guide de EC2 l'utilisateur Amazon. Objet de référence, par exemple, “coreEbsConfiguration”: {“ref”: “myEbsConfiguration”}
customAmiId S'applique uniquement aux EMR versions 5.7.0 et ultérieures d'Amazon. Spécifie l'AMIID d'une personnalisation AMI à utiliser lorsqu'Amazon EMR approvisionne des EC2 instances Amazon. Il peut également être utilisé à la place des actions bootstrap pour personnaliser les configurations des nœuds du cluster. Pour plus d'informations, consultez la rubrique suivante dans le guide EMR de gestion Amazon. Utilisation d'une personnalisation AMI Chaîne
EbsBlockDeviceConfig

Configuration d'un périphérique de EBS blocage Amazon demandé associé au groupe d'instances. Inclut un nombre spécifié de volumes qui seront associés à chaque instance du groupe d'instances. Inclut volumesPerInstance et volumeSpecification, où :

  • volumesPerInstanceest le nombre de EBS volumes dotés d'une configuration de volume spécifique qui seront associés à chaque instance du groupe d'instances.

  • volumeSpecificationsont les spécifications EBS du volume Amazon, telles que le type de volume et la taille en gigaoctets (GiB) qui seront demandées pour le EBS volume attaché à une instance EC2 du cluster Amazon. IOPS EMR

Objet de référence, par exemple, “EbsBlockDeviceConfig”: {“ref”: “myEbsBlockDeviceConfig”}
emrManagedMasterSecurityGroupId Identifiant du groupe de sécurité principal du EMR cluster Amazon, qui prend la forme desg-01XXXX6a. Pour plus d'informations, consultez Configurer les groupes de sécurité dans le guide EMR de gestion Amazon. Chaîne
emrManagedSlaveSecurityGroupId L'identifiant du groupe de sécurité esclave du EMR cluster Amazon, qui suit le formulairesg-01XXXX6a. Chaîne
enableDebugging Active le débogage sur le EMR cluster Amazon. Chaîne
failureAndRerunMode Décrit le comportement du nœud de consommateurs lorsque les dépendances échouent ou sont à nouveau exécutées. Énumération
hadoopSchedulerType Type de planificateur du cluster. Les types valides sont : PARALLEL_FAIR_SCHEDULING, PARALLEL_CAPACITY_SCHEDULING et DEFAULT_SCHEDULER. Énumération
httpProxy L'hôte proxy que les clients utilisent pour se connecter aux AWS services. Objet de référence, par exemple, "httpProxy« : {" ref » : » myHttpProxy Id "}
initTimeout Délai d'attente pour le démarrage de la ressource. Période
keyPair La paire de EC2 clés Amazon à utiliser pour se connecter au nœud principal du EMR cluster Amazon. Chaîne
lateAfterTimeout Temps écoulé après le début du pipeline pendant lequel l'objet doit être terminé. Il est déclenché uniquement lorsque le type de planification n'est pas défini surondemand. Période
masterInstanceBidPrix Le prix spot maximum que vous êtes prêt à payer pour les EC2 instances Amazon. Valeur décimale comprise entre 0 et 20,00 (exclu). Spécifié dansUSD. La définition de cette valeur active les instances Spot pour le nœud maître EMR du cluster Amazon. Si un prix d'offre est spécifié, Amazon EMR utilise des instances Spot pour le groupe d'instances. Chaîne
masterInstanceType Type d'EC2instance Amazon à utiliser pour le nœud principal. Consultez Instances Amazon EC2 prises en charge pour les clusters Amazon EMR . Chaîne
masterGroupConfiguration Configuration du groupe d'instances principal EMR du cluster Amazon. Ce paramètre s'applique uniquement aux EMR versions 4.0 et ultérieures d'Amazon. Objet de référence, par exemple, “configuration”: {“ref”: “myEmrConfigurationId”}
masterEbsConfiguration Configuration des EBS volumes Amazon qui seront attachés à chacun des nœuds principaux du groupe maître du EMR cluster Amazon. Pour plus d'informations, consultez la section Types d'instances qui supportent EBS l'optimisation dans le guide de EC2 l'utilisateur Amazon. Objet de référence, par exemple, “masterEbsConfiguration”: {“ref”: “myEbsConfiguration”}
maxActiveInstances Nombre maximal d'instances actives simultanées d'un composant. Les réexécutions ne sont pas comptabilisées dans le nombre d'instances actives. Entier
maximumRetries Nombre maximal de nouvelles tentatives en cas d'échec. Entier
onFail Action à exécuter en cas d'échec de l'objet actuel. Objet de référence, par exemple, "onFail":{"ref":"myActionId"}
onLateAction Actions à déclencher si un objet n'a pas encore été planifié ou n'est toujours pas terminé. Objet de référence, par exemple, "onLateAction":{"ref":"myActionId"}
onSuccess Action à exécuter en cas de réussite de l'objet actuel. Objet de référence, par exemple, "onSuccess":{"ref":"myActionId"}
parent Parent de l'objet actuel à partir duquel les emplacements sont hérités. Objet de référence, par exemple, "parent":{"ref":"myBaseObjectId"}
pipelineLogUri L'Amazon S3 URI (tel que 's3 ://BucketName/Key/ ') pour le téléchargement des journaux pour le pipeline. Chaîne
region Code de la région dans laquelle le EMR cluster Amazon doit s'exécuter. Par défaut, le cluster s'exécute dans la même région que le pipeline. Vous pouvez exécuter le cluster dans la même région qu'un ensemble de données dépendantes. Énumération
releaseLabel Libellé de publication pour le EMR cluster. Chaîne
reportProgressTimeout Délai pour les appels successifs de travail à distance adressés à reportProgress. Si une valeur est définie, les activités à distance qui ne font pas état d'avancement pour la période spécifiée doivent être considérées comme bloquées et, par conséquent, retentées. Période
resourceRole IAMRôle AWS Data Pipeline utilisé pour créer le EMR cluster Amazon. Le rôle par défaut est DataPipelineDefaultRole. Chaîne
retryDelay Délai entre deux nouvelles tentatives. Période
rôle IAMRôle transmis à Amazon EMR pour créer des EC2 nœuds. Chaîne
runsOn Ce champ n'est pas autorisé sur cet objet. Objet de référence, par exemple, "runsOn":{"ref":"myResourceId"}
securityConfiguration Identifiant de la configuration de EMR sécurité qui sera appliquée au cluster. Ce paramètre s'applique uniquement aux EMR versions 4.8.0 et ultérieures d'Amazon. Chaîne
serviceAccessSecurityGroupId Identifiant du groupe de sécurité d'accès aux services du EMR cluster Amazon. String. Suit le format sg-01XXXX6a, par exemple, sg-1234abcd.
scheduleType Le type de planification vous permet de spécifier si les objets de votre définition de pipeline doivent être planifiés au début ou à la fin de l'intervalle. Les valeurs sont : cron, ondemand et timeseries (cron, à la demande et séries chronologiques). La planification timeseries signifie que les instances sont programmées à la fin de chaque intervalle. La planification cron signifie que les instances sont programmées au début de chaque intervalle. Une planification ondemand vous permet d'exécuter un pipeline une fois par activation. Vous n'avez pas à cloner ou à recréer le pipeline pour l'exécuter à nouveau. Si vous utilisez une planification ondemand, elle doit être spécifiée dans l'objet par défaut et être le seul scheduleType spécifié pour les objets du pipeline. Pour utiliser des pipelines ondemand, vous devez appeler l'opération ActivatePipeline pour chaque exécution suivante. Énumération
subnetId Identifiant du sous-réseau dans lequel lancer le EMR cluster Amazon. Chaîne
supportedProducts Paramètre qui installe un logiciel tiers sur un EMR cluster Amazon, par exemple une distribution tierce de Hadoop. Chaîne
taskInstanceBidPrix Le prix spot maximum que vous êtes prêt à payer pour les EC2 instances. Valeur décimale comprise entre 0 et 20,00 (exclu). Spécifié dansUSD. Si un prix d'offre est spécifié, Amazon EMR utilise des instances Spot pour le groupe d'instances. Chaîne
taskInstanceCount Le nombre de nœuds de tâches à utiliser pour le EMR cluster Amazon. Entier
taskInstanceType Type d'EC2instance Amazon à utiliser pour les nœuds de tâches. Chaîne
taskGroupConfiguration Configuration du groupe d'instances de tâches du EMR cluster Amazon. Ce paramètre s'applique uniquement aux EMR versions 4.0 et ultérieures d'Amazon. Objet de référence, par exemple, “configuration”: {“ref”: “myEmrConfigurationId”}
taskEbsConfiguration Configuration des EBS volumes Amazon qui seront attachés à chacun des nœuds de tâches du groupe de tâches du EMR cluster Amazon. Pour plus d'informations, consultez la section Types d'instances qui supportent EBS l'optimisation dans le guide de EC2 l'utilisateur Amazon. Objet de référence, par exemple, “taskEbsConfiguration”: {“ref”: “myEbsConfiguration”}
terminateAfter Résiliez la ressource à l'issue de ce nombre d'heures. Entier
VolumeSpecification

Les spécifications EBS du volume Amazon, telles que le type de volume et la taille en gigaoctets (GiB) qui seront demandées pour le volume Amazon EBS attaché à une instance Amazon EC2 dans le cluster Amazon. IOPS EMR Le nœud peut être un nœud principal, maître ou de tâche.

VolumeSpecification inclut les éléments suivants :

  • iops() Integer. Le nombre d'opérations d'E/S par seconde (IOPS) prises en charge par le EBS volume Amazon, par exemple 1 000. Pour plus d'informations, consultez la section Caractéristiques des EBS E/S dans le guide de EC2 l'utilisateur Amazon.

  • sizeinGB(). Entier. La taille EBS du volume Amazon, en gibioctets (GiB), par exemple 500. Pour plus d'informations sur les combinaisons valides de types de volumes et de tailles de disque dur, consultez la section Types de EBS volumes dans le guide de EC2 l'utilisateur Amazon.

  • volumetType. Corde. Le type de EBS volume Amazon, par exemple gp2. Les types de volumes pris en charge incluent les types standard, gp2, io1, st1, sc1, etc. Pour plus d'informations, consultez la section Types de EBS volumes dans le guide de EC2 l'utilisateur Amazon.

Objet de référence, par exemple, “VolumeSpecification”: {“ref”: “myVolumeSpecification”}
useOnDemandOnLastAttempt Lors de la dernière tentative de demande d'une ressource, effectuez une demande d'instances à la demande, plutôt que d'instances Spot. Cela garantit que si toutes les tentatives précédentes ont échoué, la dernière tentative n'est pas interrompue. Booléen
workerGroup Champ non autorisé sur cet objet. Chaîne

Champs liés à l'exécution Description Type d'option
@activeInstances Liste des objets d'instances actives actuellement planifiés. Objet de référence, par exemple, "activeInstances« : {" ref » : » myRunnableObject Id "}
@actualEndTime Heure à laquelle l'exécution de l'objet s'est terminée. DateTime
@actualStartTime Heure à laquelle l'exécution de l'objet a démarré. DateTime
cancellationReason cancellationReason Si cet objet a été annulé. Chaîne
@cascadeFailedOn Description de la chaîne de dépendances sur laquelle l'objet a échoué. Objet de référence, par exemple, "cascadeFailedOn« : {" ref » : » myRunnableObject Id "}
emrStepLog Les journaux d'étapes ne sont disponibles que pour les tentatives EMR d'activité sur Amazon. Chaîne
errorId ID de l'erreur si l'objet a échoué. Chaîne
errorMessage Message d'erreur si l'objet a échoué. Chaîne
errorStackTrace Suivi de la pile d'erreurs si l'objet a échoué. Chaîne
@failureReason Raison de l'échec de la ressource. Chaîne
@finishedTime Heure à laquelle l'objet a terminé son exécution. DateTime
hadoopJobLog Des journaux de tâches Hadoop sont disponibles en cas de tentative d'activité sur AmazonEMR. Chaîne
@healthStatus État de santé de l'objet qui reflète la réussite ou l'échec de la dernière instance qui a atteint un état résilié. Chaîne
@healthStatusFromInstanceId ID du dernier objet d'instance qui atteint un état résilié. Chaîne
@ healthStatusUpdated Heure Heure à laquelle l'état de santé a été mis à jour pour la dernière fois. DateTime
hostname Nom d'hôte du client qui a sélectionné la tentative de tâche. Chaîne
@lastDeactivatedTime Heure à laquelle l'objet a été désactivé pour la dernière fois. DateTime
@ latestCompletedRun Heure Heure de la dernière exécution pour laquelle l'exécution s'est terminée. DateTime
@latestRunTime Heure de la dernière exécution pour laquelle l'exécution a été planifiée. DateTime
@nextRunTime Prochaine heure d'exécution planifiée. DateTime
reportProgressTime Heure la plus récente pour laquelle l'activité distante a signalé une progression. DateTime
@scheduledEndTime Heure de fin planifiée pour l'objet. DateTime
@scheduledStartTime Heure de début planifiée pour l'objet. DateTime
@État État de l'objet. Chaîne
@Version Version du pipeline avec laquelle l'objet été créé. Chaîne
@waitingOn Description de la liste des dépendances sur laquelle l'objet est en attente. Objet de référence, par exemple, "waitingOn« : {" ref » : » myRunnableObject Id "}

Champs système Description Type d'option
@error Erreur décrivant l'objet mal formé. Chaîne
@pipelineId ID du pipeline auquel l'objet appartient. Chaîne
@sphere Emplacement d'un objet dans le cycle de vie. Les objets de composant entraînent des objets d'instance, qui exécutent des objets « tentatives ». Chaîne

consultez aussi