AWSSupport-TroubleshootAWSBatchJob - AWS Systems Manager Guide de référence du manuel d'automatisation

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AWSSupport-TroubleshootAWSBatchJob

Description

Le AWSSupport-TroubleshootAWSBatchJob runbook vous aide à résoudre les problèmes qui empêchent une AWS Batch tâche de passer du statut au statut. RUNNABLE STARTING

Comment fonctionne-t-il ?

Ce runbook effectue les vérifications suivantes :

Important
  • Ce runbook doit être lancé dans la même AWS région que votre tâche dont le RUNNABLE statut est bloqué.

  • Ce runbook peut être lancé pour des AWS Batch tâches planifiées sur des instances Amazon ECS AWS Fargate ou Amazon Elastic Compute Cloud (Amazon EC2). Si l'automatisation est initiée pour une AWS Batch tâche sur Amazon Elastic Kubernetes Service (Amazon EKS), le lancement s'arrête.

  • Si des instances sont disponibles pour exécuter la tâche mais ne parviennent pas à enregistrer le cluster Amazon ECS, ce runbook lance le runbook AWSSupport-TroubleshootECSContainerInstance d'automatisation pour essayer de déterminer pourquoi. Pour plus d'informations, reportez-vous au manuel d'exécution AWSSupport-TroubleShootECS ContainerInstance.

Exécuter cette automatisation (console)

Type de document

 Automatisation

Propriétaire

Amazon

Plateformes

LinuxmacOS, Windows

Paramètres

  • AutomationAssumeRole

    Type : chaîne

    Description : (Facultatif) Le nom de ressource Amazon (ARN) du rôle AWS Identity and Access Management (IAM) qui permet à Systems Manager Automation d'effectuer les actions en votre nom. Si aucun rôle n'est spécifié, Systems Manager Automation utilise les autorisations de l'utilisateur qui lance ce runbook.

  • JobId

    Type : chaîne

    Description : (Obligatoire) L'ID du AWS Batch Job dont le RUNNABLE statut est bloqué.

    Modèle autorisé : ^[a-f0-9]{8}(-[a-f0-9]{4}){3}-[a-f0-9]{12}(:[0-9]+)?(#[0-9]+)?$

Autorisations IAM requises

Le AutomationAssumeRole paramètre nécessite les actions suivantes pour utiliser correctement le runbook.

  • autoscaling:DescribeAutoScalingGroups

  • autoscaling:DescribeScalingActivities

  • batch:DescribeComputeEnvironments

  • batch:DescribeJobs

  • batch:DescribeJobQueues

  • batch:ListJobs

  • cloudtrail:LookupEvents

  • ec2:DescribeIamInstanceProfileAssociations

  • ec2:DescribeInstanceAttribute

  • ec2:DescribeInstances

  • ec2:DescribeInstanceTypeOfferings

  • ec2:DescribeInstanceTypes

  • ec2:DescribeNetworkAcls

  • ec2:DescribeRouteTables

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSpotFleetInstances

  • ec2:DescribeSpotFleetRequests

  • ec2:DescribeSpotFleetRequestHistory

  • ec2:DescribeSubnets

  • ec2:DescribeVpcEndpoints

  • ec2:DescribeVpcs

  • ecs:DescribeClusters

  • ecs:DescribeContainerInstances

  • ecs:ListContainerInstances

  • iam:GetInstanceProfile

  • iam:GetRole

  • iam:ListRoles

  • iam:PassRole

  • iam:SimulateCustomPolicy

  • iam:SimulatePrincipalPolicy

  • ssm:DescribeAutomationExecutions

  • ssm:DescribeAutomationStepExecutions

  • ssm:GetAutomationExecution

  • ssm:StartAutomationExecution

  • sts:GetCallerIdentity

Instructions

  1. Accédez à l'option AWSSupport-Troubleshoot AWSBatchJob dans la AWS Systems Manager console.

  2. Sélectionnez Exécuter l'automatisation

  3. Pour les paramètres d'entrée, entrez ce qui suit :

    • AutomationAssumeRole (Facultatif) :

      Amazon Resource Name (ARN) du rôle AWS Identity and Access Management (IAM) qui permet à Systems Manager Automation d'effectuer les actions en votre nom. Si aucun rôle n'est spécifié, Systems Manager Automation utilise les autorisations de l'utilisateur qui lance ce runbook.

    • JobId (Obligatoire) :

      L'ID du AWS Batch Job bloqué dans le RUNNABLE statut.

  4. Sélectionnez Exécuter.

  5. Notez que l'automatisation démarre.

  6. Le document exécute les étapes suivantes :

    • PreflightPermissionChecks:

      Effectue des vérifications d'autorisation IAM avant le vol par rapport à l'utilisateur/rôle initiateur. Si des autorisations sont manquantes, cette étape fournit les actions d'API manquantes dans la section de sortie globale.

    • ProceedOnlyIfUserHasPermission:

      Branches basées sur le fait que vous êtes autorisé à effectuer toutes les actions requises pour le runbook.

    • AWSBatchJobEvaluation:

      Effectue des vérifications par rapport au AWS Batch Job pour vérifier son existence et RUNNABLE son statut.

    • ProceedOnlyIfBatchJobExistsAndIsinRunnableState:

      Branches en fonction de l'existence et du RUNNABLE statut des emplois.

    • BatchComputeEnvironmentEvaluation:

      Effectue des vérifications par rapport à l'environnement AWS Batch informatique.

    • ProceedOnlyIfComputeEnvironmentChecksAreOK :

      Branches basées sur le succès des vérifications de l'environnement de calcul.

    • UnderlyingInfraEvaluation:

      Effectue des vérifications par rapport au groupe Auto Scaling ou à la demande de flotte Spot sous-jacents.

    • ProceedOnlyIfInstancesNotJoiningEcsCluster :

      Branches basées sur le fait que certaines instances ne rejoignent pas le cluster Amazon ECS.

    • EcsAutomationRunner:

      Exécute l'automatisation Amazon ECS pour les instances qui ne rejoignent pas le cluster.

    • ExecutionResults:

      Génère une sortie basée sur les étapes précédentes.

  7. Une fois l'opération terminée, l'URI du fichier HTML du rapport d'évaluation est fourni :

    Lien vers la console S3 et URI Amazon S3 pour le rapport sur l'exécution réussie du runbook

Références

Systems Manager Automation