AWSSupport-TroubleshootAWSBatchJob - AWS Systems Manager Riferimento al runbook di automazione

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWSSupport-TroubleshootAWSBatchJob

Descrizione

Il AWSSupport-TroubleshootAWSBatchJob runbook consente di risolvere i problemi che impediscono a un AWS Batch job di passare dallo stato precedente. RUNNABLE STARTING

Come funziona?

Questo runbook esegue i seguenti controlli:

Importante
  • Questo runbook deve essere avviato nella stessa AWS regione del job il cui stato è bloccato. RUNNABLE

  • Questo runbook può essere avviato per i AWS Batch lavori pianificati su istanze Amazon ECS o AWS Fargate Amazon Elastic Compute Cloud (Amazon EC2). Se l'automazione viene avviata per un AWS Batch processo su Amazon Elastic Kubernetes Service (Amazon EKS), l'iniziazione si interrompe.

  • Se le istanze sono disponibili per eseguire il job ma non riescono a registrare il cluster Amazon ECS, questo runbook avvia il runbook di AWSSupport-TroubleshootECSContainerInstance automazione per cercare di determinare il motivo. Per ulteriori informazioni, consulta il runbook -TroubleshootECS. AWSSupport ContainerInstance

Esegui questa automazione (console)

Tipo di documento

Automazione

Proprietario

Amazon

Piattaforme

LinuxmacOS, Windows

Parameters (Parametri)

  • AutomationAssumeRole

    Tipo: stringa

    Descrizione: (Facoltativo) L'Amazon Resource Name (ARN) del ruolo AWS Identity and Access Management (IAM) che consente a Systems Manager Automation di eseguire le azioni per tuo conto. Se non viene specificato alcun ruolo, Systems Manager Automation utilizza le autorizzazioni dell'utente che avvia questo runbook.

  • JobId

    Tipo: stringa

    Descrizione: (Obbligatorio) L'ID del AWS Batch Job il cui RUNNABLE stato è bloccato.

    Modello consentito: ^[a-f0-9]{8}(-[a-f0-9]{4}){3}-[a-f0-9]{12}(:[0-9]+)?(#[0-9]+)?$

Autorizzazioni IAM richieste

Il AutomationAssumeRole parametro richiede le seguenti azioni per utilizzare correttamente il runbook.

  • autoscaling:DescribeAutoScalingGroups

  • autoscaling:DescribeScalingActivities

  • batch:DescribeComputeEnvironments

  • batch:DescribeJobs

  • batch:DescribeJobQueues

  • batch:ListJobs

  • cloudtrail:LookupEvents

  • ec2:DescribeIamInstanceProfileAssociations

  • ec2:DescribeInstanceAttribute

  • ec2:DescribeInstances

  • ec2:DescribeInstanceTypeOfferings

  • ec2:DescribeInstanceTypes

  • ec2:DescribeNetworkAcls

  • ec2:DescribeRouteTables

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSpotFleetInstances

  • ec2:DescribeSpotFleetRequests

  • ec2:DescribeSpotFleetRequestHistory

  • ec2:DescribeSubnets

  • ec2:DescribeVpcEndpoints

  • ec2:DescribeVpcs

  • ecs:DescribeClusters

  • ecs:DescribeContainerInstances

  • ecs:ListContainerInstances

  • iam:GetInstanceProfile

  • iam:GetRole

  • iam:ListRoles

  • iam:PassRole

  • iam:SimulateCustomPolicy

  • iam:SimulatePrincipalPolicy

  • ssm:DescribeAutomationExecutions

  • ssm:DescribeAutomationStepExecutions

  • ssm:GetAutomationExecution

  • ssm:StartAutomationExecution

  • sts:GetCallerIdentity

Istruzioni

  1. Accedere a AWSSupport-Troubleshoot AWSBatchJob nella console. AWS Systems Manager

  2. Seleziona Execute Automation

  3. Per i parametri di input, inserisci quanto segue:

    • AutomationAssumeRole (Facoltativo):

      L'Amazon Resource Name (ARN) del ruolo AWS Identity and Access Management (IAM) che consente a Systems Manager Automation di eseguire le azioni per tuo conto. Se non viene specificato alcun ruolo, Systems Manager Automation utilizza le autorizzazioni dell'utente che avvia questo runbook.

    • JobId (Obbligatorio):

      L'ID del AWS Batch Job bloccato nello RUNNABLE stato.

  4. Seleziona Esegui.

  5. Notate che l'automazione viene avviata.

  6. Il documento esegue le seguenti operazioni:

    • PreflightPermissionChecks:

      Esegue controlli preliminari delle autorizzazioni IAM rispetto all'utente/ruolo iniziante. Se mancano delle autorizzazioni, questo passaggio fornisce le azioni API mancanti nella sezione Global Output.

    • ProceedOnlyIfUserHasPermission:

      I rami dipendono dal fatto che si disponga delle autorizzazioni necessarie per eseguire tutte le azioni richieste per il runbook.

    • AWSBatchJobEvaluation:

      Esegue controlli sul AWS Batch Job verificandone l'esistenza e lo RUNNABLE stato.

    • ProceedOnlyIfBatchJobExistsAndIsinRunnableState:

      Filiali in base all'esistenza e RUNNABLE allo stato del job.

    • BatchComputeEnvironmentEvaluation:

      Esegue controlli rispetto all'ambiente di AWS Batch calcolo.

    • ProceedOnlyIfComputeEnvironmentChecksAreOK:

      Filiali in base all'esito dei controlli dell'ambiente di calcolo.

    • UnderlyingInfraEvaluation:

      Esegue controlli rispetto all'Auto Scaling Group o Spot Fleet Request sottostante.

    • ProceedOnlyIfInstancesNotJoiningEcsCluster:

      Filiali in base all'eventuale presenza di istanze che non si uniscono al cluster Amazon ECS.

    • EcsAutomationRunner:

      Esegue l'automazione Amazon ECS per le istanze che non entrano a far parte del cluster.

    • ExecutionResults:

      Genera output in base ai passaggi precedenti.

  7. Al termine, viene fornito l'URI per il file HTML del rapporto di valutazione:

    Collegamento alla console S3 e URI Amazon S3 per il report sull'esecuzione riuscita del runbook

Riferimenti

Systems Manager Automation