AWSSupport-TroubleshootAWSBatchJob - AWS Systems Manager Referência do runbook de automação

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

AWSSupport-TroubleshootAWSBatchJob

Descrição

O AWSSupport-TroubleshootAWSBatchJob runbook ajuda você a solucionar problemas que impedem que um AWS Batch trabalho passe do status para o status. RUNNABLE STARTING

Como funciona?

Esse runbook executa as seguintes verificações:

Importante
  • Esse runbook deve ser iniciado na mesma AWS região do seu trabalho que está preso no RUNNABLE status.

  • Esse runbook pode ser iniciado para AWS Batch trabalhos agendados em instâncias do Amazon ECS ou do AWS Fargate Amazon Elastic Compute Cloud (Amazon EC2). Se a automação for iniciada para um AWS Batch trabalho no Amazon Elastic Kubernetes Service (Amazon EKS), a iniciação será interrompida.

  • Se as instâncias estiverem disponíveis para executar o trabalho, mas não conseguirem registrar o cluster do Amazon ECS, esse runbook iniciará o runbook de AWSSupport-TroubleshootECSContainerInstance automação para tentar determinar o motivo. Para obter mais informações, consulte o runbook AWSSupport-TroubleshooTecs ContainerInstance.

Execute esta automação (console)

Tipo de documento

Automação

Proprietário

Amazon

Plataformas

Linux, macOS, Windows

Parâmetros

  • AutomationAssumeRole

    Tipo: String

    Descrição: (opcional) o nome do recurso da Amazon (ARN) do perfil do AWS Identity and Access Management (IAM) que permite que o Systems Manager Automation realize ações em seu nome. Se nenhum perfil for especificado, o Systems Manager Automation usa as permissões do usuário que inicia este runbook.

  • JobId

    Tipo: string

    Descrição: (Obrigatório) O ID do AWS Batch Job que está preso no RUNNABLE status.

    Allowed-pattern: ^[a-f0-9]{8}(-[a-f0-9]{4}){3}-[a-f0-9]{12}(:[0-9]+)?(#[0-9]+)?$

Permissões obrigatórias do IAM

O parâmetro AutomationAssumeRole requer as seguintes ações para usar o runbook com êxito.

  • autoscaling:DescribeAutoScalingGroups

  • autoscaling:DescribeScalingActivities

  • batch:DescribeComputeEnvironments

  • batch:DescribeJobs

  • batch:DescribeJobQueues

  • batch:ListJobs

  • cloudtrail:LookupEvents

  • ec2:DescribeIamInstanceProfileAssociations

  • ec2:DescribeInstanceAttribute

  • ec2:DescribeInstances

  • ec2:DescribeInstanceTypeOfferings

  • ec2:DescribeInstanceTypes

  • ec2:DescribeNetworkAcls

  • ec2:DescribeRouteTables

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSpotFleetInstances

  • ec2:DescribeSpotFleetRequests

  • ec2:DescribeSpotFleetRequestHistory

  • ec2:DescribeSubnets

  • ec2:DescribeVpcEndpoints

  • ec2:DescribeVpcs

  • ecs:DescribeClusters

  • ecs:DescribeContainerInstances

  • ecs:ListContainerInstances

  • iam:GetInstanceProfile

  • iam:GetRole

  • iam:ListRoles

  • iam:PassRole

  • iam:SimulateCustomPolicy

  • iam:SimulatePrincipalPolicy

  • ssm:DescribeAutomationExecutions

  • ssm:DescribeAutomationStepExecutions

  • ssm:GetAutomationExecution

  • ssm:StartAutomationExecution

  • sts:GetCallerIdentity

Instruções

  1. Navegue até a opção AWSSupport-Solução de problemas AWSBatchJob no AWS Systems Manager console.

  2. Selecione Executar automação.

  3. Você pode usar os seguintes parâmetros de entrada:

    • AutomationAssumeRole (Opcional):

      O nome do recurso da Amazon (ARN) do perfil do AWS Identity and Access Management (IAM) que permite que o Systems Manager Automation realize ações em seu nome. Se nenhum perfil for especificado, o Systems Manager Automation usa as permissões do usuário que inicia este runbook.

    • JobId (Obrigatório):

      O ID do AWS Batch Job que está preso no RUNNABLE status.

  4. Selecione Executar.

  5. Observe que a automação é iniciada.

  6. O bucket realiza as seguintes etapas:

    • PreflightPermissionChecks:

      Executa verificações prévias de permissão do IAM em relação ao usuário/função inicial. Se houver alguma permissão ausente, essa etapa fornece as ações de API ausentes na seção de saída global.

    • ProceedOnlyIfUserHasPermission:

      Ramifica com base em se você tem permissões para todas as ações necessárias para o runbook.

    • AWSBatchJobEvaluation:

      Executa verificações em relação ao AWS Batch Job, verificando se ele existe e está no RUNNABLE status.

    • ProceedOnlyIfBatchJobExistsAndIsinRunnableState:

      Ramifica com base na existência e no RUNNABLE status dos trabalhos.

    • BatchComputeEnvironmentEvaluation:

      Executa verificações em relação ao ambiente AWS Batch de computação.

    • ProceedOnlyIfComputeEnvironmentChecksAreOK:

      Ramificações com base no sucesso das verificações do ambiente computacional.

    • UnderlyingInfraEvaluation:

      Executa verificações em relação ao Grupo de Auto Scaling ou à Solicitação de Frota Spot subjacente.

    • ProceedOnlyIfInstancesNotJoiningEcsCluster:

      Ramificações com base na existência de instâncias que não estão ingressando no cluster do Amazon ECS.

    • EcsAutomationRunner:

      Executa a automação do Amazon ECS para as instâncias que não se juntam ao cluster.

    • ExecutionResults:

      Gera a saída com base nas etapas anteriores.

  7. Depois de concluído, o URI para o arquivo HTML do relatório de avaliação é fornecido:

    Link do console S3 e URI do Amazon S3 para o relatório sobre a execução bem-sucedida do runbook

Referências

Automação do Systems Manager