As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
AWSSupport-TroubleshootAWSBatchJob
Descrição
O AWSSupport-TroubleshootAWSBatchJob
runbook ajuda você a solucionar problemas que impedem que um AWS Batch trabalho passe do status para o status. RUNNABLE
STARTING
Como funciona?
Esse runbook executa as seguintes verificações:
Se o ambiente computacional estiver em um
DISABLED
estadoINVALID
ou.Se o
Max vCPU
parâmetro do ambiente computacional for grande o suficiente para acomodar o volume de trabalhos na fila de trabalhos.Se os trabalhos exigirem mais vCPUs ou recursos de memória do que os tipos de instância do ambiente computacional podem fornecer.
Se os trabalhos precisarem ser executados em instâncias baseadas em GPU, mas o ambiente computacional não estiver configurado para usar instâncias baseadas em GPU.
Se o grupo de Auto Scaling do ambiente computacional falhar ao iniciar as instâncias.
Se algum problema de permissão estiver bloqueando ações específicas necessárias para executar o trabalho.
Importante
Esse runbook deve ser iniciado na mesma AWS região do seu trabalho que está preso no
RUNNABLE
status.Esse runbook pode ser iniciado para AWS Batch trabalhos agendados em instâncias do Amazon ECS ou do AWS Fargate Amazon Elastic Compute Cloud (Amazon EC2). Se a automação for iniciada para um AWS Batch trabalho no Amazon Elastic Kubernetes Service (Amazon EKS), a iniciação será interrompida.
Se as instâncias estiverem disponíveis para executar o trabalho, mas não conseguirem registrar o cluster do Amazon ECS, esse runbook iniciará o runbook de
AWSSupport-TroubleshootECSContainerInstance
automação para tentar determinar o motivo. Para obter mais informações, consulte o runbook AWSSupport-TroubleshooTecs ContainerInstance.
Execute esta automação (console)
Tipo de documento
Automação
Proprietário
Amazon
Plataformas
Linux, macOS, Windows
Parâmetros
-
AutomationAssumeRole
Tipo: String
Descrição: (opcional) o nome do recurso da Amazon (ARN) do perfil do AWS Identity and Access Management (IAM) que permite que o Systems Manager Automation realize ações em seu nome. Se nenhum perfil for especificado, o Systems Manager Automation usa as permissões do usuário que inicia este runbook.
-
JobId
Tipo: string
Descrição: (Obrigatório) O ID do AWS Batch Job que está preso no
RUNNABLE
status.Allowed-pattern:
^[a-f0-9]{8}(-[a-f0-9]{4}){3}-[a-f0-9]{12}(:[0-9]+)?(#[0-9]+)?$
Permissões obrigatórias do IAM
O parâmetro AutomationAssumeRole
requer as seguintes ações para usar o runbook com êxito.
autoscaling:DescribeAutoScalingGroups
autoscaling:DescribeScalingActivities
batch:DescribeComputeEnvironments
batch:DescribeJobs
batch:DescribeJobQueues
batch:ListJobs
cloudtrail:LookupEvents
ec2:DescribeIamInstanceProfileAssociations
ec2:DescribeInstanceAttribute
ec2:DescribeInstances
ec2:DescribeInstanceTypeOfferings
ec2:DescribeInstanceTypes
ec2:DescribeNetworkAcls
ec2:DescribeRouteTables
ec2:DescribeSecurityGroups
ec2:DescribeSpotFleetInstances
ec2:DescribeSpotFleetRequests
ec2:DescribeSpotFleetRequestHistory
ec2:DescribeSubnets
ec2:DescribeVpcEndpoints
ec2:DescribeVpcs
ecs:DescribeClusters
ecs:DescribeContainerInstances
ecs:ListContainerInstances
iam:GetInstanceProfile
iam:GetRole
iam:ListRoles
iam:PassRole
iam:SimulateCustomPolicy
iam:SimulatePrincipalPolicy
ssm:DescribeAutomationExecutions
ssm:DescribeAutomationStepExecutions
ssm:GetAutomationExecution
ssm:StartAutomationExecution
sts:GetCallerIdentity
Instruções
Navegue até a opção AWSSupport-Solução de problemas AWSBatchJob
no AWS Systems Manager console. Selecione Executar automação.
-
Você pode usar os seguintes parâmetros de entrada:
-
AutomationAssumeRole (Opcional):
O nome do recurso da Amazon (ARN) do perfil do AWS Identity and Access Management (IAM) que permite que o Systems Manager Automation realize ações em seu nome. Se nenhum perfil for especificado, o Systems Manager Automation usa as permissões do usuário que inicia este runbook.
-
JobId (Obrigatório):
O ID do AWS Batch Job que está preso no
RUNNABLE
status.
-
Selecione Executar.
Observe que a automação é iniciada.
-
O bucket realiza as seguintes etapas:
-
PreflightPermissionChecks:
Executa verificações prévias de permissão do IAM em relação ao usuário/função inicial. Se houver alguma permissão ausente, essa etapa fornece as ações de API ausentes na seção de saída global.
-
ProceedOnlyIfUserHasPermission:
Ramifica com base em se você tem permissões para todas as ações necessárias para o runbook.
-
AWSBatchJobEvaluation:
Executa verificações em relação ao AWS Batch Job, verificando se ele existe e está no
RUNNABLE
status. -
ProceedOnlyIfBatchJobExistsAndIsinRunnableState:
Ramifica com base na existência e no
RUNNABLE
status dos trabalhos. -
BatchComputeEnvironmentEvaluation:
Executa verificações em relação ao ambiente AWS Batch de computação.
-
ProceedOnlyIfComputeEnvironmentChecksAreOK:
Ramificações com base no sucesso das verificações do ambiente computacional.
-
UnderlyingInfraEvaluation:
Executa verificações em relação ao Grupo de Auto Scaling ou à Solicitação de Frota Spot subjacente.
-
ProceedOnlyIfInstancesNotJoiningEcsCluster:
Ramificações com base na existência de instâncias que não estão ingressando no cluster do Amazon ECS.
-
EcsAutomationRunner:
Executa a automação do Amazon ECS para as instâncias que não se juntam ao cluster.
-
ExecutionResults:
Gera a saída com base nas etapas anteriores.
-
-
Depois de concluído, o URI para o arquivo HTML do relatório de avaliação é fornecido:
Link do console S3 e URI do Amazon S3 para o relatório sobre a execução bem-sucedida do runbook
Referências
Automação do Systems Manager