Solução de problemas do Systems Manager Automation
Use as informações a seguir para ajudar você a solucionar problemas com o AWS Systems Manager Automation, um recurso do AWS Systems Manager. Este tópico inclui tarefas específicas para resolver problemas com base em mensagens de erro de Automação.
Tópicos
Erros comuns de automação
Esta seção inclui informações sobre erros comuns de Automação.
VPC não definida 400
Por padrão, quando o Automation executa o runbook AWS-UpdateLinuxAmi
ou AWS-UpdateWindowsAmi
, o sistema cria uma instância temporária na VPC padrão (172.30.0.0/16). Se tiver excluído a VPC padrão, você receberá o seguinte erro:
VPC not defined 400
Para resolver esse problema, você deve especificar um valor para o parâmetro de entrada SubnetId
.
Falha ao iniciar a execução da automação
Uma automação pode apresentar falhas com um erro de acesso negado ou um erro de perfil assumido inválido, se você não tiver configurado corretamente as políticas e os perfis do AWS Identity and Access Management (IAM) para o Automation.
Acesso negado
Os exemplos a seguir descrevem situações em que uma automação não foi iniciada, sinalizando um erro de acesso negado.
Acesso negado à API do Systems Manager
A mensagem de erro: User:
user arn isn't authorized to perform: ssm:StartAutomationExecution on
resource: document arn (Service: AWSSimpleSystemsManagement; Status
Code: 400; Error Code: AccessDeniedException; Request ID:
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)
-
Causa possível 1: o usuário que está tentando iniciar a automação não tem permissões para invocar a API
StartAutomationExecution
. Para resolver esse problema, anexe a política do IAM requerida ao usuário que foi usado para iniciar a automação. -
Causa possível 2: o usuário que está tentando iniciar a automação tem permissões para invocar a API
StartAutomationExecution
, mas não tem permissões para invocar a API usando o runbook específico. Para resolver esse problema, anexe a política do IAM requerida ao usuário que foi usado para iniciar a automação.
Acesso negado por ausência de permissões PassRole
A mensagem de erro: User:
user arn isn't authorized to perform: iam:PassRole on resource:
automation assume role arn (Service: AWSSimpleSystemsManagement; Status
Code: 400; Error Code: AccessDeniedException; Request ID:
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)
O usuário que está tentando iniciar a automação não tem permissões PassRole para assumir o perfil. Para resolver esse problema, anexe a política iam:PassRole ao perfil do usuário que está tentando iniciar a automação. Para ter mais informações, consulte Tarefa 2: Anexar a política iam:PassRole à função de automação.
Função assumida inválida
Quando você executa um Automation, uma função assumida é fornecida no runbook ou transmitida como um valor de parâmetro para o runbook. Diferentes tipos de erros poderão ocorrer se a função assumida não for especificada ou configurada corretamente.
Função de admissão malformada
Mensagem de erro: The
format of the supplied assume role ARN isn't valid.
A função de admissão está mal formatada. Para resolver esse problema, verifique se uma função assumida válida está especificada no seu runbook ou como um parâmetro em runtime ao executar a automação.
Não é possível assumir o perfil assumido
A mensagem de erro: The
defined assume role is unable to be assumed. (Service:
AWSSimpleSystemsManagement; Status Code: 400; Error Code:
InvalidAutomationExecutionParametersException; Request ID:
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)
-
Causa possível 1: a função assumida não existe. Para resolver esse problema, crie a função. Para ter mais informações, consulte Configurar a automação. Detalhes específicos para a criação dessa função estão descritos no seguinte tópico, Tarefa 1: Criar uma função de serviço para a automação.
-
Causa possível 2: a função assumida não possui uma relação de confiança com o serviço do Systems Manager. Para resolver esse problema, crie a relação de confiança. Para obter mais informações, consulte Não consigo assumir uma função no Manual do usuário do IAM.
Execução iniciada, mas o status falhou
Falhas específicas da ação
Runbooks contêm etapas e elas são executadas em ordem. Cada etapa invoca uma ou mais APIs de AWS service (Serviço da AWS). Essas APIs determinam as entradas, o comportamento e as saídas da etapa. Há vários locais em que um erro pode causar uma falha na etapa. As mensagens de falha indicam quando e onde um erro ocorreu.
Para ver uma mensagem de falha no console do Amazon Elastic Compute Cloud (Amazon EC2), escolha o link View Outputs (Exibir resultados) da etapa com falha. Para ver uma mensagem de falha da AWS CLI, chame get-automation-execution
e procure o atributo FailureMessage
em um StepExecution
com falha.
Nos exemplos a seguir, uma etapa associada à ação aws:runInstance
falhou. Cada exemplo explora um tipo diferente de erro.
Imagem ausente
A mensagem de erro: Automation Step Execution fails when it's launching the instance(s).
Get Exception from RunInstances API of ec2 Service. Exception Message
from RunInstances API: [The image id '[ami id]' doesn't exist (Service:
AmazonEC2; Status Code: 400; Error Code: InvalidAMIID.NotFound; Request
ID: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)]. Please refer to Automation
Service Troubleshooting Guide for more diagnosis details.
A ação aws:runInstances
recebeu uma entrada para um ImageId
que não existe. Para resolver esse problema, atualize o runbook ou os valores de parâmetros com o ID correto da AMI.
A política do perfil assumido não tem permissões suficientes
A mensagem de erro: Automation Step Execution fails when it's launching the instance(s).
Get Exception from RunInstances API of ec2 Service. Exception Message
from RunInstances API: [You aren't authorized to perform this operation.
Encoded authorization failure message: xxxxxxx (Service: AmazonEC2;
Status Code: 403; Error Code: UnauthorizedOperation; Request ID:
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)]. Please refer to Automation
Service Troubleshooting Guide for more diagnosis details.
A função de assunção não tem permissão suficiente para invocar a API RunInstances
em instâncias do EC2. Para resolver esse problema, anexe uma política do IAM à função assumida que tenha permissão para invocar a API RunInstances
. Para obter mais informações, consulte Criar perfis de serviço para o Automation usando o console.
Estado inesperado
A mensagem de erro: Step
fails when it's verifying launched instance(s) are ready to be used.
Instance i-xxxxxxxxx entered unexpected state: shutting-down. Please
refer to Automation Service Troubleshooting Guide for more diagnosis
details.
-
Causa possível 1: há um problema com a instância ou o serviço do Amazon EC2. Para resolver esse problema, faça login na instância ou revise o log do sistema da instância para entender por que ela iniciou o desligamento.
-
Causa possível 2: o script de dados do usuário especificado para a ação
aws:runInstances
tem um problema ou uma sintaxe incorreta. Verifique a sintaxe do script de dados do usuário. Além disso, verifique se os scripts de dados do usuário não desligam a instância ou invocam outros scripts que desligam a instância.
Referência a falhas específicas de ação
Quando uma etapa falha, a mensagem de falha pode indicar qual serviço foi invocado quando a falha ocorreu. A tabela a seguir lista os serviços invocados por cada ação. Ela também fornece links para obter informações sobre cada serviço.
Ação | Serviços da AWS invocados por essa ação | Para obter informações sobre este serviço | Solucionar problemas de conteúdo |
---|---|---|---|
|
Amazon EC2 |
||
|
Amazon EC2 |
||
|
Systems Manager |
||
|
Amazon EC2 |
||
|
AWS CloudFormation |
||
|
AWS CloudFormation |
||
|
Amazon EC2 |
||
|
Amazon EC2 |
||
|
Amazon EC2, Systems Manager |
||
|
AWS Lambda |
Erro interno do serviço de automação
A mensagem de erro: Internal
Server Error. Please refer to Automation Service Troubleshooting Guide for
more diagnosis details.
Um problema com o serviço Automation está impedindo que o runbook especificado seja executado corretamente. Para resolver esse problema, entre em contato com o AWS Support. Forneça o ID de execução e o ID de cliente, se disponíveis.
Execução iniciada, mas tempo limite atingido
A mensagem de erro: Step timed out
while step is verifying launched instance(s) are ready to be used. Please refer
to Automation Service Troubleshooting Guide for more diagnosis
details.
Uma etapa na ação aws:runInstances
atingiu o tempo limite. Isso pode acontecer se a ação da etapa demorar mais para ser executada do que o valor especificado para timeoutSeconds
na etapa. Para resolver esse problema, especifique um valor mais longo para o parâmetro timeoutSeconds
da ação aws:runInstances
. Se isso não resolver o problema, investigue por que a etapa demora mais para ser executada do que o esperado