As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurar CloudWatch agente para Amazon EMR 7.0.0
Você pode configurar o CloudWatch agente da Amazon para usar métricas de sistema adicionais além daquelas fornecidas pela configuração padrão do CloudWatch agente. A configuração da versão 7.0.0 requer o uso de ações de bootstrap, das quais fornecemos exemplos nas seções a seguir. Em uma próxima versão, a Amazon EMR fornecerá opções adicionais de configuração por meio da Amazon EMRAPI.
Tópicos
Configure métricas adicionais do sistema com o Amazon EMR 7.0.0
Use as etapas a seguir para configurar o agente para usar um conjunto diferente de métricas do sistema na Amazon EMR 7.0.0:
-
Crie ou escolha um bucket na sua conta do Amazon S3 onde você deseja armazenar os arquivos de configuração que especificam as métricas do CloudWatch agente.
-
Crie o arquivo de configuração
emr-amazon-cloudwatch-agent.json
com suas métricas preferenciais especificadas. Para fazer isso, use um dos métodos explicados em Criar o arquivo de configuração do CloudWatch agente. Para obter mais informações sobre a estrutura do arquivo de configuração do CloudWatch agente, consulte Criar ou editar manualmente o arquivo de configuração do CloudWatch agente no Guia CloudWatch do usuário da Amazon. -
Em seguida, navegue até aws-emr-utilities acesse GitHub e baixe os seguintes scripts de métricas do sistema:
-
install_system_metrics_launcher.sh
: um script que baixa e executa install_system_metrics.sh
em segundo plano para que o nó possa concluir o bootstrapping. -
install_system_metrics.sh
— Um script que espera que a instância em que é executado conclua a inicialização e, em seguida, baixa e aplica a configuração no arquivo. JSON
-
-
Abra cada arquivo SH e substitua
pelo nome do seu bucket da Etapa 1.amzn-s3-demo-bucket
-
Faça upload de um JSON e dois arquivos SH em seu bucket do S3.
-
Agora, você pode navegar até o EMR console da Amazon e criar um novo cluster com o CloudWatch agente. Em Ativado, EMREC2na navegação à esquerda, selecione Clusters e, em seguida, Criar cluster.
-
Na seção Nome e aplicativos, escolha uma EMR versão 7.0.0 ou superior da Amazon.
-
Em Pacote de aplicativos, selecione o pacote ou aplicativos que você deseja instalar em seu cluster e inclua o Amazon CloudWatch Agent em suas seleções.
-
Na seção Ações de bootstrap, selecione Adicionar.
-
Em Nome, insira
install_system_metrics_launcher.sh
. -
Na Localização do script, insira
s3://
. Substituaamzn-s3-demo-bucket
/install_system_metrics_launcher.sh
pelo caminho para o bucket do S3.amzn-s3-demo-bucket
-
Deixe o bloco Argumentos vazio.
-
-
Selecione Adicionar ação de bootstrap.
-
Continue criando o cluster para atender às necessidades da sua workload.
Quando seu cluster é iniciado, o CloudWatch agente publica as métricas do sistema que você especificou no arquivo de configuração para CloudWatch.
Configure métricas de aplicativos com o Amazon EMR 7.0.0
Você pode configurar o CloudWatch agente da Amazon para publicar métricas de aplicativos para HDFS e YARN além das métricas do sistema. Use as etapas a seguir para configurar o agente para publicar as métricas de aplicações.
-
Crie ou escolha um bucket na sua conta do Amazon S3 onde você deseja armazenar os arquivos de configuração que especificam as métricas do CloudWatch agente.
-
Em seguida, navegue até aws-emr-utilities acesse GitHub e baixe os seguintes scripts:
-
install_app_metrics_launcher.sh
: um script que baixa e executa install_app_metrics.sh
em segundo plano para que o nó possa concluir o bootstrapping. -
install_app_metrics.sh
— Um script que espera que a instância em que é executado conclua a inicialização e, em seguida, baixa e aplica a configuração nos YAML arquivos que você baixará em uma próxima etapa.
-
-
Abra cada arquivo e substitua
pelo nome do seu bucket da Etapa 1.amzn-s3-demo-bucket
-
Em seguida, baixe os seguintes arquivos de YAML mapeamento. Para obter informações sobre como esses YAML arquivos são estruturados, consulte
javaagent
no OpenTelemetry Instrumentation for Java GitHub recompra. -
datanode-metrics.yaml
— A configuração para Hadoop DataNode métricas. -
namenode-metrics.yaml
— A configuração para Hadoop NameNode métricas. -
nodemanager-metrics.yaml
— A configuração para Yarn NodeManager métricas. -
resourcemanager-metrics.yaml
— A configuração para Yarn ResourceManager métricas.
-
-
Faça upload dos dois arquivos SH e YAML dos quatro arquivos em seu bucket do S3.
-
Agora, você pode navegar até o EMR console da Amazon e criar um novo cluster com o CloudWatch agente. Em Ativado, EMREC2na navegação à esquerda, selecione Clusters e, em seguida, Criar cluster.
-
Na seção Nome e aplicativos, escolha uma EMR versão 7.0.0 ou superior da Amazon.
-
Em Pacote de aplicativos, selecione o pacote ou grupo personalizado de aplicativos que você deseja instalar no seu cluster e inclua o CloudWatch agente em suas seleções.
-
Na seção Ações de bootstrap, selecione Adicionar.
-
Em Nome, insira
install_app_metrics_launcher.sh
. -
Na Localização do script, insira
s3://
. Substituaamzn-s3-demo-bucket
/install_app_metrics_launcher.sh
pelo caminho para o bucket do S3.amzn-s3-demo-bucket
-
Deixe o bloco Argumentos vazio.
-
-
Selecione Adicionar ação de bootstrap.
-
Continue criando o cluster para atender às necessidades da sua workload.
Quando seu cluster é iniciado, o CloudWatch agente publica as métricas do aplicativo que você especificou junto com as métricas do sistema para CloudWatch.
Configure o Amazon Managed Service para Prometheus como armazenamento em nuvem para métricas com o Amazon 7.0.0 EMR
Você pode configurar o CloudWatch agente da Amazon para publicar métricas no Amazon Managed Service for Prometheus em vez de. CloudWatch
nota
Você pode publicar métricas do CloudWatch agente da Amazon no Amazon Managed Service for Prometheus ou na CloudWatch Amazon, mas não pode publicar as métricas nos dois serviços do mesmo cluster.
Para configurar o agente para publicar métricas no Amazon Managed Service for Prometheus, você deve adicionar aps:RemoteWrite
AWS Identity and Access Management a permissão IAM () ao perfil de instância da Amazon para a EC2 Amazon. EMR O seguinte exemplo de política contém a permissão necessária:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": "aps:RemoteWrite", "Resource": "*" } ] }
Use o CloudWatch agente em um EMR cluster para publicar métricas no Amazon Managed Service for Prometheus
Depois que a política de serviço tiver as permissões corretas, use as etapas a seguir para iniciar um cluster que usa o CloudWatch agente para publicar métricas no Amazon Managed Service for Prometheus.
-
Use o AWS Management Console ou AWS CLI para criar um espaço de trabalho do Amazon Managed Service para Prometheus. Para obter mais informações, consulte Criação de um espaço de trabalho no Guia do usuário do Amazon Managed Service for Prometheus.
-
Crie ou escolha um bucket na sua conta do Amazon S3 onde deseja armazenar os arquivos de execução que especificam o Amazon Managed Service for Prometheus como armazenamento em nuvem.
-
Em seguida, navegue até aws-emr-utilities acesse GitHub e baixe os seguintes scripts:
-
add_prometheus_endpoint_launcher.sh
: um script que baixa e executa add_prometheus_endpoint.sh
em segundo plano para que o nó possa concluir o bootstrapping. -
add_prometheus_endpoint.sh
— Um script que espera que a instância em que é executado conclua a inicialização e, em seguida, configura o CloudWatch agente para publicar no endpoint do Amazon Managed Service for Prometheus, que você fornece como argumento ao iniciar seu cluster.
-
-
Abra cada arquivo e substitua
pelo nome do seu bucket da Etapa 2.amzn-s3-demo-bucket
-
Use o AWS CLI para criar um EMR cluster com a ação
add_prometheus_endpoint_launcher.sh
bootstrap. No comando a seguir, substitua
pelo bucket que contém a ação de bootstrap e substituaamzn-s3-demo-bucket
pelo endpoint de gravação remota do seu espaço de trabalho do Amazon Managed Service for Prometheus. Certifique-se de especificar uma etiqueta de EMR lançamento da Amazon igualmanagedpro-remote-write-workspace-url
emr-7.0.0
ou superior.aws emr create-cluster --name managedpro-cluster \ --release-label emr-7.0.0 \ --applications Name=Hadoop Name=AmazonCloudWatchAgent \ --ec2-attributes KeyName=
myKey
--instance-type m7g.2xlarge \ --instance-count 3 --use-default-roles --bootstrap-actions Name='Add Prometheus Endpoint',Path=s3://amzn-s3-demo-bucket
/add_prometheus_endpoint_launcher.sh,Args='managedpro-remote-write-workspace-url
'
Quando seu cluster é iniciado, o CloudWatch agente publica as métricas coletadas no Amazon Managed Service for Prometheus.
Como usar o Amazon Managed Service for Prometheus como fonte de dados do Amazon Managed Grafana
Depois que a Amazon EMR publicar as métricas do cluster no Amazon Managed Service for Prometheus, você poderá usar as seguintes etapas para visualizar as métricas com o Amazon Managed Grafana:
-
Use o AWS Management Console para criar um espaço de trabalho e um usuário do Amazon Managed Grafana com as permissões apropriadas. Para obter mais informações, consulte Criação de um espaço de trabalho no Guia do usuário do Amazon Managed Grafana.
-
Adicione seu espaço de trabalho do Amazon Managed Service for Prometheus como fonte de dados no Amazon Managed Grafana. Para obter mais informações, consulte Use AWS data source configuration to add Amazon Managed Service for Prometheus as a data source no Guia do usuário do Amazon Managed Grafana.
nota
O CloudWatch agente tem um exportador Prometheus que renomeia determinados atributos. Para os rótulos de métricas padrão, o Amazon Managed Service for Prometheus usa caracteres de sublinhado no lugar dos períodos que a Amazon usa. CloudWatch Portanto, se você usar o Amazon Managed Grafana para visualizar as métricas padrão no Amazon Managed Service for Prometheus, os rótulos aparecerão como jobflow_id
, instance_id
e service_name
.
Além disso, qualquer métrica de aplicativo que o CloudWatch agente publica no Amazon Managed Service for Prometheus usa o rótulo em vez de. job
service_name
No entanto, as métricas do sistema continuam usando o rótulo service_name
.