Adicionando etapas a um cluster com o AWS CLI - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Adicionando etapas a um cluster com o AWS CLI

Os procedimentos a seguir demonstram como adicionar etapas a um cluster recém-criado e a um cluster em execução com o AWS CLI. Ambos os exemplos usam o --steps subcomando para adicionar etapas ao cluster.

Para adicionar etapas durante a criação do cluster
  • Digite o seguinte comando para criar um cluster e adicionar uma etapa do Apache Pig. Certifique-se de substituir myKey com o nome do seu par de EC2 chaves da Amazon.

    aws emr create-cluster --name "Test cluster" \ --applications Name=Spark \ --use-default-roles \ --ec2-attributes KeyName=myKey \ --instance-groups InstanceGroupType=PRIMARY,InstanceCount=1,InstanceType=m5.xlarge InstanceGroupType=CORE,InstanceCount=2,InstanceType=m5.xlarge \ --steps '[{"Args":["spark-submit","--deploy-mode","cluster","--class","org.apache.spark.examples.SparkPi","/usr/lib/spark/examples/jars/spark-examples.jar","5"],"Type":"CUSTOM_JAR","ActionOnFailure":"CONTINUE","Jar":"command-runner.jar","Properties":"","Name":"Spark application"}]'
    nota

    A lista de argumentos muda dependendo do tipo de etapa.

    Por padrão, o nível de simultaneidade da etapa é 1. É possível definir o nível de simultaneidade da etapa usando o parâmetro StepConcurrencyLevel ao criar um cluster.

    A saída é um identificador de cluster semelhante ao seguinte:

    { "ClusterId": "j-2AXXXXXXGAPLF" }
Para adicionar uma etapa a um cluster em execução
  • Digite o seguinte comando para adicionar uma etapa a um cluster em execução. Substitua j-2AXXXXXXGAPLF por seu próprio ID do cluster.

    aws emr add-steps --cluster-id j-2AXXXXXXGAPLF \ --steps '[{"Args":["spark-submit","--deploy-mode","cluster","--class","org.apache.spark.examples.SparkPi","/usr/lib/spark/examples/jars/spark-examples.jar","5"],"Type":"CUSTOM_JAR","ActionOnFailure":"CONTINUE","Jar":"command-runner.jar","Properties":"","Name":"Spark application"}]'

    A saída é um identificador de etapa semelhante ao seguinte:

    { "StepIds": [ "s-Y9XXXXXXAPMD" ] }
Para modificar o StepConcurrencyLevel em um cluster em execução
  1. Em um cluster em execução, você pode modificar o StepConcurrencyLevel com ModifyCluster API o. Por exemplo, digite o seguinte comando para aumentar o StepConcurrencyLevel para 10. Substitua j-2AXXXXXXGAPLF pelo nome do ID do cluster.

    aws emr modify-cluster --cluster-id j-2AXXXXXXGAPLF --step-concurrency-level 10
  2. A saída é semelhante à seguinte.

    { "StepConcurrencyLevel": 10 }

Para obter mais informações sobre o uso dos EMR comandos da Amazon no AWS CLI, veja o AWS CLI Referência de comando.