Amazon EMR versão 4.0.0 - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Amazon EMR versão 4.0.0

Versões do aplicativo 4.0.0

As seguintes aplicações são compatíveis com esta versão: Hadoop, Hive, Mahout, Pig e Spark.

A tabela abaixo lista as versões do aplicativo disponíveis nesta versão da Amazon EMR e as versões do aplicativo nas três EMR versões anteriores da Amazon (quando aplicável).

Para obter um histórico abrangente das versões do aplicativo para cada lançamento da AmazonEMR, consulte os seguintes tópicos:

Informações da versão da aplicação
emr-4.3.0 emr-4.2.0 emr-4.1.0 emr-4.0.0
AWS SDK para Java 1.10.271.10.27Não rastreadasNão rastreadas
Python Não rastreadasNão rastreadasNão rastreadasNão rastreadas
Scala Não rastreadasNão rastreadasNão rastreadasNão rastreadas
AmazonCloudWatchAgent - - - -
Delta - - - -
Flink - - - -
Ganglia3.7.23.6.0 - -
HBase - - - -
HCatalog - - - -
Hadoop2.7.12.6.02.6.02.6.0
Hive1.0.01.0.01.0.01.0.0
Hudi - - - -
Hue3.7.13.7.13.7.1 -
Iceberg - - - -
JupyterEnterpriseGateway - - - -
JupyterHub - - - -
Livy - - - -
MXNet - - - -
Mahout0.11.00.11.00.11.00.10.0
Oozie - - - -
Oozie-Sandbox4.2.04.2.04.0.1 -
Phoenix - - - -
Pig0.14.00.14.00.14.00.14.0
Presto - - - -
Presto-Sandbox0.1300.1250.119 -
Spark1.6.01.5.21.5.01.4.1
Sqoop - - - -
Sqoop-Sandbox - - - -
TensorFlow - - - -
Tez - - - -
Trino (PrestoSQL) - - - -
Zeppelin - - - -
Zeppelin-Sandbox0.5.50.5.50.6.0- SNAPSHOT -
ZooKeeper - - - -
ZooKeeper-Sandbox - - - -

Notas de lançamento da 4.0.0

Versões do componente 4.0.0

Os componentes que a Amazon EMR instala com esta versão estão listados abaixo. Alguns são instalados como parte de pacotes de aplicativos de big data. Outros são exclusivos da Amazon EMR e são instalados para processos e recursos do sistema. Eles normalmente começam com emr ou aws. Os pacotes de aplicativos de big data na versão mais recente da Amazon EMR geralmente são a versão mais recente encontrada na comunidade. Disponibilizamos lançamentos comunitários na Amazon o mais EMR rápido possível.

Alguns componentes na Amazon EMR são diferentes das versões da comunidade. Esses componentes tem um rótulo de versão no formulário CommunityVersion-amzn-EmrVersion. O EmrVersion começa em 0. Por exemplo, se um componente de comunidade de código aberto nomeado myapp-component com a versão 2.2 tiver sido modificado três vezes para inclusão em diferentes EMR versões da Amazon, sua versão de lançamento será listada como2.2-amzn-2.

Componente Version (Versão) Descrição
emr-ddb3.0.0O conector do Amazon DynamoDB para aplicativos do ecossistema do Hadoop.
emr-goodies2.0.0Bibliotecas convenientes para o ecossistema do Hadoop.
emr-kinesis3.0.0O conector do Amazon Kinesis para aplicativos do ecossistema do Hadoop.
emr-s3-dist-cp2.0.0Cópia distribuída otimizada de aplicativos para o Amazon S3.
emrfs2.0.0O conector do Amazon S3 para aplicações do ecossistema do Hadoop.
hadoop-client2.6.0-amzn-0Clientes da linha de comando do Hadoop, como 'hdfs', 'hadoop', ou 'yarn'.
hadoop-hdfs-datanode2.6.0-amzn-0HDFSserviço em nível de nó para armazenar blocos.
hadoop-hdfs-namenode2.6.0-amzn-0HDFSserviço para rastrear nomes de arquivos e localizações de blocos.
hadoop-httpfs-server2.6.0-amzn-0HTTPendpoint para HDFS operações.
hadoop-mapred2.6.0-amzn-0MapReduce bibliotecas de mecanismos de execução para executar um MapReduce aplicativo.
hadoop-yarn-nodemanager2.6.0-amzn-0YARNserviço para gerenciar contêineres em um nó individual.
hadoop-yarn-resourcemanager2.6.0-amzn-0YARNserviço para alocar e gerenciar recursos de cluster e aplicativos distribuídos.
hive-client1.0.0-amzn-0O cliente da linha de comando do Hive.
hive-metastore-server1.0.0-amzn-0Serviço para acessar o metastore Hive, um repositório semântico que armazena metadados para operações no Hadoop. SQL
hive-server1.0.0-amzn-0O serviço que aceita as consultas do Hive como solicitações da web.
mahout-client0.10.0A biblioteca de Machine Learning.
mysql-server5.5Meu servidor SQL de banco de dados.
pig-client0.14.0-amzn-0O cliente da linha de comando do Pig.
spark-client1.4.1Os clientes da linha de comando do Spark.
spark-history-server1.4.1A interface de usuário da web para visualizar os eventos registrados por toda a vida útil de um aplicativo Spark concluído.
spark-on-yarn1.4.1Mecanismo de execução na memória paraYARN.
spark-yarn-slave1.4.1Bibliotecas do Apache Spark necessárias para escravos. YARN

Classificações de configuração 4.0.0

As classificações de configuração permitem que você personalize aplicações. Eles geralmente correspondem a um XML arquivo de configuração do aplicativo, comohive-site.xml. Para ter mais informações, consulte Configurar aplicações.

Classificações do emr-4.0.0
Classificações Descrição

capacity-scheduler

Alterar os valores no arquivo capacity-scheduler.xml do Hadoop.

core-site

Alterar os valores no arquivo core-site.xml do Hadoop.

emrfs-site

Altere EMRFS as configurações.

hadoop-env

Alterar os valores no ambiente do Hadoop para todos os componentes do Hadoop.

hadoop-log4j

Alterar os valores no arquivo log4j.properties do Hadoop.

hdfs-site

Altere os valores em HDFS's hdfs-site.xml.

hive-env

Alterar os valores no ambiente do Hive.

hive-exec-log4j

Altere os valores no arquivo hive-exec-log 4j.properties do Hive.

hive-log4j

Alterar os valores no arquivo hive-log4j.properties do Hive.

hive-site

Alterar os valores no arquivo hive-site.xml do Hive.

httpfs-env

Mude os valores no HTTPFS ambiente.

httpfs-site

Alterar os valores no arquivo httpfs-site.xml do Hadoop.

mapred-env

Altere os valores no ambiente do MapReduce aplicativo.

mapred-site

Altere os valores no arquivo mapred-site.xml do MapReduce aplicativo.

pig-properties

Alterar os valores no arquivo pig.properties do Pig.

pig-log4j

Alterar os valores no arquivo log4j.properties do Pig.

spark

Configurações EMR selecionadas pela Amazon para o Apache Spark.

spark-defaults

Alterar os valores no arquivo spark-defaults.conf do Spark.

spark-env

Alterar os valores no ambiente do Spark.

spark-log4j

Alterar os valores no arquivo log4j.properties do Spark.

yarn-env

Mude os valores no YARN ambiente.

yarn-site

Altere os valores no YARN arquivo yarn-site.xml do.