Apache Hadoop - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Apache Hadoop

Apache Hadoop è un framework open source software Java che supporta l'elaborazione di enormi volumi di dati su un cluster di istanze. Può essere eseguito su una singola istanza o migliaia di istanze. Hadoop utilizza vari modelli di elaborazione, come MapReduce Tez, per distribuire l'elaborazione su più istanze e utilizza anche un file system distribuito chiamato HDFS per archiviare i dati su più istanze. Hadoop monitora lo stato delle istanze del cluster ed è in grado di recuperarle in caso di errore di uno o più nodi. In questo modo, Hadoop fornisce una maggiore elaborazione e capacità di storage, nonché l'elevata disponibilità. Per ulteriori informazioni, consulta la documentazione Hadoop.

La seguente tabella indica la versione di Hadoop inclusa nell'ultimo rilascio della serie Amazon EMR 7.x insieme ai componenti che Amazon EMR installa con Hadoop.

Per la versione dei componenti installati con Hadoop in questa versione, vedere Versioni dei componenti della release 7.1.0.

Informazioni sulla versione Hadoop per emr-7.1.0
Etichetta di rilascio di Amazon EMR Versione Hadoop Componenti installati con Hadoop

emr-7.1.0

Hadoop 3.3.6

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

La seguente tabella indica la versione di Hadoop inclusa nell'ultimo rilascio della serie Amazon EMR 6.x insieme ai componenti che Amazon EMR installa con Hadoop.

Per la versione dei componenti installati con Hadoop in questo rilascio, consulta la sezione Versioni dei componenti del rilascio 6.15.0.

Informazioni sulla versione di Hadoop per emr-6.15.0
Etichetta di rilascio di Amazon EMR Versione Hadoop Componenti installati con Hadoop

emr-6.15.0

Hadoop 3.3.6

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

La seguente tabella indica la versione di Hadoop inclusa nell'ultimo rilascio della serie Amazon EMR 5.x insieme ai componenti che Amazon EMR installa con Hadoop.

Per la versione dei componenti installati con Hadoop in questa versione, vedere Versioni dei componenti della release 5.36.2.

Informazioni sulla versione Hadoop per emr-5.36.2
Etichetta di rilascio di Amazon EMR Versione Hadoop Componenti installati con Hadoop

emr-5.36.2

Hadoop 2.10.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

A partire da Amazon EMR rilascio 5.18.0, è possibile utilizzare i repository degli artefatti di Amazon EMR per creare il codice di processo secondo le versioni esatte di librerie e dipendenze disponibili con rilasci Amazon EMR specifici. Per ulteriori informazioni, consulta Verifica delle dipendenze mediante il repository degli artifact di Amazon EMR.