Éléments à prendre en compte lors de l'utilisation de Zeppelin sur Amazon EMR

Connectez-vous à Zeppelin à l'aide de la même méthode de tunnels SSH pour vous connecter aux autres serveurs web sur le nœud principal. Le serveur Zeppelin est disponible sur le port 8890.
Zeppelin sur les versions Amazon EMR 5.0.0. et ultérieures prend en charge l'authentification Shiro.
Les versions 5.8.0 et ultérieures de Zeppelin on Amazon EMR prennent en charge l'utilisation de AWS Glue Data Catalog comme métastore pour Spark SQL. Pour plus d'informations, consultez la section Utilisation du catalogue de données AWS Glue comme métastore pour Spark SQL.
Zeppelin n'utilise pas certains des paramètres définis dans le fichier de configuration spark-defaults.conf de votre cluster (même s'il demande à YARN d'allouer dynamiquement des exécuteurs si vous avez défini spark.dynamicAllocation.enabled sur true. Vous devez définir des paramètres de l'exécuteur (comme la mémoire et les noyaux) en cliquant sur l'onglet Interpreter (Interprète) de Zeppelin, puis redémarrer l'interprète pour en permettre l'utilisation.
Les versions 6.10.0 et supérieures d'Amazon EMR prennent en charge l'intégration d'Apache Zeppelin avec Apache Flink. Pour plus d’informations, consultez Travailler avec les jobs Flink de Zeppelin dans Amazon EMR.
Zeppelin sur Amazon EMR ne prend pas en charge l'interpréteur SparkR.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Zeppelin

Historique des versions de Zeppelin