Éléments à prendre en compte lors de l'utilisation de Zeppelin sur Amazon EMR - Amazon EMR

Éléments à prendre en compte lors de l'utilisation de Zeppelin sur Amazon EMR

  • Connectez-vous à Zeppelin à l'aide de la même méthode de tunnels SSH pour vous connecter aux autres serveurs web sur le nœud principal. Le serveur Zeppelin est disponible sur le port 8890.

  • Zeppelin sur les versions Amazon EMR 5.0.0. et ultérieures prend en charge l'authentification Shiro.

  • Zeppelin sur Amazon EMR version 5.8.0 et ultérieure prend en charge l'utilisation du catalogue de données AWS Glue comme métastore pour Spark SQL. Pour plus d'informations, consultez la section Utilisation du catalogue de données AWS Glue en tant que métastore pour Spark SQL.

  • Zeppelin n'utilise pas certains des paramètres définis dans le fichier de configuration spark-defaults.conf de votre cluster (même s'il demande à YARN d'allouer dynamiquement des exécuteurs si vous avez défini spark.dynamicAllocation.enabled sur true. Vous devez définir des paramètres de l'exécuteur (comme la mémoire et les noyaux) en cliquant sur l'onglet Interpreter (Interprète) de Zeppelin, puis redémarrer l'interprète pour en permettre l'utilisation.

  • Les versions 6.10.0 et supérieures d'Amazon EMR prennent en charge l'intégration d'Apache Zeppelin avec Apache Flink. Pour en savoir plus, consultez Travailler avec les jobs Flink de Zeppelin dans Amazon EMR.

  • Zeppelin sur Amazon EMR ne prend pas en charge l'interpréteur SparkR.