Considérations relatives à l'utilisation de Zeppelin sur Amazon EMR - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Considérations relatives à l'utilisation de Zeppelin sur Amazon EMR

  • Connectez-vous à Zeppelin en utilisant la même méthode de SSH tunneling pour vous connecter à d'autres serveurs Web sur le nœud principal. Le serveur Zeppelin est disponible sur le port 8890.

  • Les EMR versions 5.0.0 et ultérieures de Zeppelin sur Amazon prennent en charge l'authentification Shiro.

  • Les EMR versions 5.8.0 et ultérieures de Zeppelin sur Amazon prennent en charge l'utilisation de AWS Glue Data Catalog comme métastore pour Spark. SQL Pour plus d'informations, consultez Utiliser le catalogue de données AWS Glue comme métastore pour Spark. SQL

  • Zeppelin n'utilise pas certains des paramètres définis dans le fichier de spark-defaults.conf configuration de votre cluster, même s'il indique d'allouer des exécuteurs YARN de manière dynamique si vous l'avez défini. spark.dynamicAllocation.enabled true Vous devez définir des paramètres de l'exécuteur (comme la mémoire et les noyaux) en cliquant sur l'onglet Interpreter (Interprète) de Zeppelin, puis redémarrer l'interprète pour en permettre l'utilisation.

  • EMRLes versions 6.10.0 et supérieures d'Amazon prennent en charge l'intégration d'Apache Zeppelin avec Apache Flink. Pour plus d’informations, consultez Travailler avec les jobs Flink de Zeppelin dans Amazon EMR.

  • Zeppelin sur Amazon EMR ne prend pas en charge l'interpréteur SparkR.