本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 Amazon 上使用齐柏林飞艇时的注意事项 EMR
-
使用相同的SSH隧道方法连接齐柏林飞艇,以连接到主节点上的其他 Web 服务器。Zeppelin 服务器可以在端口 8890 上找到。
亚马逊上的齐柏林飞艇EMR发布版本5.8.0及更高版本,支持使用Glue Data Catalog作为 AWS Spark的元数据库。SQL有关更多信息,请参阅使用 AWS Glue 数据目录作为 Spark SQL 的元数据库。
-
齐柏林飞艇不使用集群
spark-defaults.conf
配置文件中定义的某些设置,尽管它会指示YARN动态分配执行器(如果您已设置为)。spark.dynamicAllocation.enabled
true
您必须使用 Zeppelin Interpreter (解释器) 选项卡设置执行者设置 (如内存和内核),然后为要使用的设置重新启动解释器。 -
亚马逊EMR发布的 6.10.0 及更高版本支持 Apache Zeppelin 与 Apache Flink 集成。请参阅在 Amazon EMR 中通过 Zeppelin 使用 Flink 作业了解更多信息。
-
亚马逊上的齐柏林飞艇EMR不支持 SparkR 解释器。