已知问题 - Amazon EMR

已知问题

已知问题

Amazon EMR 发行版 5.32 中存在一个已知问题,其中更改了 hive-site.xml 的权限,以便只有特权用户才能读取它,因为其中可能存储了凭证。这可能会阻止 Hue 读取 hive-site.xml 并导致网页不断重新加载。如果遇到此问题,请添加以下配置来修复此问题:

[ { "Classification": "hue-ini", "Properties": {}, "Configurations": [ { "Classification": "desktop", "Properties": { "server_group":"hive_site_reader" }, "Configurations":[ ] } ] } ]

一个已知的问题是适用于 Apache Ranger 的 EMRFS S3 插件当前不支持 Apache Ranger 的安全区功能。使用安全区功能定义的访问控制限制不适用于您的 Amazon EMR 集群。

应用程序 UI

默认情况下,应用程序 UI 不执行身份验证。这包括 ResourceManager UI、NodeManager UI、Livy UI 等。此外,任何有权访问 UI 的用户都能够查看有关所有其它用户的任务相关信息。

如果不需要这种行为,您应该确保使用安全组来限制用户对应用程序 UI 的访问。

HDFS 原定设置的权限

默认情况下,用户在 HDFS 中创建的对象被授予全局可读权限。这可能会导致无权访问数据的用户也可以读取数据。要更改此行为,以便将默认文件权限设置为仅由任务创建者读取和写入,请执行以下步骤。

创建 EMR 集群时,请提供以下配置:

[ { "Classification": "hdfs-site", "Properties": { "dfs.namenode.acls.enabled": "true", "fs.permissions.umask-mode": "077", "dfs.permissions.superusergroup": "hdfsadmingroup" } } ]

此外,运行以下引导操作:

--bootstrap-actions Name='HDFS UMask Setup',Path=s3://elasticmapreduce/hdfs/umask/umask-main.sh