Requisitos previos para conectar el Catálogo de datos al metaalmacén de Hive - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos previos para conectar el Catálogo de datos al metaalmacén de Hive

Para conectarse AWS Glue Data Catalog a un metabastore externo de Apache Hive y configurar los permisos de acceso a los datos, debe cumplir los siguientes requisitos:

nota

Recomendamos que un administrador de Lake Formation despliegue la AWS SAM aplicación y que solo un usuario privilegiado utilice la conexión del metaalmacén de Hive para crear las bases de datos federadas correspondientes.

  1. Cree roles. IAM
    Para implementar la AWS SAM aplicación
    • Cree un rol que tenga los permisos necesarios para implementar los recursos (función Lambda Amazon API Gateway, IAM rol y AWS Glue conexión) necesarios para crear una conexión al metaalmacén de Hive.

    Para crear bases de datos federadas

    Los recursos requieren los siguientes permisos:

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Registre la ruta de Amazon S3 en Lake Formation.

    Para utilizar Lake Formation para gestionar y proteger los datos de su lago de datos, debe registrar la ubicación de Amazon S3 que contiene los datos de las tablas en el metaalmacén de Hive con Lake Formation. De este modo, Lake Formation puede vender credenciales a servicios AWS analíticos como Athena, Redshift Spectrum y Amazon. EMR

    Para obtener más información sobre el registro de una ubicación de Amazon S3, consulte Añadir una ubicación de Amazon S3 a su lago de datos.

    Cuando registre la ubicación de Amazon S3, seleccione la casilla Habilitar la federación de catálogos de datos para permitir que Lake Formation asuma una función de acceso a las tablas de una base de datos federada.

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    Para obtener más información sobre el registro de una ubicación de datos en Lake Formation, consulte Configurar una ubicación de Amazon S3 para el lago de datos.

  3. Usa la EMR versión correcta de Amazon.

    Para usar Amazon EMR con las bases de datos federadas de Metastore de Hive, debe tener Hive versión 3.x o superior y Amazon EMR versión 6.x o superior.