Requisitos previos para conectar el Catálogo de datos al metaalmacén de Hive - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos previos para conectar el Catálogo de datos al metaalmacén de Hive

Para conectarse AWS Glue Data Catalog a un metabastore externo de Apache Hive y configurar los permisos de acceso a los datos, debe cumplir los siguientes requisitos:

nota

Recomendamos que un administrador de Lake Formation despliegue la AWS SAM aplicación y que solo un usuario privilegiado utilice la conexión del metaalmacén de Hive para crear las bases de datos federadas correspondientes.

  1. Crear roles de IAM.
    Para implementar la aplicación AWS SAM
    • Cree un rol que tenga los permisos necesarios para implementar los recursos (función Lambda Amazon API Gateway, rol de IAM y la AWS Glue conexión) necesarios para crear una conexión al metaalmacén de Hive.

    Para crear bases de datos federadas

    Se necesitan los siguientes permisos en los recursos:

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Registre la ruta de Amazon S3 en Lake Formation.

    Para utilizar Lake Formation para gestionar y proteger los datos de su lago de datos, debe registrar la ubicación de Amazon S3 que contiene los datos de las tablas en el metaalmacén de Hive con Lake Formation. De este modo, Lake Formation puede vender credenciales a servicios AWS analíticos como Athena, Redshift Spectrum y Amazon EMR.

    Para obtener más información sobre el registro de una ubicación de Amazon S3, consulte Añadir una ubicación de Amazon S3 a su lago de datos.

    Cuando registre la ubicación de Amazon S3, seleccione la casilla de verificación Habilitar la federación del Catálogo de datos para permitir que Lake Formation asuma un rol de acceso a las tablas de una base de datos federada.

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    Para obtener más información sobre el registro de una ubicación de datos en Lake Formation, consulte Configurar una ubicación de Amazon S3 para el lago de datos.

  3. Utilice la versión correcta de Amazon EMR.

    Para utilizar Amazon EMR con las bases de datos federadas del metaalmacén de Hive, debe disponer de Hive versión 3.x o superior y Amazon EMR versión 6.x o superior.