Paso 4: Configurar los permisos para una tabla de Hudi - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Paso 4: Configurar los permisos para una tabla de Hudi

En esta sección, aprenderá a crear una tabla de Delta Lake con un archivo de manifiesto de enlaces simbólicos en el AWS Glue Data Catalog, a configurar los permisos de datos AWS Lake Formation y a consultarlos con Amazon Athena.

Para crear una tabla de Delta Lake.

En este paso, ejecutará un AWS Glue trabajo que creará una tabla transaccional de Delta Lake en el catálogo de datos.

  1. Inicie sesión en la AWS Glue consola en https://console.aws.amazon.com/glue/ en la región EE.UU. Este (Norte de Virginia)

    como usuario administrador del lago de datos.

  2. En el panel de navegación izquierdo, seleccione trabajos.

  3. Seleccione native-delta-create.

  4. En Acciones, seleccione Editar trabajo.

  5. En Detalles del trabajo, expanda Propiedades avanzadas y active la casilla situada junto a Usar AWS Glue Data Catalog como metaalmacén de Hive para añadir los metadatos de la tabla en. AWS Glue Data Catalog Esto especifica AWS Glue Data Catalog el metaalmacén de los recursos del catálogo de datos utilizados en el trabajo y permite que los permisos de Lake Formation se apliquen más adelante a los recursos del catálogo.

  6. Seleccione Guardar.

  7. Seleccione Ejecutar en Acciones.

    Este trabajo crea una tabla de Delta Lake de nombre product en la base de datos lfdeltadb. Verifique la tabla product en la consola de Lake Formation.

Para registrar la ubicación de los datos con Lake Formation

A continuación, registre una ruta de Amazon S3 como ubicación raíz de su lago de datos.

  1. Abra la consola de Lake Formation como administrador del lago de datos en https://console.aws.amazon.com/lakeformation/.

  2. En el panel de navegación, en Registrar e ingerir, seleccione Ubicación de los datos.

  3. En la parte superior derecha de la consola, seleccione Registrar ubicación.

  4. En la página Registrar ubicación, introduzca:

    • Ruta de Amazon S3: seleccione Examinar y elija lf-otf-datalake-123456789012. Haga clic en la flecha derecha (>) junto a la ubicación raíz de Amazon S3 para ir a la ubicación s3/buckets/lf-otf-datalake-123456789012/transactionaldata/native-delta.

    • Rol de IAM: seleccione LF-OTF-RegisterRole como rol de IAM.

    • Seleccione Registrar ubicación.

Para conceder permisos de lago de datos en la tabla de Delta Lake

En este paso, concederemos permisos de lago de datos al usuario analista de negocios.

  1. En Permisos del lago de datos, seleccione Conceder.

  2. En la pantalla Conceder permisos de datos, seleccione Usuarios y roles de IAM.

  3. lf-consumer-analystuser en el menú desplegable.

  4. Seleccione un recurso de Catálogo de datos con nombre.

  5. En Bases de datos, seleccione lfdeltadb.

  6. En Tablas, seleccione product.

  7. A continuación, puede conceder el acceso basado en columnas especificando las columnas.

    1. En Permisos de tabla, marque Seleccionar.

    2. En Permisos de datos, seleccione Acceso basado en columnas e Incluir columnas.

    3. Seleccione las columnas product_name, price y category.

    4. Elija Conceder.

Para consultar la tabla de Delta Lake con Athena

Ahora puede empezar a consultar la tabla de Delta Lake que creó con Athena. Si es la primera vez que ejecuta consultas en Athena, debe configurar una ubicación de resultados de consulta. Para obtener más información, consulte Especificación de una ubicación de resultados de consulta.

  1. Cierre sesión como usuario administrador del lago de datos e inicie sesión como BusinessAnalystUser en la región EE.UU. Este (Virginia del Norte) con la contraseña indicada anteriormente en el AWS CloudFormation resultado.

  2. Abra la consola de Athena en https://console.aws.amazon.com/athena/.

  3. Elija Configuración y seleccione Administrar.

  4. En el cuadro Ubicación del resultado de la consulta, introduzca la ruta al depósito que creó en AWS CloudFormation los resultados. Copie el valor de AthenaQueryResultLocation (s3://lf-otf-tutorial-123456789012/athena-results/) y guarde.

  5. Ejecute la consulta siguiente para obtener una vista previa de los 10 registros almacenados en la tabla de Delta Lake:

    select * from lfdeltadb.product limit 10;

    Para obtener más información sobre la consulta de tablas de Delta Lake, vaya a Consulta de tablas de Delta Lake en la Guía del usuario de Amazon Athena.