Registrar un esquema en AWS Glue - AWS Adherencia

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Registrar un esquema en AWS Glue

Después de que el desarrollador de AWS Glue ha codificado el esquema y ha cargado un archivo ZIP a Amazon Simple Storage Service (Amazon S3), un administrador de AWS Glue debe registrar el esquema. Registrar el proyecto hace que esté disponible para su uso.

Cuando registra un esquema, AWS Glue copia el archivo de esquemas en una ubicación reservada de Amazon S3. Podrá eliminar el archivo de la ubicación de carga.

Para registrar un proyecto, necesita permisos de lectura en la ubicación de Amazon S3 que contiene el archivo cargado. También necesita el permiso de AWS Identity and Access Management (IAM), glue:CreateBlueprint. Para obtener los permisos sugeridos para un administrador de AWS Glue que debe registrar, ver y mantener los esquemas, consulte Permisos de administrador de AWS Glue para esquemas.

Puede registrar un esquema con la consola de AWS Glue, la API de AWS Glue o AWS Command Line Interface (AWS CLI).

Para registrar un proyecto (consola)
  1. Asegúrese de que dispone de permisos de lectura (s3:GetObject) en el archivo ZIP del proyecto en Amazon S3.

  2. Abra la consola de AWS Glue en https://console.aws.amazon.com/glue/.

    Inicie sesión como usuario con permisos para registrar un proyecto. Cambie a la misma región de AWS que el bucket de Amazon S3 que contiene el archivo ZIP del proyecto.

  3. En el panel de navegación, elija Blueprints (Esquemas). Luego, en la página Blueprints (Esquemas), elija Add blueprint (Agregar esquema).

  4. Escriba un nombre de proyecto y una descripción opcional.

  5. Para ZIP archive location (S3) [Ubicación del archivo ZIP (S3)], ingrese la ruta de Amazon S3 del archivo ZIP del proyecto que se subió. Incluya el nombre del archivo en la ruta y comience la ruta con s3://.

  6. (Opcional) agregue una o más etiquetas.

  7. Elija Add blueprint (Agregar proyecto).

    La página Blueprints (Esquemas) vuelve a aparecer y muestra que el estado del proyecto es CREATING. Elija el botón de actualización hasta que el estado cambie a ACTIVE o FAILED.

  8. Si el estado es FAILED, seleccione el proyecto y, en el menú Actions (Acciones), elija View (Visualizar).

    En la página de detalles se muestra el motivo del error. Si el mensaje de error es “Unable to access object at location... (No se puede acceder al objeto en la ubicación...)” o “Access denied on object at location... (Acceso denegado al objeto en la ubicación...)”, revise los siguientes requisitos:

    • El usuario con el que ha iniciado sesión debe tener permiso de lectura en el archivo ZIP del proyecto en Amazon S3.

    • El bucket de Amazon S3 que contiene el archivo ZIP debe tener una política de bucket que otorgue permiso de lectura sobre el objeto a su ID de cuenta de AWS. Para obtener más información, consulte Desarrollo de esquemas en AWS Glue.

    • El bucket de Amazon S3 que está utilizando debe estar en la misma región que la región en la que ha iniciado sesión en la consola.

  9. Asegúrese de que los analistas de datos tengan permisos sobre el proyecto.

    La política de IAM sugerida para analistas de datos se muestra en Permisos de analista de datos para esquemas. Esta política concede glue:GetBlueprint sobre cualquier recurso. Si su política está más detallada al nivel de recursos, otorgue permisos a los analistas de datos sobre este recurso recién creado.

Para registrar un proyecto (AWS CLI)
  1. Escriba el siguiente comando.

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. Ingrese el siguiente comando para comprobar el estado del proyecto. Repita el comando hasta que el estado cambie a ACTIVE o FAILED.

    aws glue get-blueprint --name <blueprint-name>

    Si el estado es FAILED y el mensaje de error es “Unable to access object at location... (No se puede acceder al objeto en la ubicación...)” o “Access denied on object at location... (Acceso denegado al objeto en la ubicación...)”, revise los siguientes requisitos:

    • El usuario con el que ha iniciado sesión debe tener permiso de lectura en el archivo ZIP del proyecto en Amazon S3.

    • El bucket de Amazon S3 que contiene el archivo ZIP debe tener una política de bucket que otorgue permiso de lectura sobre el objeto a su ID de cuenta de AWS. Para obtener más información, consulte Publicación de un esquema.

    • El bucket de Amazon S3 que está utilizando debe estar en la misma región que la región en la que ha iniciado sesión en la consola.