Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

API de catálogos

Modo de enfoque
API de catálogos - AWS Glue

La API de catálogos describe las API de creación, eliminación, localización, actualización y creación de listados de catálogos.

Tipos de datos

Estructura del catálogo

El objeto de catálogo representa una agrupación lógica de bases de datos en el catálogo de datos de AWS Glue o en un origen federado. Puede crear un catálogo federado de Redshift o un catálogo que contenga enlaces de recursos a bases de datos de Redshift en otra cuenta o región.

Campos
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el ID del catálogo. Para permitir el acceso al catálogo predeterminado, no debe proporcionar este campo.

  • Name (obligatorio): cadena UTF-8, cuya extensión tenga 1 byte como mínimo y 64 bytes como máximo y que coincide con Custom string pattern #25.

    Es el nombre del catálogo. No puede ser el mismo que el ID de la cuenta.

  • ResourceArn: cadena UTF-8.

    Es el nombre de recurso de Amazon (ARN) asignado al recurso del catálogo.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Cadena de descripción, cuya extensión no sea más de 2048 bytes y que coincida con el patrón de cadena de varias líneas de la dirección URI. Es una descripción del catálogo.

  • Parameters: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Matriz de mapas de pares clave-valor que define los parámetros y las propiedades del catálogo.

  • CreateTime: marca temporal.

    Es la hora a la que se creó el catálogo.

  • UpdateTime: marca temporal.

    Es la hora en la que se actualizó el catálogo por última vez.

  • TargetRedshiftCatalog: un objeto TargetRedshiftCatalog.

    Objeto TargetRedshiftCatalog que describe un catálogo de destino para la vinculación de recursos de la base de datos.

  • FederatedCatalog: un objeto FederatedCatalog.

    Objeto FederatedCatalog que apunta a una entidad externa al catálogo de datos de AWS Glue.

  • CatalogProperties: un objeto CatalogPropertiesOutput.

    Objeto CatalogProperties que especifica las propiedades de acceso al lago de datos y otras propiedades personalizadas.

  • CreateTableDefaultPermissions: matriz de objetos PrincipalPermissions.

    Una matriz de objetos PrincipalPermissions. Permite crear un conjunto de permisos predeterminados en las tablas de las entidades principales. Lo utiliza AWS Lake Formation. No se utiliza en el transcurso normal de las operaciones de AWS Glue.

  • CreateDatabaseDefaultPermissions: matriz de objetos PrincipalPermissions.

    Una matriz de objetos PrincipalPermissions. Permite crear un conjunto de permisos predeterminados en las bases de datos de las entidades principales. Lo utiliza AWS Lake Formation. No se utiliza en el transcurso normal de las operaciones de AWS Glue.

Estructura CatalogInput

Estructura que describe las propiedades del catálogo.

Campos
  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Cadena de descripción, cuya extensión no sea más de 2048 bytes y que coincida con el patrón de cadena de varias líneas de la dirección URI. Es una descripción del catálogo.

  • FederatedCatalog: un objeto FederatedCatalog.

    Un objeto FederatedCatalog. Estructura FederatedCatalog que hace referencia a una entidad externa al catálogo de datos de AWS Glue; por ejemplo, una base de datos de Redshift.

  • Parameters: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Matriz de mapas de pares clave-valor que define los parámetros y las propiedades del catálogo.

  • TargetRedshiftCatalog: un objeto TargetRedshiftCatalog.

    Objeto TargetRedshiftCatalog que describe un catálogo de destino para la vinculación de recursos.

  • CatalogProperties: un objeto CatalogProperties.

    Objeto CatalogProperties que especifica las propiedades de acceso al lago de datos y otras propiedades personalizadas.

  • CreateTableDefaultPermissions: matriz de objetos PrincipalPermissions.

    Una matriz de objetos PrincipalPermissions. Permite crear un conjunto de permisos predeterminados en las tablas de las entidades principales. Lo utiliza AWS Lake Formation. Por lo general, se debe establecer de forma explícita como una lista vacía.

  • CreateDatabaseDefaultPermissions: matriz de objetos PrincipalPermissions.

    Una matriz de objetos PrincipalPermissions. Permite crear un conjunto de permisos predeterminados en las bases de datos de las entidades principales. Lo utiliza AWS Lake Formation. Por lo general, se debe establecer de forma explícita como una lista vacía.

Estructura TargetRedshiftCatalog

Estructura que describe un catálogo de destino para la vinculación de recursos.

Campos
  • CatalogArnObligatorio: cadena UTF-8.

    El nombre de recurso de Amazon (ARN) del recurso de catálogo.

Estructura CatalogoProperties

Estructura que especifica las propiedades de acceso al lago de datos y otras propiedades personalizadas.

Campos
  • DataLakeAccessProperties: un objeto DataLakeAccessProperties.

    Objeto DataLakeAccessProperties que especifica las propiedades para configurar el acceso al lago de datos del recurso de catálogo en el catálogo de datos de AWS Glue.

  • CustomProperties: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Propiedades de valores clave adicionales para el catálogo, como las optimizaciones de las estadísticas de columnas.

Estructura CatalogPropertiesOutput

Atributos de propiedad que incluyen las propiedades de configuración del recurso del catálogo.

Campos
  • DataLakeAccessProperties: un objeto DataLakeAccessPropertiesOutput.

    Objeto DataLakeAccessProperties con propiedades de entrada para configurar el acceso al lago de datos del recurso de catálogo en el catálogo de datos de AWS Glue.

  • CustomProperties: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Propiedades de valores clave adicionales para el catálogo, como las optimizaciones de las estadísticas de columnas.

Estructura de DataLakeAccessProperties

Propiedades de entrada para configurar el acceso al lago de datos del recurso de catálogo en el catálogo de datos de AWS Glue.

Campos
  • DataLakeAccess: booleano.

    Permite activar o desactivar el acceso al lago de datos en las aplicaciones de Apache Spark que acceden a las bases de datos de Amazon Redshift del catálogo de datos desde cualquier motor que no sea Redshift, como Amazon Athena, Amazon EMR o ETL AWS Glue.

  • DataTransferRole: cadena UTF-8 que coincide con el Custom string pattern #51.

    Rol que asumirá AWS Glue para realizar la transferencia de datos hacia o desde el bucket transitorio durante una consulta.

  • KmsKey: cadena UTF-8.

    Clave de cifrado que se utilizará en el bucket transitorio y que se creará junto con el catálogo.

  • CatalogType: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Especifica un tipo de catálogo federado para el recurso de catálogo nativo. El tipo que se admite actualmente es aws:redshift.

Estructura de DataLakeAccessPropertiesOutput

Propiedades de salida para configurar el acceso al lago de datos del recurso de catálogo en el catálogo de datos de AWS Glue.

Campos
  • DataLakeAccess: booleano.

    Permite activar o desactivar el acceso al lago de datos en las aplicaciones de Apache Spark que acceden a las bases de datos de Amazon Redshift del catálogo de datos.

  • DataTransferRole: cadena UTF-8 que coincide con el Custom string pattern #51.

    Rol que asumirá AWS Glue para realizar la transferencia de datos hacia o desde el bucket transitorio durante una consulta.

  • KmsKey: cadena UTF-8.

    Clave de cifrado que se utilizará en el bucket transitorio y que se creará junto con el catálogo.

  • ManagedWorkgroupName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el nombre de computación administrado de Redshift sin servidor que se crea para el recurso de catálogo.

  • ManagedWorkgroupStatus: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el estado de computación administrado de Redshift sin servidor.

  • RedshiftDatabaseName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el nombre predeterminado del recurso de base de datos de Redshift en la computación administrada.

  • StatusMessage: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Mensaje que proporciona información más detallada sobre el estado del grupo de trabajo administrado.

  • CatalogType: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Especifica un tipo de catálogo federado para el recurso de catálogo nativo. El tipo que se admite actualmente es aws:redshift.

Estructura FederatedCatalog

Catálogo que apunta a una entidad externa al catálogo de datos de AWS Glue.

Campos
  • Identifier: cadena UTF-8, con 1 byte de largo como mínimo y 512 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Identificador único del catálogo federado.

  • ConnectionName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el nombre de la conexión a un origen de datos externo; por ejemplo, un catálogo federado de Redshift.

Operaciones

Acción CreateCatalog (Python: create_catalog)

Permite crear un nuevo catálogo en el catálogo de datos de AWS Glue.

Solicitud
  • Name (obligatorio): cadena UTF-8, cuya extensión tenga 1 byte como mínimo y 64 bytes como máximo y que coincide con Custom string pattern #25.

    Nombre del catálogo que se va a crear.

  • CatalogInput: obligatorio: objeto CatalogInput.

    Objeto CatalogInput que define los metadatos del catálogo.

  • Tags: matriz de mapas de pares de clave-valor, con 50 pares como máximo.

    Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes.

    Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo.

    Matriz de mapas de pares clave-valor, con 50 pares como máximo. Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes. Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo. Son las etiquetas que asigna al catálogo.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • InvalidInputException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • AccessDeniedException

  • EntityNotFoundException

  • FederatedResourceAlreadyExistsException

  • FederationSourceException

Acción UpdateCatalog (Python: update_catalog)

Permite actualizar las propiedades de un catálogo existente en el catálogo de datos de AWS Glue.

Solicitud
  • CatalogId: Obligatorio: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el ID del catálogo.

  • CatalogInput: obligatorio: objeto CatalogInput.

    Objeto CatalogInput que especifica las propiedades nuevas de un catálogo existente.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • AccessDeniedException

  • FederationSourceException

Acción DeleteCatalog (Python: delete_catalog)

Permite eliminar el catálogo especificado del catálogo de datos de AWS Glue.

Después de completar esta operación, ya no tendrá acceso a las bases de datos, tablas (y todas las versiones y particiones de tabla que podrían pertenecer a las tablas) ni a las funciones definidas por el usuario en el catálogo eliminado. AWS Glue elimina estos recursos “huérfanos” de manera asíncrona y oportuna, según lo solicite el servicio.

Para garantizar la eliminación inmediata de todos los recursos relacionados, antes de llamar a la operación DeleteCatalog, use DeleteTableVersion (o BatchDeleteTableVersion), DeletePartition (o BatchDeletePartition), DeleteTable (o BatchDeleteTable), DeleteUserDefinedFunction y DeleteDatabase para eliminar todos los recursos que pertenezcan al catálogo.

Solicitud
  • CatalogId: Obligatorio: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Es el ID del catálogo.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • AccessDeniedException

  • FederationSourceException

Acción GetCatalog (Python: get_catalog)

Es el nombre del catálogo que se va a recuperar. Debe estar todo en minúsculas.

Solicitud
  • CatalogId: Obligatorio: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    ID del catálogo principal donde reside el catálogo. Si no se proporciona ninguno, se usará de forma predeterminada el número de cuenta de AWS.

Respuesta
  • Catalog: un objeto Catálogo.

    Un objeto Catalog. Definición del catálogo especificado en el catálogo de datos de AWS Glue.

Errores
  • InvalidInputException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • AccessDeniedException

  • EntityNotFoundException

  • FederationSourceException

  • FederationSourceRetryableException

Acción GetCatalogs (Python: get_catalogs)

Permite recuperar todos los catálogos definidos en un catálogo del catálogo de datos de AWS Glue. Para un caso de uso de un catálogo federado por Redshift, esta operación devuelve la lista de catálogos asignados a las bases de datos de Redshift en el catálogo de espacios de nombres de Redshift.

Solicitud
  • ParentCatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    ID del catálogo principal donde reside el catálogo. Si no se proporciona ninguno, se usará de forma predeterminada el número de cuenta de AWS.

  • NextToken: cadena UTF-8.

    Token de continuación si se trata de una llamada de continuidad.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    Número máximo de catálogos que se devuelven en una respuesta.

  • Recursive: booleano.

    Si se especifica como “true”, se itera sobre la cuenta y devuelve todos los recursos del catálogo (incluidos los recursos de nivel superior y los recursos secundarios).

Respuesta
  • CatalogList (obligatorio): una matriz de objetos Catálogo.

    Una matriz de objetos Catalog. Lista de objetos Catalog del catálogo principal especificado.

  • NextToken: cadena UTF-8.

    Token de continuación para paginar la lista de tokens obtenida; se devuelve si el segmento actual de la lista no es el último.

Errores
  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • AccessDeniedException

  • EntityNotFoundException

  • FederationSourceException

  • FederationSourceRetryableException

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.