Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Uso de la consola de Athena para conectarse a un origen de datos

Modo de enfoque
Uso de la consola de Athena para conectarse a un origen de datos - Amazon Athena

Puede utilizar la consola de Athena para crear y configurar una conexión de origen de datos.

Para crear una conexión a un origen de datos
  1. Abra la consola de Athena en https://console.aws.amazon.com/athena/.

  2. Si el panel de navegación de la consola no está visible, elija el menú de expansión de la izquierda.

    Elija el menú de expansión.
  3. En el panel de navegación, elija Orígenes de datos y catálogos.

  4. En la página Orígenes de datos y catálogos, elija Crear origen de datos.

  5. En Elegir origen de datos, elija el origen de datos que quiera que Athena consulte, tenga en cuenta las siguientes recomendaciones:

    • Elija una opción de conexión que corresponda al origen de datos. Athena tiene conectores de orígenes de datos precreados que se pueden configurar para los orígenes, entre ellos, MySQL, Amazon DocumentDB y PostgreSQL.

    • Elija S3 -AWS Glue Data Catalog si quiere consultar datos en Amazon S3 y no utiliza un metastore de Apache Hive ni ninguna de las otras opciones de origen de datos de consultas federadas de esta página. Athena utiliza AWS Glue Data Catalog para almacenar metadatos e información de esquemas de orígenes de datos en Amazon S3. Esta es la opción predeterminada (no federada). Para obtener más información, consulte Utilice AWS Glue Data Catalog para conectarse a los datos. Para conocer los pasos a seguir con este flujo de trabajo, consulte Registro y uso de catálogos de datos en Athena.

    • Elija S3 - Apache Hive metastore (S3: metastore de Apache Hive) para consultar conjuntos de datos en Amazon S3 que utilicen un metastore de Apache Hive. Para obtener más información acerca de esta opción, consulta Conexión de Athena a un metastore de Apache Hive.

    • Elija Custom or shared connector (Conector personalizado o compartido) si quiere crear su propio conector de origen de datos para usarlo con Athena. Para obtener información sobre cómo la escritura de un conector de origen de datos, consulte Desarrollo de un conector de origen de datos mediante el SDK de Athena Query Federation.

  6. Elija Siguiente.

  7. En la página Ingresar detalles del origen de datos, en Nombre del origen de datos, utilice el nombre autogenerado o ingrese un nombre único que desee utilizar en las instrucciones SQL cuando consulte el origen de datos desde Athena. El nombre puede tener hasta 127 caracteres y debe ser único dentro de su cuenta. No se puede cambiar después crearlo. Los caracteres válidos son a-z, A-Z, 0-9, _ (guion bajo), @ (arroba) y - (guion). Los nombres awsdatacatalog, hive, jmx y system están reservados por Athena y no se pueden utilizar para nombres de orígenes de datos.

  8. Si el origen de datos elegido se integra con las conexiones AWS Glue.

    1. Para los detalles de conexión de AWS Glue, ingrese la información requerida. Una conexión contiene las propiedades que se necesitan para conectarse a un origen de datos concreto. Las propiedades necesarias varían en función del tipo de conexión. Para obtener más información sobre las propiedades relacionadas con el conector, consulte Conectores de orígenes de datos disponibles. Para obtener información sobre propiedades de conexión adicionales, consulte Propiedades de conexión de AWS Glue en la Guía del usuario de AWS Glue.

      nota
      • Al actualizar las propiedades de la conexión de Glue, es necesario reiniciar el conector de Lambda para obtener las propiedades actualizadas. Para ello, edite las propiedades del entorno y guárdelas sin cambiar nada.

      • Al actualizar una conexión de Glue, las siguientes propiedades no se actualizarán automáticamente en la función de Lambda correspondiente. Debe actualizar manualmente la función de Lambda para estas propiedades.

        • Configuración de la VPC de Lambda: security_group_ids, subnet_ids

        • Rol de ejecución de Lambda: spill_bucket, secret_name, spill_kms_key_id

    2. En el rol de IAM de ejecución de Lambda, elija uno de los siguientes:

      • Creación y uso de un nuevo rol de ejecución: (predeterminado) Athena crea un rol de ejecución que utilizará para acceder a los recursos en AWS Lambda en su nombre. Athena necesita este rol para crear el origen de datos federado.

      • Uso de un rol de ejecución existente: utilice esta opción para elegir un rol de ejecución existente. En esta opción, elija el rol de ejecución que desee utilizar en el menú desplegable Rol de ejecución.

  9. Si el origen de datos elegido no se integra con las conexiones AWS Glue.

    1. Para Función de Lambda, elija Crear una función de Lambda. La página de funciones del conector elegido se abre en la consola AWS Lambda. La página incluye información detallada sobre el conector.

    2. En Application settings (Configuración de aplicación), lea detenidamente la descripción de cada configuración de aplicación y, a continuación, ingrese los valores que correspondan a los requisitos.

      La configuración de aplicación que ve varía según el conector del origen de datos. La configuración mínima requerida incluye lo siguiente:

      • AthenaCatalogName: un nombre para la función de Lambda en minúsculas que indica el origen de datos de destino, como cloudwatchlogs.

      • SpillBucket: un bucket de Amazon S3 en la cuenta para almacenar datos que superen los límites de tamaño de respuesta de la función de Lambda.

        nota

        Los datos volcados no se volverán a utilizar en ejecuciones posteriores y se podrán eliminar de forma segura. Athena no elimina estos datos por usted. Para administrar estos objetos, considere agregar una política del ciclo de vida de los objetos que elimine los datos antiguos del bucket de vertido de Simple Storage Service (Amazon S3). Para obtener más información, consulte Administración del ciclo de vida del almacenamiento en la Guía del usuario de Amazon S3.

    3. Seleccione Confirmo que esta aplicación puede crear roles de IAM y políticas de recursos personalizados. Para obtener más información, elija el enlace Info.

    4. Elija Implementar. Una vez finalizada la implementación, aparece la función de Lambda en la sección Recursos en la consola de Lambda.

      Después de implementar el conector de origen de datos en su cuenta, puede conectar Athena a este.

    5. Vuelva a la página Enter data source details (Ingresar detalles de orígenes de datos) de la consola de Athena.

    6. En la sección Detalles de la conexión, elija el icono de actualización situado junto al cuadro de búsqueda Seleccione o introduzca una función de Lambda.

    7. Elija el nombre de la función que acaba de crear en la consola de Lambda. Se muestra el ARN de la función de Lambda.

  10. (Opcional) En Tags (Etiquetas), agregue pares clave-valor que asociar con este origen de datos. Para obtener más información acerca de las etiquetas, consulte Etiquetado de recursos de Athena.

  11. Elija Siguiente.

  12. En la página Revisar y crear, revise los detalles del origen de datos. Para realizar cambios, seleccione Editar.

  13. Lea la información que aparece en Athena creará recursos en la cuenta. Si está de acuerdo, seleccione Reconozco que Athena creará recursos en mi nombre.

  14. Elija Crear origen de datos. Athena creará los siguientes recursos en su nombre.

    • Rol de IAM de ejecución de Lambda

    • Conexión AWS Glue (solo si el origen de datos es compatible con las Conexiones de AWS Glue)

    • Función de Lambda

La sección Data source details (Detalles del origen de datos) de la página de la fuente de datos muestra información sobre el nuevo conector. Ahora puede usar el conector en sus consultas de Athena.

Para obtener información sobre cómo utilizar conectores de datos en las consultas, consulte Ejecución de consultas federadas.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.