Uso de AWS Serverless Application Repository para implementar un conector de origen de datos - Amazon Athena

Uso de AWS Serverless Application Repository para implementar un conector de origen de datos

Para implementar un conector de origen de datos, puede utilizar AWS Serverless Application Repository en lugar de empezar con la consola de Athena. Utilice AWS Serverless Application Repository para encontrar el conector que quiere utilizar, proporcione los parámetros que requiere el conector y, a continuación, implemente el conector en su cuenta. Luego, después de implementar el conector, utilice la consola de Athena para poner el origen de datos a disposición de Athena.

Implementación del conector en su cuenta

Para usar AWS Serverless Application Repository para implementar un conector de origen de datos en su cuenta, realice el siguiente procedimiento:
  1. Inicie sesión en la AWS Management Console y abra el repositorio de aplicaciones sin servidor.

  2. En el panel de navegación, elija Aplicaciones disponibles.

  3. Seleccione la opción Show apps that create custom IAM roles or resource policies (Mostrar aplicaciones que crean roles de IAM personalizados o políticas de recursos).

  4. En el cuadro de búsqueda, escriba el nombre del conector. Para obtener una lista de conectores de datos de Athena preconstruidos, consulte Conectores de orígenes de datos disponibles.

  5. Elija el nombre del conector. Al elegir un conector, se abre la página Application details (Detalles de la aplicación) de la función Lambda en la consola de AWS Lambda.

  6. A la derecha de la página de detalles, en Application settings (Configuración de aplicación), complete la información requerida. La configuración mínima requerida incluye lo siguiente. Para obtener información sobre las opciones configurables restantes de los conectores de datos creados por Athena, consulte el tema Available connectors (Conectores disponibles) correspondiente en GitHub.

    • AthenaCatalogName: un nombre para la función Lambda en minúsculas que indica el origen de datos de destino, como cloudwatchlogs.

    • SpillBucket: especifique un bucket de Amazon S3 en la cuenta para recibir datos de cualquier carga de respuesta grande que supere los límites de tamaño de respuesta de la función Lambda.

  7. Seleccione I acknowledge that this app creates custom IAM roles and resource policies (Confirmo que esta aplicación puede crear roles de IAM y políticas de recursos personalizados). Para obtener más información, elija el enlace Info.

  8. En la parte inferior derecha de la sección Configuración de aplicación, elija Implementar. Una vez finalizada la implementación, aparece la función Lambda en la sección Resources (Recursos) en la consola de Lambda.

Hacer que el conector esté disponible en Athena

Ahora está listo para usar la consola de Athena para poner el conector de origen de datos a disposición de Athena.

Para poner el origen de datos a disposición de Athena.
  1. Abra la consola de Athena en https://console.aws.amazon.com/athena/.

  2. Si el panel de navegación de la consola no está visible, elija el menú de expansión de la izquierda.

    Elija el menú de expansión.
  3. En el panel de navegación, elija Data source (Orígenes de datos).

  4. En la página Data sources (Orígenes de datos), elija Create data source (Crearo origen de datos).

  5. Para Choose a data source (Elegir un origen de datos), elija el origen de datos para el que ha creado un conector en el AWS Serverless Application Repository. Este tutorial usa Amazon CloudWatch Logs como origen de datos federado.

  6. Elija Siguiente.

  7. En la página Enter data source details (Ingresar detalles del origen de datos), en Data source name (Nombre del origen de datos), ingrese el nombre que quiera utilizar en las instrucciones SQL cuando consulte el origen de datos desde Athena (por ejemplo, CloudWatchLogs). El nombre puede tener hasta 127 caracteres y debe ser único dentro de su cuenta. No se puede cambiar después crearlo. Los caracteres válidos son a-z, A-Z, 0-9, _ (guion bajo), @ (arroba) y - (guion). Los nombres awsdatacatalog, hive, jmx y system están reservados por Athena y no se pueden utilizar para nombres de orígenes de datos.

  8. En la sección Connection details (Detalles de la conexión), utilice el cuadro Select or enter a Lambda function (Seleccione o introduzca una función de Lambda) para elegir el nombre de la función que acaba de crear. Se muestra el ARN de la función Lambda.

  9. (Opcional) En Tags (Etiquetas), agregue pares clave-valor que asociar con este origen de datos. Para obtener más información acerca de las etiquetas, consulte Etiquetado de recursos de Athena.

  10. Elija Siguiente.

  11. En la página Review and create (Revisar y crear), revise los detalles del origen de datos y, a continuación, elija Create data source (Crear origen de datos).

  12. La sección Data source details (Detalles del origen de datos) de la página de la fuente de datos muestra información sobre el nuevo conector. Ahora puede usar el conector en sus consultas de Athena.

    Para obtener información sobre cómo utilizar conectores de datos en las consultas, consulte Ejecución de consultas federadas.