Configuración de Athena para utilizar un conector de almacén de metadatos de Hive implementado - Amazon Athena

Configuración de Athena para utilizar un conector de almacén de metadatos de Hive implementado

Después de haber implementado un conector de origen de datos de Lambda como AthenaHiveMetastoreFunction en su cuenta, puede configurar Athena para utilizarlo. Para ello, cree un nombre de origen de datos que haga referencia al metaalmacén externo de Hive para utilizarlo en consultas de Athena.

Para conectar Athena al metaalmacén de Hive mediante una función de Lambda existente
  1. Abra la consola de Athena en https://console.aws.amazon.com/athena/.

  2. Si el panel de navegación de la consola no está visible, elija el menú de expansión de la izquierda.

    Elija el menú de expansión.
  3. Elija Edit Data Source (Editar origen de datos).

  4. En la página Data sources (Orígenes de datos), elija Create data source (Crearo origen de datos).

  5. En la página Choose data sources (Elegir orígenes de datos), en Data sources (Orígenes de datos), elija S3 - Apache Hive metastore (S3: metastore de Apache Hive).

  6. Elija Siguiente.

  7. En la sección Data source details (Detalles del origen de datos), en Data source name (Nombre del origen de datos), ingrese el nombre que quiera utilizar en las instrucciones SQL cuando consulte el origen de datos desde Athena (por ejemplo, MyHiveMetastore). El nombre puede tener hasta 127 caracteres y debe ser único dentro de su cuenta. No se puede cambiar después crearlo. Los caracteres válidos son a-z, A-Z, 0-9, _ (guion bajo), @ (arroba) y - (guion). Los nombres awsdatacatalog, hive, jmx y system están reservados por Athena y no se pueden utilizar para nombres de orígenes de datos.

  8. En la sección Connection details (Detalles de la conexión), utilice el cuadro Select or enter a Lambda function (Seleccione o introduzca una función de Lambda) para elegir el nombre de la función que acaba de crear. Se muestra el ARN de la función Lambda.

  9. (Opcional) En Tags (Etiquetas), agregue pares clave-valor que asociar con este origen de datos. Para obtener más información acerca de las etiquetas, consulte Etiquetado de recursos de Athena.

  10. Elija Siguiente.

  11. En la página Review and create (Revisar y crear), revise los detalles del origen de datos y, a continuación, elija Create data source (Crear origen de datos).

  12. La sección Data source details (Detalles del origen de datos) de la página de la fuente de datos muestra información sobre el nuevo conector.

    Ahora puede usar el Data source name (Nombre de origen de datos) que especificó para referenciar el metastore de Hive en las consultas SQL en Athena.

    En las consultas SQL, utilice la sintaxis de ejemplo siguiente, reemplazando ehms-catalog por el origen de datos especificado anteriormente.

    SELECT * FROM ehms-catalog.CustomerData.customers
  13. Para ver, editar o eliminar los orígenes de datos creados, consulte Administración de orígenes de datos.