Conector para Neptune de Amazon Athena - Amazon Athena

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conector para Neptune de Amazon Athena

Amazon Neptune es un servicio de base de datos de gráficos rápido, fiable y completamente administrado que le permite crear y ejecutar fácilmente aplicaciones que funcionen con conjuntos de datos altamente conectados. El motor de base de datos de gráficos de alto rendimiento diseñado específicamente de Neptune almacena de manera óptima miles de millones de relaciones y consulta gráficos con una latencia de milisegundos. Para obtener más información, consulte la Guía del usuario de Neptune.

El conector Amazon Athena Neptune permite a Athena comunicarse con la instancia de base de datos de gráficos de Neptune, lo que hace que sus datos de gráficos de Neptune sean accesibles mediante consultas SQL.

Si tiene Lake Formation habilitado en su cuenta, la función de IAM para su conector Lambda federado de Athena que implementó es AWS Serverless Application Repository el acceso de lectura imprescindible en Lake Formation al. AWS Glue Data Catalog

Requisitos previos

El uso del conector de Neptune requiere los tres pasos siguientes.

Limitaciones

Actualmente, el conector para Neptune tiene las siguientes limitaciones.

  • Solo se admite el modelo de gráfico de propiedades.

  • No se admite la proyección de columnas, ni siquiera la clave principal (ID).

Configuración de un clúster de Neptune

Si no tiene un clúster existente de Amazon Neptune y un conjunto de datos de gráficos de propiedades que le gustaría usar, debe configurar uno.

Asegúrese de tener una puerta de enlace de Internet y una puerta de enlace NAT en la VPC que aloja el clúster de Neptune. Las subredes privadas que utiliza la función de Lambda del conector de Neptune deben tener una ruta a Internet a través de esta puerta de enlace NAT. La función Lambda del conector de Neptune utiliza la puerta de enlace NAT para comunicarse con. AWS Glue

Para obtener instrucciones sobre cómo configurar un nuevo cúmulo de Neptuno y cargarlo con un conjunto de datos de muestra, consulte Ejemplo de configuración del cúmulo de Neptuno en .com. GitHub

Configuración de una AWS Glue Data Catalog

A diferencia de los almacenes de datos relacionales tradicionales, los nodos y periferias de la base de datos de gráficos Neptune no utilizan ningún esquema establecido. Cada entrada puede tener diferentes campos y tipos de datos. Sin embargo, dado que el conector de Neptune recupera los metadatos del AWS Glue Data Catalog, debe crear una AWS Glue base de datos que contenga tablas con el esquema requerido. Después de crear la base de datos y tablas de AWS Glue , el conector puede rellenar la lista de tablas disponibles para consultarla desde Athena.

Habilitación de la coincidencia de columnas sin distinción entre mayúsculas y minúsculas

Para resolver los nombres de las columnas de la tabla de Neptuno con las mayúsculas y minúsculas correctas AWS Glue, puede configurar el conector Neptuno para que no distinga entre mayúsculas y minúsculas.

Para habilitar esta característica, establezca la variable de entorno enable_caseinsensitivematch como true en la función de Lambda del conector Neptune.

Especificar el parámetro de tabla AWS Glue glabel para los nombres de las tablas en mayúsculas

Como solo AWS Glue admite nombres de tablas en minúscula, es importante especificar el parámetro de tabla al crear una glabel AWS Glue tabla para Neptuno y el nombre de la AWS Glue tabla de Neptuno incluye mayúsculas y minúsculas.

En la definición de AWS Glue la tabla, incluya el glabel parámetro y establezca su valor en el nombre de la tabla con las mayúsculas originales. Esto garantiza que se conserve la carcasa correcta cuando AWS Glue interactúe con la mesa de Neptuno. En el siguiente ejemplo, se establece el valor de glabel como el nombre de la tabla Airport.

glabel = Airport

                    Establecer la propiedad de la glabel AWS Glue tabla para conservar las mayúsculas del nombre de la tabla en una tabla de Neptune

Para obtener más información sobre cómo configurar un AWS Glue Data Catalog para que funcione con Neptune, consulte Configurar el AWS Glue catálogo en GitHub .com.

Rendimiento

El conector Neptune de Athena inserta predicados para reducir los datos analizados en la consulta. Sin embargo, los predicados que usan la clave principal provocan un error en la consulta. Las cláusulas LIMIT reducen la cantidad de datos analizados; sin embargo, si no proporciona un predicado, es probable que las consultas SELECT con una cláusula LIMIT analicen al menos 16 MB de datos. El conector para Neptune resiste las limitaciones debidas a la simultaneidad.

Véase también

Para obtener información adicional sobre este conector, visite el sitio correspondiente en GitHub .com.