Uso del programa de carga masiva de Amazon Neptune para adquirir datos - Amazon Neptune

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso del programa de carga masiva de Amazon Neptune para adquirir datos

Amazon Neptune ofrece un comando Loader para cargar datos de archivos externos directamente en un clúster de base de datos de Neptune. Puede utilizar este comando en lugar de ejecutar un gran número de instrucciones INSERT, pasos addV y addE, u otras llamadas a la API.

El comando Loader de Neptune es más rápido, implica una menor sobrecarga, está optimizado para conjuntos de datos grandes y es compatible tanto con los datos de Gremlin como los datos RDF (marco de descripción de recursos) que utiliza SPARQL.

En el diagrama siguiente se muestra información general del proceso de carga:

Diagrama que muestra los pasos básicos para cargar datos en Neptune.

A continuación se muestran los pasos del proceso de carga:

  1. Copie los archivos de datos en un bucket de Amazon Simple Storage Service (Amazon S3).

  2. Crear una función de IAM con acceso de lectura y lista al bucket.

  3. Cree punto de conexión de VPC de Amazon S3

  4. Inicie el programa de carga de Neptune enviando una solicitud mediante HTTP a la instancia de base de datos de Neptune.

  5. La instancia de base de datos de Neptune asume el rol de IAM para cargar los datos del bucket.

nota

Puede cargar datos cifrados de Amazon S3 si se cifraron mediante SSE-S3 de Amazon S3 o el modo SSE-KMS, siempre que el rol que utilice para la carga masiva tenga acceso al objeto de Amazon S3 y, en el caso de SSE-KMS, a kms:decrypt. En ese caso, Neptune puede suplantar sus credenciales y emitir llamadas s3:getObject en su nombre.

Sin embargo, Neptune actualmente no admite la carga de datos cifrados con el modo SSE-C.

En las secciones siguientes, encontrará instrucciones para preparar y cargar datos en Neptune.