Uso del cargador masivo Amazon Neptune para ingerir datos

Amazon Neptune ofrece un comando Loader para cargar datos de archivos externos directamente en un clúster de base de datos de Neptune. Puede utilizar este comando en lugar de ejecutar un gran número de instrucciones INSERT, pasos addV y addE, u otras llamadas a la API.

El comando Loader de Neptune es más rápido, implica una menor sobrecarga, está optimizado para conjuntos de datos grandes y es compatible tanto con los datos de Gremlin como los datos RDF (marco de descripción de recursos) que utiliza SPARQL.

En el diagrama siguiente se muestra información general del proceso de carga:

Diagrama que muestra los pasos básicos para cargar datos en Neptune.

A continuación se muestran los pasos del proceso de carga:

Copie los archivos de datos en un bucket de Amazon Simple Storage Service (Amazon S3).
Crear una función de IAM con acceso de lectura y lista al bucket.
Cree punto de conexión de VPC de Amazon S3
Inicie el programa de carga de Neptune enviando una solicitud mediante HTTP a la instancia de base de datos de Neptune.
La instancia de base de datos de Neptune asume el rol de IAM para cargar los datos del bucket.

nota

Puede cargar datos cifrados de Amazon S3 si se cifraron mediante SSE-S3 de Amazon S3 o el modo SSE-KMS, siempre que el rol que utilice para la carga masiva tenga acceso al objeto de Amazon S3 y, en el caso de SSE-KMS, a kms:decrypt. En ese caso, Neptune puede suplantar sus credenciales y emitir llamadas s3:getObject en su nombre.

Sin embargo, Neptune actualmente no admite la carga de datos cifrados con el modo SSE-C.

En las secciones siguientes, encontrará instrucciones para preparar y cargar datos en Neptune.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Carga de datos

Rol de IAM y acceso a Amazon S3