Usar o carregador em massa do Amazon Neptune para ingerir dados - Amazon Neptune

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usar o carregador em massa do Amazon Neptune para ingerir dados

O Amazon Neptune fornece um comando Loader para carregar dados de arquivos externos diretamente em um cluster de banco de dados do Neptune. É possível usar esse comando em vez de executar um grande número de declarações INSERT, etapas addV e addE ou outras chamadas de API.

O comando Loader do Neptune é mais rápido, tem menor sobrecarga, é otimizado para grandes conjuntos de dados e é compatível com dados do Gremlin e do RDF (Resource Description Framework) usados pelo SPARQL.

O diagrama a seguir mostra uma visão geral do processo de carga:

Diagrama que mostra as etapas básicas envolvidas no carregamento de dados no Neptune.

Veja as etapas do processo de carregamento:

  1. Copie os arquivos de dados em um bucket do Amazon Simple Storage Service (Amazon S3).

  2. Crie uma função do IAM com acesso de leitura e lista no bucket.

  3. Crie um endpoint da VPC do Amazon S3.

  4. Inicie o carregador do Neptune enviando uma solicitação à instância de banco de dados do Neptune por meio de HTTP.

  5. A instância de banco de dados do Neptune assume o perfil do IAM para carregar os dados do bucket.

nota

Será possível carregar dados criptografados do Amazon S3 se eles tiverem sido criptografados usando SSE-S3 do Amazon S3 ou o modo SSE-KMS, desde que o perfil utilizado para carregamento em massa tenha acesso ao objeto do Amazon S3 e, no caso da SSE-KMS, kms:decrypt. O Neptune pode personificar suas credenciais e emitir chamadas do s3:getObject em seu nome.

No entanto, o Neptune no momento não é compatível com o carregamento de dados criptografados usando o modo SSE-C.

As seções a seguir fornecem instruções para preparar e carregar dados no Neptune.