使用 Amazon Neptune 批量加载器摄取数据

Amazon Neptune 提供将数据从外部文件直接加载到 Neptune 数据库集群中的 Loader 命令。可使用此命令代替执行大量 INSERT 语句、addV 和 addE 步骤或其它 API 调用。

Neptune 加载程序命令更快、开销更低，已针对大型数据集进行优化，并且支持 Gremlin 数据和 SPARQL 使用的 RDF（资源描述框架）数据。

以下关系图概述了加载过程：

下面是加载过程的步骤：

将数据文件复制到 Amazon Simple Storage Service (Amazon S3) 桶。
创建对此存储桶具有读取和列出访问权限的 IAM 角色。
创建 Amazon S3 VPC 端点。
通过经由 HTTP 将请求发送到 Neptune 数据库实例来启动 Neptune 加载程序。
Neptune 数据库实例代入 IAM 角色以从桶加载数据。

注意

如果使用 Amazon S3 SSE-S3 或 SSE-KMS 模式加密了数据，则可以从 Amazon S3 加载加密数据，前提是用于批量加载的角色可以访问 Amazon S3 对象，在 SSE-KMS 的情况下，也可以访问 kms:decrypt。然后，Neptune 可以模拟您的凭证并代表您发出 s3:getObject 调用。

但是，Neptune 当前不支持加载使用 SSE-C 模式加密的数据。

以下各节提供有关准备数据并将数据加载到 Neptune 中的说明。

主题

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

加载数据

IAM 角色和 Amazon S3 访问权限