使用 Amazon Neptune 批量加载程序收集数据 - Amazon Neptune

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon Neptune 批量加载程序收集数据

Amazon Neptune 提供将数据从外部文件直接加载到 Neptune 数据库集群中的 Loader 命令。可使用此命令代替执行大量 INSERT 语句、addVaddE 步骤或其它 API 调用。

Neptune 加载程序命令更快、开销更低,已针对大型数据集进行优化,并且支持 Gremlin 数据和 SPARQL 使用的 RDF(资源描述框架)数据。

以下关系图概述了加载过程:

显示将数据加载到 Neptune 中所涉及基本步骤的关系图。

下面是加载过程的步骤:

  1. 将数据文件复制到 Amazon Simple Storage Service (Amazon S3) 桶。

  2. 创建对此存储桶具有读取和列出访问权限的 IAM 角色。

  3. 创建 Amazon S3 VPC 端点。

  4. 通过经由 HTTP 将请求发送到 Neptune 数据库实例来启动 Neptune 加载程序。

  5. Neptune 数据库实例代入 IAM 角色以从桶加载数据。

注意

如果使用 Amazon S3 SSE-S3SSE-KMS 模式加密了数据,则可以从 Amazon S3 加载加密数据,前提是用于批量加载的角色可以访问 Amazon S3 对象,在 SSE-KMS 的情况下,也可以访问 kms:decrypt。然后,Neptune 可以模拟您的凭证并代表您发出 s3:getObject 调用。

但是,Neptune 当前不支持加载使用 SSE-C 模式加密的数据。

以下各节提供有关准备数据并将数据加载到 Neptune 中的说明。