在中为查询准备数据表 AWS Clean Rooms - AWS Clean Rooms

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中为查询准备数据表 AWS Clean Rooms

注意

准备数据表可以在您加入协作之前或之后进行。准备好表格后,只要您对该表格的隐私需求相同,您就可以在多个协作中重复使用该表格。

作为协作成员,您必须先准备好数据表,然后才能 AWS Clean Rooms 由可以查询的协作成员进行查询。

如果您的用例不需要您自带数据,则可以跳过此过程。

如果您的数据表已在中编目 AWS Glue,请跳至。在 AWS Clean Rooms中创建配置表

准备数据表涉及以下步骤:

有关可用于查询的数据格式的更多信息,请参阅的数据格式 AWS Clean Rooms

步骤 1:完成先决条件

要准备数据表以供使用 AWS Clean Rooms,必须满足以下先决条件:

  • 您的数据集必须另存为 AWS Clean Rooms支持的数据格式之一。

  • 您的数据表必须编入目录 AWS Glue 并使用支持的数据类型。 AWS Clean Rooms

  • 您的所有数据表都必须存储在亚马逊简单存储服务 (Amazon S3) 中, AWS 区域 与创建协作时相同。

  • AWS Glue Data Catalog 必须位于创建协作的同一区域。

  • AWS Glue Data Catalog 必须与成员资格 AWS 账户 相同。

  • 无法向注册 Amazon S3 存储桶 AWS Lake Formation。

  • 协作创建者已在 AWS Clean Rooms中建立了协作。有关更多信息,请参阅 在 AWS Clean Rooms 中创建协作

  • 协作创建者已将协作 ID 发送给作为协作参与者的您。

步骤 2:(可选)准备用于加密计算的数据

(可选)如果您使用的是加密计算,并且您的数据表包含要加密的敏感信息,则必须使用 C3R 加密客户端对数据表进行加密。

要为加密计算准备数据,请按照使用 Clean Rooms 加密计算准备加密的数据表中的步骤操作。

步骤 3:将数据表上传到 Amazon S3

注意

如果您打算在协作中使用加密的数据表,则必须先加密数据以进行加密计算,然后再将数据表上传到 Amazon S3。有关更多信息,请参阅 使用 Clean Rooms 加密计算准备加密的数据表

将数据表上传到 Amazon S3
  1. 登录 AWS Management Console 并打开 Amazon S3 控制台,网址为 https://console.aws.amazon.com/s3/

  2. 选择,然后选择您想要用于存储数据表的桶。

  3. 选择上传,然后按照提示进行操作。

  4. 选择对象选项卡,查看存储数据的前缀。记下文件夹的名称。

    您可以选择用于查看数据的文件夹。

步骤 4:创建 AWS Glue 表

如果您已经有 AWS Glue 数据表,则可以跳过此步骤。

在此步骤中,您将在中设置一个抓取器 AWS Glue ,用于抓取 S3 存储桶中的所有文件并创建 AWS Glue 表。有关更多信息,请参阅《AWS Glue 用户指南》 AWS Glue中的定义抓取工具

有关支持 AWS Glue Data Catalog 的数据类型的更多信息,请参阅支持的数据类型

注意

AWS Clean Rooms 目前不支持向注册的 S3 存储桶。 AWS Lake Formation

以下过程描述了如何创建 AWS Glue 表。如果要使用带有 AWS Key Management Service (AWS KMS) 密钥的加密 AWS Glue Data Catalog 对象,则需要配置 KMS 密钥权限策略以允许访问该加密表。有关更多信息,请参阅《AWS Glue 开发人员指南》中的在 AWS Glue 中设置加密

创建 AWS Glue 表
  1. 按照《AWS Glue 用户指南》中的 “在AWS Glue 控制台上使用抓取工具” 步骤进行操作。

  2. 记下 AWS Glue 数据库名称和 AWS Glue 表名。

后续步骤

现在,您已经准备好了数据表,您已准备好: