教程:订阅 AWS Data Exchange for Amazon S3(测试产品) - AWS Data Exchange 用户指南

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

教程:订阅 AWS Data Exchange for Amazon S3(测试产品)

AWS Data Exchange for Amazon S3(测试产品)是一款可帮助订阅者了解如何订阅 AWS Data Exchange 产品并与之互动的产品。在本教程中,该产品包含 Amazon Simple Storage Service (Amazon S3) 数据访问数据集。您可以将此产品用于测试目的,并了解如何直接通过数据提供商的 Amazon S3 存储桶查询和分析数据。

您可以运行查询来就地分析数据,而无需设置自己的 Amazon S3 存储桶、将数据文件复制到 Amazon S3 存储桶或支付相关的存储费用。

订阅 AWS Data Exchange for Amazon S3(测试产品)

以下步骤介绍了如何浏览 AWS Data Exchange 目录,以查找和订阅 AWS Data Exchange for Amazon S3(测试产品)。

要查找和订阅 AWS Data Exchange for Amazon S3(测试产品),请按以下步骤操作:
  1. 打开并登录 AWS Data Exchange 控制台

  2. 在左侧导航窗格的发现数据产品下,选择浏览目录

  3. 在搜索栏中输入 AWS Data Exchange for Amazon S3 (Test Product),然后选择 Enter

  4. 选择 AWS Data Exchange for Amazon S3(测试产品),查看其详细信息页面。

    1. (可选)要查看数据字典,请向下滚动到产品概述部分,在数据字典下查看该数据字典。

    2. (可选)要下载该数据字典,请选择数据字典和样本选项卡,选择数据字典旁边的选项按钮,然后选择下载

    3. (可选)要预览样本,请选择区块链交易(测试数据)样本名称旁边的选项按钮,然后选择预览样本(仅限 CSV)

    4. (可选)要下载样本,请选择区块链交易(测试数据)样本名称旁边的选项按钮,然后选择下载

      如果您正在预览样本,也可以在样本预览对话框中选择下载

  5. 在右上角,选择继续订阅

  6. 选择您的首选价格和持续时间组合。选择是否为该订阅启用自动续订,并查看优惠详细信息,包括数据订阅协议。

    注意

    AWS Data Exchange for Amazon S3(测试产品)不需要订阅验证,但有些产品需要进行订阅验证。有关更多信息,请参阅面向订阅者的订阅验证

  7. 查看定价信息,选择定价优惠,然后选择订阅

    注意

    AWS Data Exchange for Amazon S3(测试产品)是一款免费产品。如果您订阅的是付费产品,则系统会提示您确认订阅决策。

选择订阅后,您的订阅可能需要几分钟才能生效。

在订阅生效之前,离开此页面并不会阻止订阅的处理过程。

设置和查询 AWS Data Exchange for Amazon S3(测试产品)

以下步骤介绍了如何使用 AWS Command Line Interface (AWS CLI) 设置和查询 Amazon S3 数据访问数据集。在查询之前,您必须获得相应的 AWS Identity and Access Management (IAM) 权限才能将策略附加到您的用户。要通过 Amazon S3 交付方法直接访问提供商存储桶中的数据,请为用户或角色嵌入以下 JSON 策略。

要设置 AWS Data Exchange for Amazon S3(测试产品),请按以下步骤操作:
  1. 打开并登录 AWS Data Exchange 控制台

  2. 在左侧导航窗格中的我的订阅下,在托管该数据集的 AWS 区域中选择授权数据。就本教程而言,区域为 us-east-1

  3. 产品列表中选择 AWS Data Exchange for Amazon S3(测试产品),然后选择区块链交易(测试数据)数据集。

  4. 选择验证 IAM 权限

    注意

    如果您没有正确的权限,您将收到一条通知,其中会详细说明如何创建 IAM 策略并将其附加到您的用户或角色。在以下示例中,将每个用户输入占位符替换为您自己的信息。

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:us-east-1:111122223333:accesspoint/my-access-point", "arn:aws:s3:::aws-data-exchange-s3-data-access-btc-demo-us-east-1" ] }, { "Effect": "Allow", "Action": "s3:GetObject", "Resource": [ "arn:aws:s3:us-east-1:111122223333:accesspoint/my-access-point/object/*", "arn:aws:s3:::aws-data-exchange-s3-data-access-btc-demo-us-east-1/*" ] } ] }
要允许使用 AWS CLI 查询 AWS Data Exchange for Amazon S3(测试产品)数据访问数据集,请按以下步骤操作:
  1. us-east-1 中打开 AWS CloudShell

  2. 选择接入点别名旁边的复制按钮,复制并粘贴其中的代码。使用正确的接入点别名将命令添加到 AWS CloudShell 中后,您可以看到此产品中包含的 Amazon S3 对象列表。

    重要

    提供商启用申请方付款后,订阅者将为数据传输和请求付费。提供商支付数据存储费用。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的使用申请方付款存储桶进行存储传输和使用

  3. (可选)您也可以使用以下命令将对象复制到本地系统。

    aws s3api get-object --bucket <Access point alias> --key 'v1.0/btc/transactions/date=2022-11-27/part-00000-03a88dba-27dd-4f59-a890-70a3d2c7ad26-c000.snappy.parquet' aws_btc.snappy.parquet --request-payer requester