用 SQL Explorer 浏览数据 - Amazon EMR

用 SQL Explorer 浏览数据

本主题提供了一些可帮助您开始使用 Amazon EMR Studio 的 SQL Explorer 的信息。SQL Explorer 是 Workspace 中的一个单页工具,可帮助您了解 EMR 集群数据目录中的数据源。您可以使用 SQL Explorer 浏览数据、运行 SQL 查询以检索数据以及下载查询结果。

SQL Explorer 支持 Presto。要使用 SQL Explorer,您必须确保您的集群使用的是 Amazon EMR 版本 5.34.0 或更高版本或者版本 6.4.0 或更高版本,并且安装了 Presto。Amazon EMR Studio SQL Explorer 不支持配置了传输中加密的 Presto 集群。这是因为 Presto 在这些集群上将以 TLS 模式运行。

浏览集群的数据目录

SQL Explorer 提供了一个目录浏览器界面,您可以使用该界面来探索和了解数据的组织方式。例如,在编写 SQL 查询之前,您可以使用数据目录浏览器验证表和列名称。

浏览数据目录

  1. 在 Workspace 中打开 SQL Explorer。

  2. 确保您的 Workspace 已挂载到某个在 EC2 上运行、使用 Amazon EMR 6.4.0 或更高版本并且安装了 Presto 的 EMR 集群。您可以选择一个现有的集群或创建一个新的集群。有关更多信息,请参阅将集群附加到 Workspace

  3. 请从下拉列表中选择一个要浏览的 Database(数据库)。

  4. 展开数据库中的表以查看表的列名称。您还可在搜索栏中输入一个关键词以筛选表结果。

运行 SQL 查询以检索数据

使用 SQL 查询检索数据并下载结果

  1. 在 Workspace 中打开 SQL Explorer。

  2. 确保您的 Workspace 已挂载到某个在 EC2 上运行并且安装了 Presto 和 Spark 的 EMR 集群。您可以选择一个现有的集群或创建一个新的集群。有关更多信息,请参阅将集群附加到 Workspace

  3. 选择 Open editor(打开编辑器)以在您的 Workspace 中打开一个新的编辑器选项卡。

  4. 在编辑器选项卡中编写 SQL 查询。

  5. 选择 Run(运行)

  6. Result preview(结果预览)下查看查询结果。预设情况下,SQL Explorer 会显示前 100 个结果。您可以使用 Preview first 100 query results(预览前 100 个查询结果)下拉列表以选择要求显示的不同数量的结果(最高 1000)。

  7. 选择 Download results(下载结果)以 CSV 格式下载结果。您最多可以下载 1000 行结果。