使用 SQL 扩展浏览数据 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 SQL 扩展浏览数据

要打开 SQL 扩展用户界面 (UI),请在 Studio 中 JupyterLab 应用程序的导航窗格中选择 SQL 扩展程序图标 ( Purple circular icon with a clock symbol representing time or scheduling. )。左侧面板的数据发现视图会展开并显示与 Amazon Athena、Amazon Redshift 和 Snowflake 的所有预配置数据存储连接。

从这里,您可以:

  • 展开特定连接,查看其数据库、模式、表或视图以及列。

  • 使用 SQL 扩展用户界面中的搜索框搜索特定连接。搜索会返回与您输入的字符串部分匹配的任何数据库、模式、表或视图。

注意

如果 AWS 您的账户中已经设置了 Athena,则可以在应用程序中启用default-athena-connection。 JupyterLab 这样就可以运行 Athena 查询,而无需手动创建连接。启用默认 Athena 连接:

  1. 请向管理员核实您的执行角色是否具有访问 Athena 和目录所需的权限。 AWS Glue 有关所需权限的详细信息,请参阅 为 Athena 配置 AWS Glue 连接

  2. 在 JupyterLab 应用程序中,导航到顶部导航栏的 “设置” 菜单,然后打开 “设置编辑器” 菜单。

  3. 选择数据发现

  4. 选中启用默认 Athena 连接

  5. primary WorkGroup 如果需要,您可以更新默认值。

要从 SQL 扩展窗格中的给定连接查询 JupyterLab 笔记本中的数据库、架构或表,请执行以下操作:

  • 选择任何数据库、模式或表右侧的三点图标 ( SQL extension three dots icon. )。

  • 从菜单中选择在笔记本中查询

    这会自动在笔记本单元格中 JupyterLab 填充相关的%%sm_sql魔法命令以连接到数据源。它还添加了一个 SQL 语句示例,帮助您立即开始查询。您可以使用扩展的自动完成和高亮功能进一步完善 SQL 查询。有关使用 SQL 扩展 SQL 编辑器的更多信息,请参阅 SQL 扩展的 JupyterLab SQL 编辑器功能

在表一级,三点图标提供了额外选项,可选择预览表的元数据。

下面的 JupyterLab 笔记本单元格内容显示了一个示例,说明在 SQL 扩展窗格中的redshift-connection数据源上选择 “在笔记本中查询” 菜单时会自动生成的内容。

%%sm_sql --metastore-id redshift-connection --metastore-type GLUE_CONNECTION -- Query to list tables from schema 'dev.public' SHOW TABLES FROM SCHEMA "dev"."public"

使用 SQL 扩展窗格顶部的小于符号 ( Icon to clear the SQL extension search box. ) 清除搜索框或返回连接列表。

注意

该扩展可缓存搜索结果,以便快速访问。如果缓存结果已过期或列表中缺少某个连接,可以选择 SQL 扩展面板底部的刷新按钮手动刷新缓存。有关连接缓存的更多信息,请参阅 SQL 扩展连接缓存