本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 SQL 扩展浏览数据
要打开 SQL 扩展用户界面 (UI),请在 Studio 中 JupyterLab 应用程序的导航窗格中选择 SQL 扩展程序图标 (
)。左侧面板的数据发现视图会展开并显示与 Amazon Athena、Amazon Redshift 和 Snowflake 的所有预配置数据存储连接。
从这里,您可以:
-
展开特定连接,查看其数据库、模式、表或视图以及列。
-
使用 SQL 扩展用户界面中的搜索框搜索特定连接。搜索会返回与您输入的字符串部分匹配的任何数据库、模式、表或视图。
注意
如果 AWS 您的账户中已经设置了 Athena,则可以在应用程序中启用default-athena-connection
。 JupyterLab 这样就可以运行 Athena 查询,而无需手动创建连接。启用默认 Athena 连接:
-
请向管理员核实您的执行角色是否具有访问 Athena 和目录所需的权限。 AWS Glue 有关所需权限的详细信息,请参阅 为 Athena 配置 AWS Glue 连接
-
在 JupyterLab 应用程序中,导航到顶部导航栏的 “设置” 菜单,然后打开 “设置编辑器” 菜单。
-
选择数据发现。
-
选中启用默认 Athena 连接。
-
primary
WorkGroup 如果需要,您可以更新默认值。
要从 SQL 扩展窗格中的给定连接查询 JupyterLab 笔记本中的数据库、架构或表,请执行以下操作:
-
选择任何数据库、模式或表右侧的三点图标 (
)。
-
从菜单中选择在笔记本中查询。
这会自动在笔记本单元格中 JupyterLab 填充相关的
%%sm_sql
魔法命令以连接到数据源。它还添加了一个 SQL 语句示例,帮助您立即开始查询。您可以使用扩展的自动完成和高亮功能进一步完善 SQL 查询。有关使用 SQL 扩展 SQL 编辑器的更多信息,请参阅 SQL 扩展的 JupyterLab SQL 编辑器功能。
在表一级,三点图标提供了额外选项,可选择预览表的元数据。
下面的 JupyterLab 笔记本单元格内容显示了一个示例,说明在 SQL 扩展窗格中的redshift-connection
数据源上选择 “在笔记本中查询” 菜单时会自动生成的内容。
%%sm_sql --metastore-id redshift-connection --metastore-type GLUE_CONNECTION -- Query to list tables from schema 'dev.public' SHOW TABLES FROM SCHEMA "dev"."public"
使用 SQL 扩展窗格顶部的小于符号 (
) 清除搜索框或返回连接列表。
注意
该扩展可缓存搜索结果,以便快速访问。如果缓存结果已过期或列表中缺少某个连接,可以选择 SQL 扩展面板底部的刷新按钮手动刷新缓存。有关连接缓存的更多信息,请参阅 SQL 扩展连接缓存。