使用SQL總管瀏覽資料 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用SQL總管瀏覽資料

注意

SQLAmazon EMR 無伺服器互動式應用程式或啟用IAM身分識別中心受信任身分傳播的工作室不支援 Explorer for Studio。EMR

本主題提供的資訊可協助您在 Amazon EMR Studio 中開始使用SQL檔案總管。SQLExplorer 是工作區中的單一頁面工具,可協助您瞭解EMR叢集資料目錄中的資料來源。您可以使用 SQL Explorer 瀏覽資料、執行查SQL詢以擷取資料,以及下載查詢結果。

SQL瀏覽器支持普雷斯托。在使用SQL資源管理器之前,請確保您擁有一個使用 Amazon 5.34.0 或更新EMR版本的叢集,或是 6.4.0 版或更新版本且安裝了普雷斯托。Amazon 工EMR作室SQL資源管理器不支援您使用傳輸中加密設定的普雷斯托叢集。這是因為 Presto 在這些叢集上以TLS模式執行。

瀏覽叢集的資料型錄

SQLExplorer 提供了一個目錄瀏覽器介面,您可以使用它來探索和瞭解資料的組織方式。例如,您可以在撰寫SQL查詢之前,使用資料目錄瀏覽器來驗證資料表和欄名稱。

瀏覽資料型錄
  1. 在工作區中開啟SQL檔案總管。

  2. 確保您的工作區已連接到使用 Amazon 6.4.0 或更新EMR版本且EC2已安裝普雷斯托的EMR叢集上執行。您可選擇現有叢集,或建立新叢集。如需詳細資訊,請參閱將運算連接到工作EMR室工作區

  3. 從下拉式清單中選取要瀏覽的資料庫

  4. 展開資料庫中的資料表,以查看資料表的資料欄名稱。也可以在搜尋列中輸入關鍵字,篩選資料表結果。

執行SQL查詢以擷取資料

若要使用SQL查詢擷取資料並下載結果
  1. 在工作區中開啟SQL檔案總管。

  2. 確保您的工作區已連接到安裝了普雷斯托和 Spark 的EMR集群上EC2運行。您可選擇現有叢集,或建立新叢集。如需詳細資訊,請參閱將運算連接到工作EMR室工作區

  3. 選取開啟編輯器,在工作區中開啟新的編輯器索引標籤。

  4. 在編輯器索引標籤中撰寫SQL查詢。

  5. 選擇執行

  6. 結果預覽下檢視查詢結果。SQL預設情況下,檔案總管會顯示前 100 個結果。可以使用預覽前 100 個查詢結果下拉式清單選擇不同數目的顯示結果 (最多 1000 個)。

  7. 選擇 [下載結果],以CSV格式下載結果。最多可以下載 1000 行結果。