在 QuickSight 中使用 Databricks - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 QuickSight 中使用 Databricks

本章節介紹如何從 QuickSight 連線至 Databricks。

若要連線至 Databricks
  1. 首先建立新的資料集。從左側導覽窗格中選擇資料集,然後選擇新建資料集

  2. 選擇 Databricks 資料來源卡片。

  3. 對於資料來源名稱,為 Databricks 資料來源連線輸入一個描述性名稱,例如 Databricks CS。因為您可以透過與 Databricks 的連線建立許多資料集,因此最好保持名稱簡單。

    下列螢幕擷取畫面顯示 Databricks 的連線畫面。

    新 Databricks 資料來源的螢幕影像。它顯示本章節中描述的所有欄位。可以透過按 ENTER 啟用右下角用於建立資料來源的藍色按鈕。
  4. 對於連線類型,選取您正在使用的網路類型。

    • 公共網路 – 如果您的資料是公開共用的。

    • VPC – 如果您的資料位於 VPC 內。

    注意

    如果您正在使用 VPC,但沒有看到它列出,請洽詢管理員。

  5. 對於資料庫伺服器,輸入 Databricks 連線詳細資訊中指定的工作區主機名稱

  6. 對於 HTTP 路徑,輸入 Databricks 連線詳細資訊中指定的 spark 執行個體的部分 URL

  7. 連接埠中,輸入 Databricks 連線詳細資訊中指定的連接埠

  8. 使用者名稱密碼中,輸入您的連線憑證。

  9. 若要驗證連線是否正常運作,請按一下驗證連線

  10. 若要完成並建立資料來源,請按一下建立資料來源

為 Databricks 新增新的 QuickSight 資料集

當您有 Databricks 資料的現有資料來源連線之後,可以建立 Databricks 資料集以用於分析。

若要使用 Databricks 建立資料集
  1. 選擇左側的資料集,然後向下捲動以尋找適用於 Databricks 連線的資料來源卡片。如果您有許多資料來源,可以使用頁面頂端的搜尋列來尋找名稱部分相符的資料來源。

  2. 選擇 Databricks 資料來源卡片,然後選擇建立資料集。此時下列快顯視窗會顯示:

    名為選擇資料表的畫面之影像。它顯示本章節中描述的所有欄位。左下角有兩個按鈕:一個用於編輯和預覽資料,另一個用於使用自訂 SQL。按 ENTER 可啟用右下角用於選擇資料表的藍色按鈕。
  3. 若要指定要連線到的資料表,請先選取要使用的型錄和結構描述。接下來,在資料表中選取您要使用的資料表。如果您想使用自己的 SQL 陳述式,請選取使用自訂 SQL

  4. 選擇編輯/預覽

  5. (選用) 若要新增更多資料,請執行下列步驟:

    1. 選擇右上角的新增資料

    2. 若要連線到不同的資料,請選擇切換資料來源,然後選擇不同的資料集。

    3. 依照 UI 提示完成新增資料。

    4. 將新資料新增至相同的資料集後,選擇設定此聯結 (兩個紅點)。為每個額外的資料表設定一個聯結。

    5. 若要新增計算欄位,選擇新增計算欄位

    6. 若要從 SageMaker AI 新增模型,請選擇使用 SageMaker 增強。此選項只適用於 QuickSight 企業版。

    7. 清除要省略之任何欄位的核取方塊。

    8. 更新要變更的任何資料類型。

  6. 完成後,選擇儲存以儲存並關閉資料集。