設定 Amazon 受管的 Grafana 工作區 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 Amazon 受管的 Grafana 工作區

使用適用於 Prometheus 的 Amazon 受管服務作為資料來源,建立新的 Amazon 受管 Grafana 工作區,或更新現有的 Amazon 受管 Grafana 工作區。

建立 Grafana 工作區,並將 Prometheus 的 Amazon 託管服務設定為資料來源

若要從適用於 Prometheus 的 Amazon 受管服務視覺化指標,請建立 Amazon 受管的 Grafana 工作區,並將其設定為使用適用於 Prometheus 的 Amazon 受管服務作為資料來源。

  1. 若要建立 Grafana 工作區,請依照 Amazon Prometheus 的受管服務使用者指南中的指示建立工作區中的指示進行。

    1. 在步驟 13 中,選取適用於 Prometheus 的 Amazon 受管服務作為資料來源。

    2. 在步驟 17 中,您可以在 IAM 身分中心新增管理員使用者和其他使用者。

如需詳細資訊,另請參閱下列資源。

開啟 Grafana 工作區並完成資料來源的設定

成功建立或更新 Amazon 受管的 Grafana 工作區後,請選取工作區 URL 以開啟工作區。這會提示您輸入已在 IAM 身分中心設定之使用者的使用者名稱和密碼。您應該使用 admin 使用者登入,以完成工作區的設定。

  1. 在工作區頁中,選擇「應用程式」、「AWS 資料來源」和「資料來源」。

  2. 在 [資料來源] 頁面中,然後選擇 [資料來源] 索引標籤。

  3. 對於服務,請選擇適用於 Prometheus 的 Amazon 託管服務。

  4. 在「瀏覽和佈建資料來源」 AWS 區段中,選擇您為 Prometheus 佈建 Amazon 受管服務工作區的區域。

  5. 從所選區域的資料來源清單中,選擇適用於 Prometheus 的 Amazon 受管服務。請務必檢查您已針對可觀察性堆疊設定的適用於 Prometheus 的 Amazon 受管服務工作區的資源 ID 和資源別名。 HyperPod

匯入開放原始碼 Grafana 儀表板

成功設定 Amazon 受管的 Grafana 工作區,並將 Prometheus 的 Amazon 受管服務作為資料來源後,您將開始向 Prometheus 收集指標,然後應該會開始看到顯示圖表、資訊等的各種儀表板。Grafana 開放原始碼軟體提供各種儀表板,您可以將它們匯入 Amazon 受管的 Grafana。

將開放原始碼 Grafana 儀表板匯入 Amazon 受管的 Grafana

  1. 在 Amazon 受管的 Grafana 工作區的頁中,選擇儀表板。

  2. 選擇具有 UI 文字 [新增] 的下拉式功能表按鈕,然後選取 [匯入]。

  3. 將 URL 粘貼到泥漿儀表板

    https://grafana.com/grafana/dashboards/4323-slurm-dashboard/
  4. 選取「載入」。

  5. 重複上述步驟以匯入下列面板。

    1. Node Exporter 完整儀表

      https://grafana.com/grafana/dashboards/1860-node-exporter-full/
    2. 匯出程式儀表板

      https://grafana.com/grafana/dashboards/12239-nvidia-dcgm-exporter-dashboard/
    3. EFA 指標儀表板

      https://grafana.com/grafana/dashboards/20579-efa-metrics-dev/
    4. FSx 的光澤度量儀表板

      https://grafana.com/grafana/dashboards/20906-fsx-lustre/