增加 ML 洞見來偵測極端值和主要驅動因素 - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

增加 ML 洞見來偵測極端值和主要驅動因素

您可以新增 ML 洞見來偵測異常 (看起來很重要的極端值)。首先,您需要為洞見建立一個小工具 (也稱為自動敘述)。設定選項時,您可以在螢幕右側的預覽窗格中,檢視洞見的有限螢幕擷取畫面。

在洞見小工具中,您最多可以新增五個非計算欄位的維度欄位。在欄位井中,「類別」的值代表 Amazon QuickSight 用來分割指標的維度值。例如,假設您正在分析跨所有產品類別和產品 SKU 的營收。有 10 個產品類別,每個類別有 10 個產品 SKU。Amazon 會依 100 種獨特組合 QuickSight 分割指標,並針對分割的每個組合執行異常偵測。

以下程序展示如何執行此操作,以及如何新增貢獻分析以偵測導致每個異常的主要驅動因素。您可以稍後新增貢獻分析,如 使用主要驅動因素的貢獻分析 中所述。

設定極端值分析 (包括驅動因素)
  1. 開啟分析,然後在工具列中選擇深入解析,然後選擇新增。從清單選擇 Anomaly detection (異常偵測)Select (選取)

  2. 遵循新的小工具上的螢幕提示,這會告訴您為洞見選擇欄位。至少新增一個日期、一個度量和一個維度。

  3. 在小工具上選擇 Get started (開始使用)。組態畫面隨即出現。

  4. 運算選項下,選擇下列選項的值。

    1. 針對要分析的組合,選擇以下選項之一:

      1. 階層

        若要按階層分析欄位,請選擇此選項。例如,如果您選擇日期 (T)、度量 (N) 和三個維度類別 (C1、C2 和 C3),則會以階層方式 QuickSight 分析欄位,如下所示。

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
      2. 精確

        若只要分析「類別」欄位集中列出的欄位的確切組合,請選擇此選項。例如,如果您選擇日期 (T)、度量 (N) 和三個維度類別 (C1、C2 和 C3),則只會按照類別欄位的列出順序 QuickSight 分析精確的組合,如下所示。

        T-C1-C2-C3-N
      3. 全部

        若要分析「類別」欄位集中的所有欄位組合,請選擇此選項。例如,如果您選擇日期 (T)、度量 (N) 和三個維度類別 (C1、C2 和 C3),則會 QuickSight 分析欄位的所有組合,如下所示。

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N

      如果您只選擇日期和度量,請先依日期 QuickSight 分析欄位,然後依度量分析欄位。

      要分析的欄位區段中,您可以看到欄位集的欄位清單 (供參考用)。

    2. 對於名稱,輸入不含空白的描述性字母數字名稱,或選擇預設值。如此便可為運算命名。

      如果您計劃編輯自動顯示在小工具上的敘述,您可以使用名稱來識別這個小工具的運算。但是,如果您規劃編輯自動敘述,並且在分析中有其他類似的運算,請自訂名稱。

  5. 顯示選項區段中,選擇以下選項來自訂洞見小工具中顯示的內容。無論顯示什麼,您仍然可以探索所有結果。

    1. 要顯示的異常狀況數量上限:要在敘述小工具中顯示的極端值數量。

    2. 嚴重性:要在洞見小工具中顯示的異常的最低嚴重程度。

      嚴重性等級 是一系列異常分數,其特徵為範圍中包含的最低實際異常分數。所有分數較高的異常都包含在此範圍內。如果您將嚴重性設定為,洞見會顯示等級在低和非常高之間的所有異常。如果您將嚴重性設定為 Very high (非常高),洞見只會顯示具有最高異常評分的異常。

      您可以使用下列選項 :

      • 非常高

      • 高度以上

      • 中等以上

      • 低度以上

    3. 方向:要識別為異常的 x 軸或 y 軸方向。您可以選擇下列項目:

      • 高於預期,將較高值識別為異常。

      • 低於預期,將較低值識別為異常。

      • [全部],將識別包含高值和低值在內的所有異常值 (預設設定)。

    4. 差異:輸入用於識別異常的自訂值。任何高於臨界值的數量都會視為異常。這個值會變更洞見在分析中的運作方式。在此章節中,您可以設定下列項目:

      • 絕對值:要使用的實際值。例如,如果將此設定為 48, QuickSight 然後,當一個值和預期值之間的差值大於 48 時,Amazon 將值識別為異常。

      • 百分比:要使用的百分比閾值。例如,如果您將此設定為 12.5%, QuickSight 然後,當值和預期值之間的差異大於 12.5% 時,Amazon 將值識別為異常。

    5. 排序依據:選擇結果的排序方法。某些方法基於 Amazon QuickSight 產生的異常分數。Amazon QuickSight 為看起來異常的數據點提供了更高的分數。您可以使用下列任一選項:

      • 加權的異常分數:乘以實際值和預期值差異絕對值對數的異常分數。此分數一律為正數。

      • 異常分數:指派給此資料點的實際異常分數。

      • 加權的預期值差異:乘以實際值和預期值差異的異常分數 (預設值)。

      • 與預期值的差異:實際值與預期值間的實際差異 (即實際預期)。

      • 實際值:未套用公式的實際值。

  6. 排程選項區段中,您可以設定排程,以自動執行洞見重新計算。僅發佈的儀表板才會執行排程。在分析中,您可以依需要手動執行。排程包括下列設定:

    • 出現次數:設定多久要重新計算一次 (每小時、每天、每週或每月)。

    • 排程開始日期:設定開始執行此排程的日期和時間。

    • 時區:設定排程執行的時區。若要檢視清單,請刪除目前項目。

  7. 在「熱門貢獻者」區段中, QuickSight 將 Amazon 設定為在偵測到異常值 (異常) 時分析關鍵驅動因素。

    例如,Amazon QuickSight 可以展示導致美國家居裝修產品銷售額激增的頂級客戶。您可以從資料集中新增最多四個維度。其中包括您未新增到此洞見小工具的欄位集的維度。

    如需可供貢獻分析的維度清單,請選擇選取欄位

  8. 選擇儲存以確認選擇。若要退出而不儲存,請選擇 Cancel (取消)

  9. 從洞見小工具選擇立即執行,以執行異常偵測並檢視洞見。

完成異常偵測所需的時間各有不同,取決於您正在分析的唯一資料點數量。最少的資料點只需要數分鐘就能完成此流程,但此流程也可能會執行數小時。

在背景中執行時,您可以在分析中進行其他工作。請等待它完成後,再變更組態、編輯內容或開啟探索異常頁面以取得此洞見。

洞見小工具需要至少執行一次才能顯示結果。如果您認為狀態可能已過期,可以重新整理頁面。洞見可以有以下狀態。

出現在頁面上 Status
Run now (立即執行) 按鈕 任務尚未開始。
關於 Analyzing for anomalies (分析異常) 的訊息 任務目前正在執行中。
有關偵測到的異常情況的敘述 (極端值) 任務已順利執行。訊息指出這個小工具的運算何時最後更新。
帶有驚嘆號的提醒圖示 (!) 此圖示表示上次執行期間發生錯誤。如果同時有顯示敘述,您仍然可以使用 Explore anomalies (探索異常) 來使用前一次成功執行的資料。