透過採用 ML 的異常偵測和貢獻分析來探索極端值和主要驅動因素 - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

透過採用 ML 的異常偵測和貢獻分析來探索極端值和主要驅動因素

您可以互動方式探索分析中的異常 (也稱為極端值),以及貢獻因子 (主要驅動因素)。在採用 ML 技術的異常偵測執行之後,即可開始探索分析。您在此畫面中所做的變更不會在您返回分析時儲存。

首先,在洞見中選擇探索異常狀況。以下螢幕擷取畫面顯示了首次開啟時出現的「異常」畫面。此範例設定了貢獻因子分析並顯示了兩個主要驅動因素。

顯示貢獻因子的異常分析。

畫面的各個區段包括 (從左上到右下):

  • 貢獻因子顯示主要驅動因素。若要查看此區段,您需要在異常組態中設定貢獻因子。

  • 控制項包含異常探索的設定。

  • 異常數量顯示一段時間內偵測到的極端值。您可以隱藏或顯示此圖表區段。

  • 類別或維度欄位的欄位名稱充當顯示每個類別或維度異常的圖表標題。

以下區段提供了探索異常各個方面的詳細資訊。

探討貢獻因子 (主要驅動因素)

如果您的異常洞察力設定為偵測關鍵驅動因素,請 QuickSight 執行貢獻分析以判斷哪些類別 (維度) 會影響離群值。貢獻因子區段顯示在左側。

貢獻因子面板。

貢獻因子包含以下區段:

  • 敘述:摘要 (左上角) 描述指標中的變更。

  • 主要貢獻因子組態:選擇設定變更貢獻因子和日期範圍,以在此區段中使用。

  • 排序依據:設定套用至在下方顯示之結果的排序。您可以選擇下列項目:

    • 絕對差異

    • 貢獻百分比 (預設)

    • 預期偏差

    • 百分比差異

  • 主要貢獻因子結果:在進行主要貢獻因子分析時,顯示在右側時間線上所選取之時間點的分析結果。

    貢獻分析最多可識別異常的四個最主要的貢獻因素或主要驅動因素。例如,Amazon QuickSight 可以向您展示導致美國健康產品銷售額激增的頂級客戶。只有當您在設定異常時選擇將欄位包含在貢獻分析中,才會顯示此面板。

    如果您沒有看到這個面板,並且想要顯示它,您可以開啟它。若要執行此動作,請前往分析,從洞見的選單中選擇異常組態,然後最多選擇四個欄位來分析貢獻。如果您在排除貢獻驅動因素的工作表控制項中進行變更,貢獻面板會關閉。

設定異常偵測控制項

您可以在畫面的控制項區段找到異常偵測的設定。您可以透過按一下控制項來開啟和關閉此區段。

選擇控制項以開啟「控制項」區段。

設定包括:

  • 控制項:目前設定會在工作空間頂端顯示。您可以選擇右邊的雙箭頭圖示展開此區段。下列設定可用於探索採用 ML 技術的異常偵測產生的極端值:

    • 嚴重性:設定您的偵測器對於已偵測異常 (極端值) 的靈敏度。閾值設為低度以上時,應可看見更多異常,而閾值設為高度以上時,應可看見較少異常。根據 RCF 演算法產生之異常分數標準差,判定靈敏度。預設為中等以上

    • 方向:要識別為異常的 x 軸或 y 軸方向。預設值為 [全部]。您可以選擇下列選項:

      • 設定為高於預期,以將較高的值識別為異常。

      • 設定為低於預期,以將較低的值識別為異常。

      • 設定為 [ALL],以識別包含高值和低值在內的所有異常值。

    • 最小差異 - 絕對值:輸入自訂值,用作識別異常的絕對閾值。任何高於這個值的數量都會視為異常。

    • 最小差異 - 百分比:輸入自訂值,用作識別異常的百分比閾值。任何高於這個值的數量都會視為異常。

    • 排序依據:選擇要套用以排序異常的方法。它們會依偏好的順序列在畫面中。檢視以下每種方法的描述清單。

      • 加權的異常分數:乘以實際值和預期值差異絕對值對數的異常分數。此分數一律為正數。

      • 異常分數:指派給此資料點的實際異常分數。

      • 加權的預期值差異:(預設值) 乘以實際值和預期值差異的異常分數。

      • 與預期值的差異:實際值與預期值間的實際差異 (實際預期)。

      • 實際值:未套用公式的實際值。

    • 類別:一個或多個設定可以出現在其他設定的末端。您新增至類別欄位集的每個類別欄位都有一個。您可使用類別設定限制在畫面中顯示的資料。

按日期顯示和隱藏異常

異常數量圖表顯示一段時間內偵測到的極端值。如果您沒有看到此圖表,可以透過選擇依日期顯示異常狀況來顯示它。

異常數量圖表

此圖表顯示時間序列中最新資料點的異常 (極端值)。展開後,它顯示以下元件:

  • 異常:畫面中心顯示時間序列中最近資料點的異常。一張或多張圖搭配圖表顯示,指出隨著時間產生的指標變化。若要使用此圖,請選擇沿著時間線的一點。目前選擇的時間點會在圖中反白顯示,並具有選單,提供您分析目前指標貢獻的選項。您也可以在時間線上拖曳游標,而不選擇特定一點,即可顯示該時間點的指標值。

  • 依日期顯示異常狀況:如果您選擇依日期顯示異常狀況,另一張圖表則會顯示每個時間點有多少個重大異常。您可以在每一列的內容選單上,查看此圖表中的詳細資訊。

  • 時間線調整:每張圖表在日期下方都有時間線調整工具,您可以用來壓縮、展開或選擇一段時間期間來檢視。

探索每個類別或維度的異常

探索異常畫面的主要區段被鎖定在螢幕的右下角。無論螢幕的其他區段開啟多少,它都會保留在那裡。如果存在多個異常,您可以捲動以將它們反白顯示。此圖表以不同的顏色顯示異常,並顯示它們在一段時間內發生的時間點。

探索異常畫面。

每個類別或維度都有一個單獨的圖表,圖表使用欄位名稱作為圖表標題。每個圖表都包含下列元件。

  • 設定提醒:如果從儀表板探索異常,您可以選擇此按鈕訂閱提醒和貢獻分析 (若已設定)。您可以設定提醒的嚴重性層級 (中、高等等)。您可以取得 Higher than expected (高於預期)Lower than expected (低於預期) 或 ALL (全部) 的前 5 個提醒。儀表板讀者可以自行設定提醒。如果您從分析開啟頁面,開啟探索異常頁面不會顯示此按鈕。

    注意

    只能在已發佈的儀表板中使用設定提醒的功能。

  • 狀態:在異常標頭下方,狀態標籤會顯示上一次執行的資訊。例如,您可能會看到 "Anomalies for Revenue on November 17, 2018"。此標籤會告訴您處理多少過指標,且在多久之前處理。您可以選擇連結,以進一步了解詳細資訊,例如略過多少指標。