異常或極端值偵測的概念 - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

異常或極端值偵測的概念

Amazon QuickSight 使用「異常」一詞來描述超出整體分佈模式的資料點。還有許多其他形容異常的用詞,這是科學術語,包括極端值、偏差、奇異、例外、不規則、突變等等。您使用的術語可能取決於您執行的分析類型,或是您使用的資料類型,甚或是群組的偏好設定。這些外圍資料點代表一個實體 (人、地點、事物或時間) 在某種程度上是特殊的。

人類的過人之處在於很容易就可以辨識出模式並發現事物。我們的感官為我們提供這些資訊。如果模式很簡單,並且只有少量資料,很輕鬆就可以製作圖表來突顯資料中的極端值。一些簡單的範例包括如下:

  • 一組藍色氣球中的一顆紅色氣球

  • 遠遠領先於其他賽馬的一匹賽馬

  • 一個在課堂上沒有認真上課的孩童

  • 當線上訂單增加,但出貨減少的一天

  • 一個恢復健康但其他人沒有的人

一些資料點代表一個重要事件,而其他資料點則代表隨機發生的事件。視何種驅動因素 (主要驅動因素) 促成事件而定,分析可揭露哪些資料值得調查。問題對於資料分析至關重要。發生的原因? 與何有關? 只發生一次或多次? 您可以採取什麼動作來鼓勵或阻止更多類似的情況?

了解變化的存在方式和原因,以及變化中是否存在模式,都需要進一步思考。在不借助機器學習下,每個人可能會得到不同的結論,因為他們有不同的經驗和資訊。因此,每個人可能做出稍微不同的業務決策。如果有大量的資料或變數需要考慮,可能需要大量分析。

採用 ML 技術的異常偵測可識別因果關係和相關性,讓您能夠做出資料驅動的決策。您仍然可以控制如何定義您希望任務處理資料的方式。您可以指定自己的參數,並選擇其他選項,例如識別貢獻分析中的主要驅動因素。您也可以使用預設設定。下一節將引導您完成設定程序,並提供可用選項的說明。