異常または外れ値検出の概念 - Amazon QuickSight

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

異常または外れ値検出の概念

Amazon QuickSight は、異常という単語を使用して、分布の全体的なパターンの範囲外にあるデータポイントを記述します。科学的な用語しての異常を表す単語としては、他にも外れ値、偏差、異質、例外、不規則性、特異性など、多数があります。使用する用語は、実行する分析のタイプ、使用するデータのタイプ、または単に所属グループの好みに基づいて選択される場合があります。これらの外部データポイントは、エンティティ (人、場所、物、時間) を表します。これは何らかの点で例外的です。

人間は、他とは異なるパターンを簡単に認識したり、他とは異なるものを簡単に見分けたりします。この情報は、感覚を通じてもたらされます。パターンが単純で、データがほんの少量である場合は、データ内の外れ値を示すグラフを簡単に作成できます。いくつかの簡単な例を以下に示します。

  • 青い風船グループの中の赤い風船

  • 他の競走馬から突出している競走馬

  • 授業中に集中していない子供

  • オンライン注文は増えているが、出荷が減っている日

  • ほかの誰もよくなっていない中で、よくなった人

重要なイベントを表すデータポイントと、ランダムな発生を表すデータポイントがあります。分析では、どのような推進要因 (主要因) がイベントに寄与したかに基づいて、調査する価値のあるデータを見極めます。データ分析には、問いが不可欠です。なぜ、それは起こったのか? 何が関係しているのか? 一度だけ発生したのか、何回も発生したのか? 追加の発生を奨励または阻止するために何ができるか?

バリエーションが生じた方法と理由、およびバリエーションにパターンがあるかどうかを理解するには、より多くの思考が必要になります。機械学習の支援がなければ、個人ごとに経験と情報は異なるため、個人ごとに異なる結論に達する可能性があります。その結果、個人ごとにビジネス上の意思決定はわずかに異なる場合があります。考慮すべきデータや変数が多い場合、膨大な量の分析が必要になることがあります。

ML を使用した異常検出では、原因と相関を明らかにして、データ主導の意思決定を下すことができます。ジョブによるデータの処理方法の定義は、引き続きユーザーが制御できます。独自のパラメータを指定したり、寄与分析の主要因を識別するなどの追加のオプションを選択したりできます。またはデフォルト設定を使用できます。次のセクションでは、設定プロセスを順を追って示し、使用可能なオプションについて説明します。