外れ値と主要因を検出するための ML Insights の追加 - Amazon QuickSight

外れ値と主要因を検出するための ML Insights の追加

重要に見える外れ値の異常を検出する ML Insights を追加します。開始するには、インサイト用のウィジェット (自動説明文とも呼ばれます) を作成します。オプションを設定するときに、インサイトの限定されたスクリーンショットを画面右側の [Preview (プレビュー)] ペインに表示します。

インサイトウィジェットでは、計算フィールドではないディメンションフィールドを 5 つまで追加できます。フィールドウェルの [Categories (カテゴリ)] は、メトリクスを分割するために Amazon QuickSight で使用するディメンション値を示します。たとえば、すべての製品カテゴリと製品 SKU に対して収益を分析するとします。10個の商品カテゴリがあり、それぞれ10個の商品 SKU があります。Amazon QuickSight は、100 個の一意の組み合わせでメトリクスを分割し、分割の組み合わせごとに異常検出を実行します。

次の手順は、これを行う方法と、各異常の主要因を検出するための寄与度分析を追加する方法も示しています。寄与度分析は後で追加できます。詳細については 主要因に対する寄与度分析の使用 を参照してください。

主要因を含む外れ値分析を設定するには

  1. 分析を開き、トップメニューで [Add (追加)]、[Add insight (インサイトの追加)] の順に選択します。リストから [Anomaly detection (異常検出)]、[Select (選択)] の順に選択します。

  2. 新しいウィジェットの画面プロンプトに従って、インサイト用のフィールドを選択します。少なくとも 日付、メジャー、ディメンションを 1 つずつ追加する必要があります。

  3. ウィジェットで [Get started (今すぐ始める)] を選択します。設定画面が表示されます。

  4. [Compute options (コンピューティングオプション)] で、以下のオプションの値を選択します。

    1. [Combinations to be analysed (分析する組み合わせ)] で、以下のいずれかのオプションを選択します。

      1. 階層的

        フィールドを階層的に分析する場合は、このオプションを選択します。たとえば、日付 (T)、メジャー (N)、3 つのディメンションカテゴリ (C1、C2、C3) を選択した場合、次に示すように、QuickSight はフィールドを階層的に分析します。

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
      2. 完全一致

        リストされたとおりに、カテゴリフィールドウェル内のフィールドの正確な組み合わせのみを分析する場合は、このオプションを選択します。たとえば、日付 (T)、メジャー (N)、3 つのディメンションカテゴリ (C1、C2、C3) を選択した場合、次に示すように、QuickSight はカテゴリフィールドの正確な組み合わせのみをリストされている順序で分析します。

        T-C1-C2-C3-N
      3. [All] (すべて)

        カテゴリフィールドウェル内のすべてのフィールドの組み合わせを分析する場合は、このオプションを選択します。たとえば、日付 (T)、メジャー (N)、3 つのディメンションカテゴリ (C1、C2、C3) を選択した場合、次に示すように、QuickSight はフィールドのすべての組み合わせを分析します。

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N

      日付とメジャーのみを選択した場合、QuickSight は日付順、次にメジャー順にフィールドを分析します。

      [Fields to be analyzed (分析するフィールド)] セクションでは、参照のために、フィールドウェルのフィールドを一覧表示できます。

    2. [Name (名前)] に、スペースを含まない説明的な英数字の名前を入力するか、デフォルト値を選択します。これにより、コンピューティングの名前が入力されます。

      ウィジェットに自動的に表示される説明文を編集する場合は、この名前を使用してウィジェットの計算を識別できます。自動説明文を編集する場合や、分析内に類似する他の計算がある場合、名前をカスタマイズします。

  5. [Display options (表示オプション)] セクションで以下のオプションを選択し、インサイトウィジェットに表示される内容をカスタマイズします。表示内容にかかわらず、すべての結果を調べることができます。

    1. 表示する異常の最大数 — 説明文ウィジェットに表示する外れ値の数。

    2. 重要度 — インサイトウィジェットに表示する異常の最小重要度レベルです。

      重要度レベルは、範囲に含まれる実際の異常スコアが最も低いことによって特徴付けられる異常スコアの範囲です。より高いスコアを持つすべての異常が範囲に含まれます。重要度をに設定すると、インサイトには [低] と [非常に高い] の間にランク付けされるすべての異常が表示されます。重要度を非常に高いに設定すると、インサイトには異常スコアが最も高い異常値のみが表示されます。

      次のオプションを設定できます。

      • 非常に高い

      • 高以上

      • 中以上

      • 低以上

    3. 方向 — 異常であると識別する x 軸または y 軸の方向。以下から選択できます。

      • 予想より高いは、より高い値を異常として識別します。

      • 予想より低いは、より低い値を異常として識別します。

      • [ALL (すべて)] は、すべての異常値 (高および低) を識別します (デフォルト設定)。

    4. デルタ — 異常を識別するために使用するカスタム値を入力します。しきい値よりも高い値は異常としてカウントされます。ここで入力する値によって、分析におけるインサイトの動作が変わります。このセクションでは、次の項目を設定できます。

      • 絶対値 – 使用する実際値。たとえば、これが 48 であるとします。Amazon QuickSight は実際値と期待値との差が 48 より大きい値を異常値として特定します。

      • パーセンテージ – 使用するパーセンテージのしきい値。たとえば、これが 12.5% であるとします。Amazon QuickSight は実際値と期待値との差が 12.5% より大きい値を異常として識別します。

    5. 並べ替え — 結果のソート方法を選択します。一部の方法は、Amazon QuickSight が生成する異常スコアに基づきます。Amazon QuickSight は、異常と見られるデータポイントに対してより高いスコアを与えます。以下のいずれかのオプションを使用できます。

      • [Weighted anomaly score (加重異常スコア)] – 異常スコアに実際値と期待値の差の絶対値の対数を乗算した値。このスコアは常に正の数です。

      • [Anomaly score (異常スコア)] – このデータポイントに割り当てられた実際の異常スコア。

      • 期待値からの加重差 – 異常スコアに実際値と期待値の差を乗算した値(デフォルト)。

      • 期待値との差 – 実際値と期待値の実際の差 (実際 − 期待値)。

      • [Actual value (実際値)] – 式が適用されていない実際の値。

  6. [Schedule options (スケジュールオプション)] セクションで、インサイトの再計算を自動的に実行するスケジュールを設定できます。スケジュールは公開されたダッシュボードに対してのみ実行されます。分析では、必要に応じて手動でスケジュールを設定できます。スケジューリングには、以下の設定が含まれます。

    • 頻度 – 再計算を実行する頻度 (毎時、毎日、毎週、毎月)

    • スケジュールの開始日時 – このスケジュールの実行開始日時。

    • タイムゾーン – スケジュールを実行するタイムゾーン。リストを表示するには、現在のエントリを削除します。

  7. [Top contributors (トップ要因)] セクションで、外れ値 (異常) の検出時に主要因を分析するように Amazon QuickSight を設定します。

    例: Amazon QuickSight は米国で住宅の修繕製品の売上急増に寄与した上位の顧客を表示できます。データセットから最大 4 つのディメンションを追加できます。これには、このインサイトウィジェットのフィールドウェルに追加しなかったディメンションも含まれます。

    寄与分析に使用できるディメンションを一覧表示するには、[Select fields (フィールドの選択)] を選択します。

  8. [Save (保存)] を選択し、設定を保存します。保存せずに終了するには、[Cancel (キャンセル)] を選択します。

  9. インサイトウィジェットで、[Run now (今すぐ実行)] を選択し、異常検出を実行してインサイトを表示します。

異常検出完了までにかかる時間は、分析している一意のデータポイントの数によって異なります。このプロセスは、最少ポイント数で数分かかることもあれば、数時間かかることもあります。

バックグラウンドで実行されている間は、分析で他の作業を行うことができます。設定を変更したり、説明文を編集したり、このインサイトの [Explore anomalies (異常の探索)] ページを開いたりする場合は、完了するまで待つ必要があります。

インサイトウィジェットは、結果を表示する前に 1 回以上、実行する必要があります。ステータスが古いと思われる場合は、ページを更新できます。インサイトには、以下の状態があります。

ページの表示項目 ステータス
[Run now (今すぐ実行)] ボタン ジョブはまだ開始されていません。
異常の分析に関するメッセージ ジョブは現在実行中です。
検出された異常 (外れ値) に関する説明 ジョブは正常に実行されました。メッセージは、このウィジェットの計算を前回更新した日時を示します。
感嘆符 (!) 付きのアラートアイコン このアイコンは、前回の実行中にエラーが発生したことを示します。説明も表示された場合は、引き続き [Explore anomalies (異常の探索)] を使用して前回の正常な実行からのデータを利用できます。