Ajout d'une analyse ML pour détecter les valeurs aberrantes et les éléments clés - Amazon QuickSight

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ajout d'une analyse ML pour détecter les valeurs aberrantes et les éléments clés

Vous pouvez ajouter une analyse ML qui détecte les anomalies, c'est-à-dire les valeurs aberrantes qui semblent significatives. Pour commencer, vous créez pour votre analyse un widget, également connu sous le nom d'autonarration. Pendant que vous configurez vos options, vous pouvez voir une capture d'écran limitée de votre analyse dans le volet Aperçu à droite de l'écran.

Dans votre widget d'analyse, vous pouvez ajouter jusqu'à cinq champs de dimension qui ne sont pas des champs calculés. Dans les puits de champ, les valeurs des catégories représentent les valeurs dimensionnelles QuickSight utilisées par Amazon pour diviser la métrique. Supposons, par exemple, que vous analysez le revenu de toutes les catégories de produits et toutes les références de produits. Il y a 10 catégories de produits, chacune avec 10 UGS de produits. Amazon QuickSight divise la métrique par 100 combinaisons uniques et exécute une détection des anomalies sur chaque combinaison pour la division.

La procédure suivante montre comment procéder et comment ajouter une analyse de contribution pour détecter les facteurs clés à l'origine de chaque anomalie. Vous pouvez ajouter l'analyse de contribution ultérieurement, comme décrit dans Utilisation de l'analyse de contribution pour les facteurs clés.

Pour configurer l'analyse des valeurs aberrantes, y compris les facteurs clés
  1. Ouvrez votre analyse et dans la barre d'outils, choisissez Insights, puis Ajouter. Dans la liste, choisissez Anomaly detection (Détection des anomalies) et Select (Sélectionner).

  2. Suivez l'invite à l'écran concernant le nouveau widget, qui vous indique de choisir des champs pour l'information. Vous devez ajouter au moins une date, une métrique et une dimension.

  3. Choisissez Get started (Démarrer) sur le widget. L'écran de configuration s'affiche.

  4. Sous Options de calcul, choisissez des valeurs pour les options suivantes.

    1. Pour Combinaisons à analyser, choisissez l'une des options suivantes :

      1. Hiérarchique

        Choisissez cette option si vous voulez analyser les champs de manière hiérarchique. Par exemple, si vous avez choisi une date (T), une mesure (N) et trois catégories de dimensions (C1, C2 et C3), QuickSight analyse les champs de manière hiérarchique, comme indiqué ci-dessous.

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
      2. Exact

        Choisissez cette option si vous voulez analyser uniquement la combinaison exacte des champs dans le sélecteur de champs Catégorie, tels qu'ils sont répertoriés. Par exemple, si vous avez choisi une date (T), une mesure (N) et trois catégories de dimensions (C1, C2 et C3), QuickSight analyse uniquement la combinaison exacte des champs de catégorie dans l'ordre dans lequel ils sont répertoriés, comme indiqué ci-dessous.

        T-C1-C2-C3-N
      3. Tous

        Choisissez cette option si vous voulez analyser toutes les combinaisons de champs dans le puits de champs Catégorie. Par exemple, si vous avez choisi une date (T), une mesure (N) et trois catégories de dimensions (C1, C2 et C3), QuickSight analyse toutes les combinaisons de champs, comme indiqué ci-dessous.

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N

      Si vous avez choisi une date et une mesure uniquement, QuickSight analyse les champs par date, puis par mesure.

      Dans la section Champs à analyser, vous pouvez voir une liste de champs provenant des puits de champs à titre de référence.

    2. Pour Nom, saisissez un nom alphanumérique descriptif sans espace ou choisissez la valeur par défaut. Cela permet de donner un nom au calcul.

      Si vous envisagez de modifier la narration qui s'affiche automatiquement sur le widget, vous pouvez utiliser le nom pour identifier le calcul de ce widget. Personnalisez le nom si vous prévoyez de modifier la narration automatique et si vous avez d'autres calculs similaires dans votre analyse.

  5. Dans la section Options d'affichage, choisissez les options suivantes pour personnaliser ce qui est affiché dans votre widget d'analyse. Vous pouvez toujours explorer tous vos résultats, quel que soit l'affichage choisi.

    1. Nombre maximal d'anomalies à afficher – Le nombre d'anomalies que vous voulez afficher dans le widget narratif.

    2. Sévérité – Le niveau minimum de gravité des anomalies que vous voulez afficher dans le widget d'analyse.

      Un niveau de gravité est une plage de scores d'anomalie qui se caractérise par le plus faible score réel d'anomalies inclus dans la plage. Toutes les anomalies qui ont une note plus élevée sont incluses dans la plage. Si vous définissez la gravité sur Faible, l'aperçu affiche toutes les anomalies qui se classent entre faible et très élevée. Si vous définissez la gravité sur Très élevée, l'aperçu affiche uniquement les anomalies présentant les notes d'anomalie les plus élevées.

      Vous pouvez utiliser les options suivantes :

      • Très élevée

      • Élevée et supérieure

      • Moyenne et supérieure

      • Faible et supérieure

    3. Direction – La direction sur l'axe des x ou l'axe des y que vous voulez identifier comme anormale. Sélectionnez parmi les éléments suivants :

      • Plus élevé que prévu pour identifier les valeurs plus élevées comme des anomalies.

      • Plus bas que prévu pour identifier les valeurs plus basses comme des anomalies.

      • [TOUT] pour identifier toutes les valeurs anormales, qu'elles soient élevées ou faibles (paramètre par défaut).

    4. Delta – Saisissez une valeur personnalisée à utiliser pour identifier les anomalies. Tout nombre supérieur à la valeur de seuil est considéré comme une anomalie. Les valeurs ici modifient le fonctionnement de l'information dans votre analyse. Dans cette section, vous pouvez définir les éléments suivants :

      • Valeur absolue – La valeur réelle à utiliser. Par exemple, supposons qu'il s'agisse de 48. Amazon identifie QuickSight ensuite les valeurs comme anormales lorsque la différence entre une valeur et la valeur attendue est supérieure à 48.

      • Pourcentage – Seuil de pourcentage à utiliser. Par exemple, supposons qu'il s'agisse de 12,5 %. Amazon identifie QuickSight ensuite les valeurs comme anormales lorsque la différence entre une valeur et la valeur attendue est supérieure à 12,5 %.

    5. Trier par – Choisissez une méthode de tri pour vos résultats. Certaines méthodes sont basées sur le score d'anomalie QuickSight généré par Amazon. Amazon QuickSight attribue des scores plus élevés aux points de données qui semblent anormaux. Vous pouvez utiliser les options suivantes :

      • Score d'anomalie pondéré – Score d'anomalie multiplié par le logarithme de la valeur absolue de la différence entre la valeur réelle et la valeur attendue. Il s'agit toujours d'un nombre positif.

      • Score d'anomalie – Score d'anomalie réel attribué à ce point de données.

      • Différence pondérée par rapport à la valeur attendue – Score d'anomalie multiplié par la différence entre la valeur réelle et la valeur attendue (par défaut).

      • Différence par rapport à la valeur attendue – Différence réelle entre la valeur réelle et la valeur attendue (c'est-à-dire réelle-attendue).

      • Valeur réelle – Valeur réelle sans aucune formule appliquée.

  6. Dans la section Options de planification, définissez la planification de l'exécution automatique du recalcul de l'analyse. La planification s'exécute uniquement pour des tableaux de bord publiés. Dans l'analyse, vous pouvez l'exécuter manuellement si nécessaire. Ce fichier contient les paramètres suivants :

    • Occurrence – Définissez la fréquence à laquelle vous voulez que le recalcul soit exécuté : toutes les heures, tous les jours, toutes les semaines ou tous les mois.

    • Lancer la planification le – La date et l'heure de début de l'exécution de la planification.

    • Fuseau horaire – Le fuseau horaire dans lequel la planification s'exécute. Pour afficher une liste, supprimez l'entrée actuelle.

  7. Dans la section Principaux contributeurs, configurez Amazon QuickSight pour qu'il analyse les principaux facteurs lorsqu'une valeur aberrante (anomalie) est détectée.

    Par exemple, Amazon QuickSight peut indiquer les principaux clients qui ont contribué à l'augmentation des ventes de produits de bricolage aux États-Unis. Vous pouvez ajouter jusqu'à quatre dimensions provenant de votre jeu de données. Il s'agit notamment des dimensions que vous n'avez pas ajoutées aux sélecteurs de champs de ce widget d'analyse.

    Pour obtenir une liste des dimensions disponibles pour l'analyse de contribution, sélectionnez Sélectionner les champs.

  8. Choisissez Enregistrer pour confirmer vos choix. Choisissez Cancel (Annuler) pour quitter sans sauvegarder.

  9. Dans le widget d'analyse, sélectionnez Exécuter maintenant pour lancer la détection d'anomalies et afficher votre analyse.

La durée de la détection d'anomalies varie en fonction du nombre de points de données uniques que vous analysez. Le processus peut prendre quelques minutes pour un nombre réduit de points, ou durer plusieurs heures.

Pendant son exécution en arrière-plan, vous pouvez effectuer d'autres tâches dans votre analyse. Attendez la fin de la détection avant de modifier la configuration, d'éditer la narration ou d'ouvrir la page Explorer les anomalies pour cette analyse.

Le widget d'analyse doit être exécuté au moins une fois avant que vous puissiez voir les résultats. Si vous pensez que le statut peut être obsolète, vous pouvez actualiser la page. L'analyse peut avoir les états suivants.

S'affiche sur la page Statut
Bouton Run now (Exécuter maintenant) La tâche n'a pas encore commencé.
Message à propos de Analyzing for anomalies (Analyse des anomalies) La tâche est en cours d'exécution.
Texte concernant les anomalies détectées (cas particuliers) La tâche s'est exécutée avec succès. Le message indique quand le calcul de ce widget a été mis à jour pour la dernière fois.
Icône d'alerte avec un point d'exclamation (!) Cette icône indique qu'une erreur s'est produite lors de la dernière exécution. Si la narration s'affiche également, vous pouvez toujours utiliser Explore anomalies (Explorer les anomalies) pour utiliser les données de l'exécution réussie précédente.