Création d'un ensemble de données à partir d'un ensemble de données existant dans Amazon QuickSight - Amazon QuickSight

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'un ensemble de données à partir d'un ensemble de données existant dans Amazon QuickSight

Après avoir créé un ensemble de données dans Amazon QuickSight, vous pouvez créer des ensembles de données supplémentaires en l'utilisant comme source. Dans ce cas, toutes les préparations de données contenues dans le jeu de données parent, telles que les jointures ou les champs calculés, sont conservées. Vous pouvez ajouter une préparation supplémentaire aux données des nouveaux jeux de données enfants, par exemple, en joignant de nouvelles données et en filtrant les données. Vous pouvez également configurer votre propre calendrier d'actualisation des données pour le jeu de données enfant et suivre les tableaux de bord ainsi que les analyses qui l'utilisent.

Les jeux de données enfants créés à l'aide d'un jeu de données dont les règles RLS sont actives en tant que source héritent des règles RLS du jeu de données parent. Les utilisateurs qui créent un jeu de données enfant à partir d'un jeu de données parent plus important ne peuvent voir que les données auxquelles ils ont accès dans le jeu de données parent. Vous pouvez ensuite ajouter d'autres règles RLS au nouveau jeu de données enfant, en plus des règles RLS héritées, afin de mieux gérer les personnes autorisées à accéder aux données du nouveau jeu de données. Vous ne pouvez créer des jeux de données enfants qu'à partir de jeux de données dont les règles RLS sont actives dans les requêtes directes.

La création de jeux de données à partir de QuickSight jeux de données existants présente les avantages suivants :

  • Gestion centralisée des jeux de données – Les ingénieurs de données peuvent facilement s'adapter aux besoins de plusieurs équipes au sein de leur organisation. Pour ce faire, ils peuvent développer et gérer quelques jeux de données à usage général qui décrivent les principaux modèles de données de l'organisation.

  • Réduction de la gestion des sources de données — Les analystes commerciaux (BA) consacrent souvent beaucoup de temps et d'efforts à demander l'accès aux bases de données, à gérer les informations d'identification des bases de données, à trouver les bonnes tables et à gérer les calendriers d'actualisation QuickSight des données. Créer de nouveaux jeux de données à partir de jeux de données existants permet aux administrateurs de bases de données de ne pas repartir de zéro avec les données brutes des bases de données. Ils peuvent commencer à travailler avec des données sélectionnées.

  • Indicateurs clés prédéfinis : En créant des jeux de données à partir de jeux de données existants, les ingénieurs de données peuvent définir et gérer de manière centralisée les définitions des données critiques dans les nombreuses organisations de leur entreprise. La croissance des ventes et le rendement marginal net en sont des exemples. Grâce à cette fonctionnalité, les ingénieurs de données peuvent également distribuer les modifications apportées à ces définitions. Cette approche permet à leurs analystes commerciaux de commencer à visualiser les bonnes données de manière plus rapide et plus fiable.

  • Flexibilité de personnalisation des données – En créant des jeux de données à partir de jeux de données existants, les analystes commerciaux bénéficient d'une plus grande flexibilité pour personnaliser les jeux de données en fonction de leurs propres besoins commerciaux. Ainsi, ils ne craignent pas de perturber les données des autres équipes.

Par exemple, supposons que vous faites partie d'une équipe centrale de commerce électronique composée de cinq ingénieurs de données. Grâce à une base de données, vous et votre équipe avez accès aux données relatives aux ventes, aux commandes, aux annulations et aux retours. Vous avez créé un QuickSight jeu de données en joignant 18 autres tables de dimensions par le biais d'un schéma. Un indicateur clé créé par votre équipe est le champ calculé : ventes de produits commandés (OPS). Sa définition est la suivante : OPS = quantité de produit x prix.

Votre équipe est au service de plus de 100 analystes commerciaux répartis dans 10 équipes différentes dans huit pays. Il s'agit de l'équipe des coupons, de l'équipe du marketing sortant, de l'équipe de la plateforme mobile et de l'équipe des recommandations. Toutes ces équipes utilisent la métrique OPS comme base pour analyser leur propre secteur d'activité.

Plutôt que de créer et de gérer manuellement des centaines de jeux de données non connectés, votre équipe réutilise des jeux de données afin de créer plusieurs niveaux de jeux de données pour les équipes de l'organisation. Cela permet de centraliser la gestion des données et de donner à chaque équipe la capacité de personnaliser les données en fonction de ses propres besoins. Dans le même temps, cela synchronise les mises à jour des données, telles que les mises à jour des définitions des métriques, et assure la sécurité au niveau des lignes et des colonnes. Par exemple, les différentes équipes de votre organisation peuvent utiliser les jeux de données centralisés. Ils peuvent ensuite les combiner avec les données spécifiques à leur équipe pour créer de nouveaux jeux de données et élaborer des analyses à partir de ces derniers.

En plus d'utiliser la métrique OPS clé, les autres équipes de votre organisation peuvent réutiliser les métadonnées des colonnes issues des jeux de données centralisés que vous avez créés. Par exemple, l'équipe d'ingénierie des données peut définir des métadonnées, telles que le nom, la description, le type de données et les dossiers, dans un jeu de données centralisé. Toutes les équipes suivantes peuvent également l'utiliser.

Note

Amazon QuickSight prend en charge la création d'un maximum de deux niveaux supplémentaires de jeux de données à partir d'un seul ensemble de données.

Par exemple, à partir d'un jeu de données parent, vous pouvez créer un jeu de données enfant, puis un jeu de données petit-enfant jusqu'à un total de trois niveaux de jeu de données.

Création d'un jeu de données à partir d'un jeu de données existant

Utilisez la procédure suivante pour créer un jeu de données à l'aide d'un jeu de données existant.

Pour créer un jeu de données à partir d'un jeu de données existant
  1. Sur la page d' QuickSight accueil, choisissez Datasets dans le volet de gauche.

  2. Sur la page Jeux de données, choisissez les données que vous souhaitez utiliser pour créer un jeu de données.

  3. Sur la page qui s'ouvre pour ce jeu de données, choisissez le menu déroulant Utiliser dans l'analyse, puis sélectionnez Utiliser dans le jeu de données.

    À utiliser dans un jeu de données.

    La page de préparation des données s'ouvre et précharge tous les éléments du jeu de données parent, y compris les champs calculés, les jointures et les paramètres de sécurité.

  4. Sur la page de préparation des données qui s'ouvre, pour le mode Requête en bas à gauche, choisissez la manière dont vous souhaitez que le jeu de données intègre les modifications et les mises à jour du jeu de données parent d'origine. Vous pouvez choisir les options suivantes :

    • Requête directe : il s'agit du mode de requête par défaut. Si vous choisissez cette option, les données de ce jeu de données sont automatiquement actualisées lorsque vous ouvrez un jeu de données, une analyse ou un tableau de bord associé. Cependant, les limites suivantes s'appliquent :

      • Si le jeu de données parent autorise les requêtes directes, vous pourrez utiliser le mode de requête directe dans le jeu de données enfant.

      • Si vous avez plusieurs jeux de données parents dans une jointure, vous pourrez choisir le mode de requête directe pour votre jeu de données enfant uniquement si tous les parents proviennent de la même source de données sous-jacente. Par exemple, la même connexion Amazon Redshift.

      • La requête directe est prise en charge pour un jeu de données SPICE parent unique. Elle n'est pas prise en charge pour plusieurs jeux de données SPICE parents dans une jointure.

    • SPICE – Si vous choisissez cette option, vous pourrez définir un calendrier pour la synchronisation de votre nouveau jeu de données avec le jeu de données parent. Pour plus d'informations sur la création de programmes d'actualisation SPICE pour les jeux de données, consultez la rubrique Actualisation des données SPICE.

  5. (Facultatif) Préparez vos données pour analyse. Pour plus d'informations sur la préparation des données, consultez la rubrique Préparation des données sur Amazon QuickSight.

  6. (Facultatif) Configurez la sécurité au niveau des lignes ou des colonnes (RLS/CLS) pour restreindre l'accès au jeu de données. Pour plus d'informations sur la configuration RLS, consultez la rubrique Utilisation de la sécurité au niveau des lignes (RLS) avec des règles basées sur les utilisateurs pour restreindre l'accès à un jeu de données. Pour plus d'informations sur la configuration CLS, consultez la rubrique Utiliser la sécurité au niveau des colonnes (CLS) pour restreindre l'accès à un jeu de données.

    Note

    Vous ne pouvez configurer RLS/CLS que sur des jeux de données enfants. Le protocole RLS/CLS sur les jeux de données parents n'est pas pris en charge.

  7. Lorsque vous avez terminé, choisissez Enregistrer et publier pour enregistrer vos modifications et publier le nouveau jeu de données enfant. Vous pouvez également choisir Publier et visualiser pour publier le nouveau jeu de données enfant et commencer à visualiser vos données.