Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Cycle de vie du lac de données
La création d'un lac de données comporte généralement cinq étapes :
-
Configuration du stockage
-
Déplacement de données
-
Préparation et catalogage des données
-
Configuration des politiques de sécurité
-
Rendre les données disponibles pour la consommation
La figure suivante est un schéma d'architecture de haut niveau d'un lac de données de centre de contact Amazon Connect qui s'intègre aux services d'analyse et d'intelligence artificielle et d'apprentissage automatique (AI/ML) d'AWS. La section suivante couvre les scénarios et les services AWS présentés dans cette figure.

Lac de données du centre de contact Amazon Connect avec AWS Analytics et services AI/ML
Stockage
Amazon S3
Les compartiments et objets S3 sont privés, l'accès public par bloc S3 étant activé par défaut pour toutes les régions du monde. Vous pouvez configurer des contrôles d'accès centralisés sur les ressources S3 à l'aide de politiques de compartiment, de politiques AWS Identity and Access Management
AWS CloudTrail
S3 Intelligent-Tiering
Le stockage des données dans des formats en colonnes tels qu'Apache Parquet
Avec S3 Select et S3 Glacier Select, vous pouvez interroger les métadonnées des objets à l'aide d'une expression SQL (Structured Query Language) sans déplacer les objets vers un autre magasin de données.
S3 Batch Operations
Les points d'accès S3
S3 Transfer Acceleration
À mesure que votre lac de données s'agrandit, S3 Storage Lens
Ingestion
AWS fournit un portefeuille complet de services de transfert de données pour transférer vos données existantes vers un lac de données centralisé. Amazon Storage Gateway
-
AWS Storage Gatewayétend vos environnements sur site au stockage AWS en remplaçant les librairies de bandes par du stockage dans le cloud, en fournissant des partages de fichiers basés sur le stockage dans le cloud ou en créant un cache à faible latence pour accéder à vos données dans AWS à partir d'environnements sur site.
-
AWS Direct Connectétablit une connectivité privée entre vos environnements sur site et AWS afin de réduire les coûts du réseau, d'augmenter le débit et de fournir une expérience réseau cohérente.
-
AWS DataSync peut transférer des millions de fichiers vers S3, Amazon Elastic File System
(Amazon EFS) ou Amazon FSx for Windows File Server tout en optimisant l'utilisation du réseau. -
Amazon Kinesis fournit un moyen sécurisé de capturer et de charger des données de streaming dans S3. Amazon Data Firehose
est un service entièrement géré qui fournit des données de streaming en temps réel directement à S3. Firehose s'adapte automatiquement au volume et au débit des données de streaming et ne nécessite aucune administration continue. Vous pouvez transformer les données de streaming en utilisant la compression, le chiffrement, le traitement par lots de données ou AWS Lambda les fonctions de Firehose avant de les stocker dans S3. Le chiffrement Firehose prend en charge le chiffrement S3 côté serveur avec (). AWS Key Management Service AWS KMS Vous pouvez également chiffrer les données à l'aide de votre clé personnalisée. Firehose peut concaténer et fournir plusieurs enregistrements entrants sous la forme d'un seul objet S3 afin de réduire les coûts et d'optimiser le débit. AWS Snow Family fournit un mécanisme de transfert de données hors ligne. AWS Snowball Edge
fournit un dispositif informatique de pointe portable et robuste pour la collecte, le traitement et la migration des données. Pour le transfert de données à l'échelle de l'exaoctet, vous pouvez utiliser AWS Snowmobile pour déplacer d'importants volumes de données vers le cloud. DistCp
fournit une fonctionnalité de copie distribuée pour déplacer des données dans l'écosystème Hadoop. S3 DisctCp est une extension DistCp optimisée pour le transfert de données entre le système de fichiers distribué Hadoop (HDFS) et S3. Ce blog fournit des informations sur la façon de déplacer des données entre HDFS et S3 à l'aide de S3DistCp.
Catalogage
L'un des défis courants liés à l'architecture d'un lac de données est le manque de surveillance du contenu des données brutes stockées dans le lac de données. Organisations ont besoin de gouvernance, de cohérence sémantique et de contrôles d'accès pour éviter les pièges liés à la création d'un marécage de données sans curation.
AWS Lake Formation
AWS Glue DataBrew
Sécurité
Amazon Connect sépare les données par ID de compte AWS et ID d'instance Amazon Connect afin de garantir un accès autorisé aux données au niveau de l'instance Amazon Connect.
Amazon Connect chiffre les informations personnelles identifiables (PII), les données de contact et les profils clients au repos à l'aide d'une clé à durée limitée spécifique à votre instance Amazon Connect. Le chiffrement S3 côté serveur sécurise les enregistrements vocaux et de chat au repos à l'aide d'une clé de données KMS unique par compte AWS. Vous maintenez un contrôle de sécurité complet pour configurer l'accès des utilisateurs aux enregistrements d'appels dans votre compartiment S3, y compris le suivi des personnes qui écoutent ou suppriment les enregistrements d'appels. Amazon Connect chiffre les empreintes vocales des clients à l'aide d'une clé KMS appartenant au service afin de protéger l'identité du client. Toutes les données échangées entre Amazon Connect et d'autres services AWS, ou des applications externes, sont toujours chiffrées en transit à l'aide du chiffrement TLS (Transport Layer Security) conforme aux normes du secteur.
La sécurisation d'un lac de données nécessite des contrôles précis pour garantir l'accès et l'utilisation autorisés des données. Les ressources S3 sont privées et ne sont accessibles que par leur propriétaire par défaut. Le propriétaire de la ressource peut créer une combinaison de politiques IAM basées sur les ressources ou basées sur l'identité pour accorder et gérer des autorisations sur les compartiments et les objets S3. Les politiques basées sur les ressources, telles que les politiques relatives aux compartiments, ACLs sont associées aux ressources. En revanche, les politiques basées sur l'identité sont associées aux utilisateurs, groupes ou rôles IAM de votre compte AWS.
Nous recommandons des politiques basées sur l'identité pour la plupart des environnements de lacs de données afin de simplifier la gestion de l'accès aux ressources et les autorisations de service pour les utilisateurs de vos lacs de données. Vous pouvez créer des utilisateurs, des groupes et des rôles IAM dans des comptes AWS et les associer à des politiques basées sur l'identité qui accordent l'accès aux ressources S3.
Le modèle AWS Lake Formation d'autorisation fonctionne conjointement avec les autorisations IAM pour régir l'accès aux lacs de données. Le modèle d'autorisation de Lake Formation utilise un mécanisme GRANT ou REVOKE de type système de gestion de base de données (DBMS). Les autorisations IAM contiennent des politiques basées sur l'identité. Par exemple, un utilisateur doit passer des contrôles d'autorisation par le biais des autorisations IAM et Lake Formation avant d'accéder à une ressource de lac de données.
AWS CloudTrail suit les appels d'API Amazon Connect, y compris l'adresse IP et l'identité du demandeur, ainsi que la date et l'heure de la demande dans l'historique des CloudTrail événements. La création d' AWS CloudTrail un suivi permet de fournir des AWS CloudTrail journaux en continu à votre compartiment S3.
Les groupes de travail Amazon Athena peuvent séparer l'exécution des requêtes et contrôler l'accès des utilisateurs, des équipes ou des applications à l'aide de politiques basées sur les ressources. Vous pouvez renforcer le contrôle des coûts en limitant l'utilisation des données dans les groupes de travail.
Surveillance
L'observabilité est essentielle pour garantir la disponibilité, la fiabilité et les performances d'un centre de contact et d'un lac de données. Amazon CloudWatch
Amazon Connect envoie les données d'utilisation de l'instance sous forme de CloudWatch métriques Amazon à une minute d'intervalle. La durée de conservation des données pour Amazon CloudWatch Metrics est de deux semaines. Définissez les exigences de conservation des journaux et les politiques de cycle de vie dès le début pour garantir la conformité réglementaire et réaliser des économies pour l'archivage des données à long terme.
Amazon CloudWatch Logs fournit un moyen simple de filtrer les données des journaux, d'identifier les cas de non-conformité pour les enquêtes sur les incidents et d'accélérer les résolutions. Vous pouvez personnaliser les flux de contacts pour détecter les appelants à haut risque ou les activités potentiellement frauduleuses. Par exemple, vous pouvez déconnecter tous les contacts entrants figurant sur votre liste de refus prédéfinie.
Analyse
Un lac de données de centre de contact basé sur un portefeuille d'analyses descriptives, prédictives et en temps réel vous aide à extraire des informations pertinentes et à répondre aux questions commerciales critiques.
Une fois que vos données arrivent dans le lac de données S3, vous pouvez utiliser tous les services d'analyse spécialement conçus, tels qu'Amazon Athena et Amazon
Pour une solution d'entrepôt de données hautement évolutive, vous pouvez activer le streaming de données dans Amazon Connect afin de diffuser les enregistrements de contacts vers Amazon Redshift via Amazon
Machine learning
La création d'un lac de données introduit un nouveau paradigme dans l'architecture des centres de contact, permettant à votre entreprise de fournir un service client amélioré et personnalisé à l'aide de fonctionnalités d'apprentissage automatique (ML).
Le développement traditionnel du machine learning est un processus complexe et coûteux. AWS fournit l'étendue et l'étendue d'une infrastructure évolutive, économique et performante, ainsi que des services de machine learning
Amazon SageMaker AI
Il est essentiel de réduire les frictions dans le parcours client pour éviter la perte de clients. Pour ajouter de l'intelligence à votre centre d'appels, vous pouvez créer des chatbots conversationnels basés sur l'IA à l'aide des fonctionnalités de reconnaissance vocale automatique (ASR) et de compréhension du langage naturel (NLU) d'Amazon
Comprendre la dynamique appelant-agent est essentiel pour améliorer la qualité globale du service. Consultez ce blog
Pour les entreprises présentes à l'international, vous pouvez créer une expérience vocale multilingue
Les logiciels de planification financière traditionnels créent des prévisions basées sur des données chronologiques historiques sans corréler les tendances incohérentes et les variables pertinentes. Amazon Forecast
Amazon Connect fournit les attributs des appels fournis par les opérateurs de téléphonie, tels que l'emplacement géographique de l'équipement vocal pour indiquer l'origine de l'appel, les types d'appareils téléphoniques tels que les lignes fixes ou mobiles, le nombre de segments de réseau traversés par l'appel et d'autres informations relatives à l'origine de l'appel. À l'aide de l'outil entièrement géré Amazon Fraud Detector