Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Cycle de vie du lac de données
La création d'un lac de données comporte généralement cinq étapes :
-
Configuration du stockage
-
Déplacement de données
-
Préparation et catalogage des données
-
Configuration des politiques de sécurité
-
Rendre les données disponibles pour la consommation
La figure suivante est un schéma d'architecture de haut niveau d'un lac de données de centre de contact Amazon Connect qui s'intègre aux services AWS d'analyse et d'intelligence artificielle/apprentissage automatique (AI/ML). La section suivante couvre les scénarios et les AWS services présentés dans cette figure.
Lac de données du centre de contact Amazon Connect avec AWS outils d'analyse et services d'intelligence artificielle et d'apprentissage automatique
Stockage
Amazon S3
Les compartiments et objets S3 sont privés, l'accès public par bloc S3 étant activé par défaut pour toutes les régions du monde. Vous pouvez configurer des contrôles d'accès centralisés sur les ressources S3 à l'aide de politiques de compartiment, de politiques AWS Identity and Access Management
AWS CloudTrail
S3 Intelligent-Tiering
Le stockage des données dans des formats en colonnes tels qu'Apache Parquet
Avec S3 Select et S3 Glacier Select, vous pouvez interroger les métadonnées des objets à l'aide d'une expression de langage de requête structuré (SQL) sans déplacer les objets vers un autre magasin de données.
S3 Batch Operations
Les points d'accès S3
S3 Transfer Acceleration
À mesure que votre lac de données s'agrandit, S3 Storage Lens
Ingestion
AWSfournit un portefeuille complet de services de transfert de données pour transférer vos données existantes vers un lac de données centralisé. Amazon Storage Gateway
-
AWS Storage Gatewayétend vos environnements sur site au AWS stockage en remplaçant les librairies de bandes par le stockage dans le cloud, en fournissant des partages de fichiers basés sur le stockage dans AWS le cloud ou en créant un cache à faible latence pour accéder à vos données depuis des environnements sur site.
-
AWS Direct Connectétablit une connectivité privée entre vos environnements sur site AWS afin de réduire les coûts du réseau, d'augmenter le débit et de fournir une expérience réseau cohérente.
-
AWS DataSyncpeut transférer des millions de fichiers vers S3, Amazon Elastic File System
(AmazonEFS) ou Amazon FSx for Windows File Server tout en optimisant l'utilisation du réseau. -
Amazon Kinesis fournit un moyen sécurisé de capturer et de charger des données de streaming dans S3. Amazon Data Firehose
est un service entièrement géré qui fournit des données de streaming en temps réel directement à S3. Firehose s'adapte automatiquement au volume et au débit des données de streaming et ne nécessite aucune administration continue. Vous pouvez transformer les données de streaming à l'aide de la compression, du chiffrement, du traitement par lots de données ou AWS Lambda des fonctions de Firehose avant de les stocker dans S3. Le chiffrement Firehose prend en charge le chiffrement S3 côté serveur avec (). AWS Key Management Service AWS KMS Vous pouvez également chiffrer les données à l'aide de votre clé personnalisée. Firehose peut concaténer et fournir plusieurs enregistrements entrants sous la forme d'un seul objet S3 afin de réduire les coûts et d'optimiser le débit. AWSSnow Family fournit un mécanisme de transfert de données hors ligne. AWS Snowball
fournit un dispositif informatique de pointe portable et robuste pour la collecte, le traitement et la migration des données. Pour le transfert de données à l'échelle de l'exaoctet, vous pouvez utiliser AWSSnowmobile pour déplacer d'énormes volumes de données vers le cloud. DistCp
fournit une fonctionnalité de copie distribuée pour déplacer des données dans l'écosystème Hadoop. S3 DisctCp est une extension DistCp optimisée pour le transfert de données entre Hadoop Distributed File System (HDFS) et S3. Ce blog fournit des informations sur la façon de déplacer des données entre HDFS et S3 à l'aide de S3DistCp.
Catalogage
L'un des défis courants liés à l'architecture d'un lac de données est le manque de surveillance du contenu des données brutes stockées dans le lac de données. Organisations ont besoin de gouvernance, de cohérence sémantique et de contrôles d'accès pour éviter les pièges liés à la création d'un marécage de données sans curation.
AWS Lake Formation
AWS Glue DataBrew
Sécurité
Amazon Connect sépare les données par identifiant de AWS compte et identifiant d'instance Amazon Connect afin de garantir un accès autorisé aux données au niveau de l'instance Amazon Connect.
Amazon Connect chiffre les informations personnelles (PII), les données de contact et les profils clients au repos à l'aide d'une clé à durée limitée spécifique à votre instance Amazon Connect. Le chiffrement S3 côté serveur sécurise les enregistrements vocaux et de chat au repos à l'aide d'une clé de KMS données unique par compte. AWS Vous maintenez un contrôle de sécurité complet pour configurer l'accès des utilisateurs aux enregistrements d'appels dans votre compartiment S3, y compris le suivi des personnes qui écoutent ou suppriment les enregistrements d'appels. Amazon Connect chiffre les empreintes vocales du client à l'aide d'une KMS clé appartenant au service afin de protéger l'identité du client. Toutes les données échangées entre Amazon Connect et d'autres AWS services ou applications externes sont toujours chiffrées en transit à l'aide du chiffrement standard de la couche de transport (TLS).
La sécurisation d'un lac de données nécessite des contrôles précis pour garantir l'accès et l'utilisation autorisés des données. Les ressources S3 sont privées et ne sont accessibles que par leur propriétaire par défaut. Le propriétaire de la ressource peut créer une combinaison de IAM politiques basées sur les ressources ou basées sur l'identité pour accorder et gérer des autorisations sur les compartiments et les objets S3. Les politiques basées sur les ressources, telles que les politiques relatives aux compartiments, ACLs sont associées aux ressources. En revanche, les politiques basées sur l'identité sont associées aux IAM utilisateurs, aux groupes ou aux rôles de votre AWS compte.
Nous recommandons des politiques basées sur l'identité pour la plupart des environnements de lacs de données afin de simplifier la gestion de l'accès aux ressources et les autorisations de service pour les utilisateurs de vos lacs de données. Vous pouvez créer des IAM utilisateurs, des groupes et des rôles dans des AWS comptes et les associer à des politiques basées sur l'identité qui accordent l'accès aux ressources S3.
Le modèle AWS Lake Formation d'autorisation fonctionne conjointement avec IAMles autorisations pour régir l'accès aux lacs de données. Le modèle d'autorisation de Lake Formation utilise un type GRANT ou un REVOKE mécanisme de gestion de base de données (DBMS). IAMles autorisations contiennent des politiques basées sur l'identité. Par exemple, un utilisateur doit passer des contrôles d'autorisation à la fois par le biais IAM des autorisations de Lake Formation avant d'accéder à une ressource de lac de données.
AWS CloudTrail suit les API appels Amazon Connect, y compris l'adresse IP et l'identité du demandeur, ainsi que la date et l'heure de la demande dans l'historique des CloudTrail événements. La création d' AWS CloudTrail un suivi permet de fournir des AWS CloudTrail journaux en continu à votre compartiment S3.
Les groupes de travail Amazon Athena peuvent séparer l'exécution des requêtes et contrôler l'accès par les utilisateurs, les équipes ou les applications à l'aide de politiques basées sur les ressources. Vous pouvez renforcer le contrôle des coûts en limitant l'utilisation des données dans les groupes de travail.
Surveillance
L'observabilité est essentielle pour garantir la disponibilité, la fiabilité et les performances d'un centre de contact et d'un lac de données. Amazon CloudWatch
Amazon Connect envoie les données d'utilisation de l'instance sous forme de CloudWatch métriques Amazon à une minute d'intervalle. La durée de conservation des données pour Amazon CloudWatch Metrics est de deux semaines. Définissez les exigences de conservation des journaux et les politiques de cycle de vie dès le début pour garantir la conformité réglementaire et réaliser des économies pour l'archivage des données à long terme.
Amazon CloudWatch Logs fournit un moyen simple de filtrer les données des journaux, d'identifier les cas de non-conformité pour les enquêtes sur les incidents et d'accélérer les résolutions. Vous pouvez personnaliser les flux de contacts pour détecter les appelants à haut risque ou les activités potentiellement frauduleuses. Par exemple, vous pouvez déconnecter tous les contacts entrants figurant sur votre liste de refus prédéfinie.
Analyse
Un lac de données de centre de contact basé sur un portefeuille d'analyses descriptives, prédictives et en temps réel vous aide à extraire des informations pertinentes et à répondre aux questions commerciales critiques.
Une fois que vos données sont arrivées dans le lac de données S3, vous pouvez utiliser tous les services d'analyse spécialement conçus, tels qu'Amazon Athena et Amazon
Pour une solution d'entrepôt de données hautement évolutive, vous pouvez activer le streaming de données dans Amazon Connect afin de diffuser les enregistrements de contacts vers Amazon Redshift via Amazon
Machine learning
La création d'un lac de données introduit un nouveau paradigme dans l'architecture des centres de contact, permettant à votre entreprise de fournir un service client amélioré et personnalisé à l'aide de fonctionnalités d'apprentissage automatique (ML).
Le développement traditionnel du machine learning est un processus complexe et coûteux. AWSfournit la profondeur et l'étendue d'une infrastructure de machine learning performante, rentable et évolutive, ainsi que de services de machine learning
Amazon SageMaker
Il est essentiel de réduire les frictions dans le parcours client pour éviter la perte de clients. Pour ajouter de l'intelligence à votre centre d'appels, vous pouvez créer des chatbots conversationnels basés sur l'IA à l'aide des fonctionnalités de reconnaissance vocale automatique (ASR) et de compréhension du langage naturel () d'Amazon
Comprendre la dynamique appelant-agent est essentiel pour améliorer la qualité globale du service. Consultez ce blog
Pour les entreprises présentes à l'international, vous pouvez créer une expérience vocale multilingue
Les logiciels de planification financière traditionnels créent des prévisions basées sur des données chronologiques historiques sans corréler les tendances incohérentes et les variables pertinentes. Amazon Forecast
Amazon Connect fournit les attributs des appels fournis par les opérateurs de téléphonie, tels que l'emplacement géographique de l'équipement vocal pour indiquer l'origine de l'appel, les types d'appareils téléphoniques tels que les lignes fixes ou mobiles, le nombre de segments de réseau traversés par l'appel et d'autres informations relatives à l'origine de l'appel. À l'aide de l'outil entièrement géré Amazon Fraud Detector