Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Comment fonctionnent les flux de capture des données modifiées (CDC) dans Amazon Keyspaces
Cette section fournit un aperçu du fonctionnement des flux de capture des données de modification (CDC) dans Amazon Keyspaces.
La capture des données de modification (CDC) d'Amazon Keyspaces enregistre une séquence ordonnée de modifications au niveau des lignes dans les tables Amazon Keyspaces et stocke ces informations dans un journal appelé stream pendant 24 heures maximum. Chaque modification au niveau de la ligne génère un nouvel enregistrement CDC qui contient les informations de la colonne clé primaire ainsi que les états « avant » et « après » de la ligne, y compris toutes les colonnes. Les applications peuvent accéder au flux et visualiser les mutations en temps quasi réel.
Lorsque vous activez le CDC sur votre table, Amazon Keyspaces crée un nouveau flux CDC et commence à recueillir les informations relatives à chaque modification du tableau. Le flux CDC possède un Amazon Resource Name (ARN) au format suivant :
arn:${Partition}:cassandra:{Region}:${Account}:/keyspace/${keyspaceName}/table/${tableName}/stream/${streamLabel}
Vous pouvez sélectionner le type d'informations ou le type de vue que le flux CDC collecte pour chaque enregistrement lorsque vous activez le flux CDC pour la première fois. Vous ne pouvez pas modifier le type de vue du stream par la suite. Amazon Keyspaces prend en charge les types de vues suivants :
NEW_AND_OLD_IMAGES
— Capture les versions de la ligne avant et après la mutation. Il s’agit de l’option par défaut.NEW_IMAGE
— Capture la version de la ligne après la mutation.OLD_IMAGE
— Capture la version de la ligne avant la mutation.KEYS_ONLY
— Capture les clés de partition et de clustering de la ligne mutée.
Chaque flux CDC est composé d'enregistrements. Chaque enregistrement représente une modification d'une seule ligne dans une table Amazon Keyspaces. Les enregistrements sont organisés de manière logique en groupes appelés shards. Ces groupes sont organisés logiquement par plages de clés primaires (combinaison de clés de partition, plages de clés de clustering) et constituent une construction interne d'Amazon Keyspaces. Chaque partition agit comme un conteneur pour plusieurs enregistrements et contient les informations nécessaires pour accéder à ces enregistrements et les itérer.

Un numéro de séquence est attribué à chaque enregistrement CDC, qui reflète l'ordre dans lequel l'enregistrement a été publié dans le shard. Il est garanti que le numéro de séquence augmentera et sera unique au sein de chaque partition.
Amazon Keyspaces crée et supprime automatiquement les partitions. En fonction de la charge de trafic, Amazon Keyspaces peut également diviser ou fusionner des partitions au fil du temps. Par exemple, Amazon Keyspaces peut diviser une partition en plusieurs nouvelles partitions ou fusionner des partitions en une seule partition. Amazon Keyspaces APIs publie les informations du shard et du CDC pour permettre aux applications consommatrices de traiter les enregistrements dans le bon ordre en accédant au graphe de lignée complet d'un fragment.
Amazon Keyspaces CDC repose sur les principes suivants sur lesquels vous pouvez vous appuyer lors de la création de votre application :
Chaque enregistrement de mutation au niveau de la ligne apparaît exactement une fois dans le flux CDC.
Lorsque vous consommez des fragments par ordre de lignée, chaque enregistrement de mutation au niveau de la ligne apparaît dans la même séquence que l'ordre de mutation réel sur la clé primaire.
Rubriques
Comment fonctionne la conservation des données pour les flux CDC dans Amazon Keyspaces
Amazon Keyspaces conserve les enregistrements du flux CDC pendant 24 heures. Vous ne pouvez pas modifier la durée de conservation. Si vous désactivez le CDC sur une table, les données du flux restent lisibles pendant 24 heures. Passé ce délai, les données expirent et les enregistrements sont automatiquement supprimés.
Comment fonctionne l'expiration des données Time to Live (TTL) avec les flux CDC dans Amazon Keyspaces
Amazon Keyspaces indique le délai d'expiration au column/cell niveau ainsi qu'au niveau de la ligne dans un champ de métadonnées appelé expirationTime
dans les enregistrements des modifications du CDC. Lorsque le TTL d'Amazon Keyspaces détecte l'expiration d'une cellule, le CDC crée un nouvel enregistrement de modification indiquant que le TTL est à l'origine de la modification. Pour plus d'informations sur le TTL, consultezExpirer les données avec Time to Live (TTL) pour Amazon Keyspaces (pour Apache Cassandra).
Comment fonctionnent les opérations par lots pour les flux CDC dans Amazon Keyspaces
Les opérations par lots sont divisées en interne en modifications individuelles au niveau des lignes. Amazon Keyspaces conserve tous les enregistrements des flux CDC au niveau de la ligne, même si la modification s'est produite lors d'une opération par lots. Amazon Keyspaces conserve l'ordre des enregistrements dans le flux CDC dans le même ordre que l'ordre de mutation qui s'est produit au niveau de la ligne ou sur la clé primaire.
Comment fonctionnent les colonnes statiques dans les flux CDC sur Amazon Keyspaces
Les valeurs des colonnes statiques sont partagées entre toutes les lignes d'une partition dans Cassandra. En raison de ce comportement, Amazon Keyspaces capture toutes les mises à jour apportées à une colonne statique sous forme d'enregistrement distinct dans le flux CDC. Les exemples suivants résument le comportement des mutations de colonnes statiques :
Lorsque seule la colonne statique est mise à jour, le flux CDC contient une modification de ligne pour la colonne statique en tant que seule colonne de la ligne.
Lorsqu'une ligne est mise à jour sans aucune modification de la colonne statique, le flux CDC contient une modification de ligne qui contient toutes les colonnes sauf la colonne statique.
Lorsqu'une ligne est mise à jour en même temps que la colonne statique, le flux CDC contient deux modifications de ligne distinctes, l'une pour la colonne statique et l'autre pour le reste de la ligne.
Comment fonctionne le chiffrement au repos pour les flux CDC dans Amazon Keyspaces
Pour chiffrer les données inactives dans le journal commandé par le CDC, Amazon Keyspaces utilise la même clé de chiffrement que celle déjà utilisée pour la table. Pour plus d'informations sur le chiffrement au repos, veuillez consulter Le chiffrement est au repos dans Amazon Keyspaces.
Comment fonctionne la réplication multirégionale pour les flux CDC dans Amazon Keyspaces
Vous pouvez activer et désactiver les flux CDC pour les répliques individuelles d'une table multirégionale à l'aide de l'update-table
API ou de la commande ALTER TABLE
CQL. En raison de la réplication asynchrone et de la résolution des conflits, les flux CDC pour les tables multirégionales ne sont pas cohérents entre eux. Régions AWS Par conséquent, les enregistrements capturés par Amazon Keyspaces dans le flux peuvent apparaître dans un ordre différent selon les régions.
Pour plus d'informations sur la réplication multirégionale, consultezRéplication multirégionale pour Amazon Keyspaces (pour Apache Cassandra).
Streams CDC et intégration aux AWS services
Comment utiliser les points de terminaison VPC pour les flux CDC dans Amazon Keyspaces
Vous pouvez utiliser les points de terminaison VPC pour accéder aux flux CDC d'Amazon Keyspaces. Pour plus d'informations sur la création et l'accès aux points de terminaison VPC pour les flux, consultez. Utilisation des flux CDC d'Amazon Keyspaces avec des points de terminaison VPC d'interface
Comment CloudWatch fonctionne la surveillance avec les flux CDC dans Amazon Keyspaces
Vous pouvez utiliser Amazon CloudWatch pour surveiller les appels d'API effectués vers le point de terminaison Amazon Keyspaces CDC. Pour plus d'informations sur les mesures disponibles, consultezMesures relatives à la capture des données de modification par Amazon Keyspaces (CDC).
Comment CloudTrail fonctionne la journalisation avec les flux CDC sur Amazon Keyspaces
Amazon Keyspaces CDC est intégré à AWS CloudTrail un service qui fournit un enregistrement des actions effectuées par un utilisateur, un rôle ou un AWS service dans Amazon Keyspaces. CloudTrail capture les appels d'API DDL (Data Definition Language) et les appels d'API DML (Data Manipulation Language) pour Amazon Keyspaces sous forme d'événements. Les appels capturés incluent les appels provenant de la console Amazon Keyspaces et les appels programmatiques vers les opérations de l'API Amazon Keyspaces.
Pour plus d'informations sur les événements CDC capturés par CloudTrail, voirJournalisation des appels d'API Amazon Keyspaces avec AWS CloudTrail.
Comment fonctionne le balisage pour les flux CDC dans Amazon Keyspaces
Les flux CDC d'Amazon Keyspaces sont une ressource étiquetable. Vous pouvez baliser un flux lorsque vous créez une table par programmation à l'aide de CQL, du AWS SDK ou du. AWS CLI Vous pouvez également baliser des flux existants, supprimer des balises ou afficher les balises d'un flux. Pour de plus amples informations, veuillez consulter Étiquetez les espaces clés, les tables et les flux dans Amazon Keyspaces.