Übersicht Voraussetzungen und Einschränkungen Architektur Tools Epen Zugehörige Ressourcen

Stellen Sie DynamoDB-Datensätze mithilfe von Kinesis Data Streams und Firehose an Amazon S3 bereit mit AWS CDK

Erstellt von Shashank Shrivastava (AWS) und Daniel Matuki da Cunha (AWS)

Übersicht

Dieses Muster enthält Beispielcode und eine Anwendung für die Übermittlung von Datensätzen von Amazon DynamoDB an Amazon Simple Storage Service (Amazon S3) mithilfe von Amazon Kinesis Data Streams und Amazon Data Firehose. Der Ansatz des Musters verwendet AWS Cloud Development Kit (AWS CDK) L3-Konstrukte und beinhaltet ein Beispiel dafür, wie eine Datentransformation durchgeführt wird, AWS Lambda bevor Daten an den Ziel-S3-Bucket in der Amazon Web Services (AWS) Cloud geliefert werden.

Kinesis Data Streams zeichnet Änderungen auf Elementebene in DynamoDB-Tabellen auf und repliziert sie in den erforderlichen Kinesis-Datenstrom. Ihre Anwendungen können auf den Kinesis Data Stream zugreifen und die Änderungen auf Elementebene nahezu in Echtzeit anzeigen. Kinesis Data Streams bietet auch Zugriff auf andere Amazon Kinesis Kinesis-Services wie Firehose und Amazon Managed Service für Apache Flink. Das bedeutet, dass Sie Anwendungen entwickeln können, die Echtzeit-Dashboards bereitstellen, Warnmeldungen generieren, dynamische Preisgestaltung und Werbung implementieren und anspruchsvolle Datenanalysen durchführen.

Sie können dieses Muster für Ihre Anwendungsfälle zur Datenintegration verwenden. Beispielsweise können Transportfahrzeuge oder Industrieanlagen große Datenmengen an eine DynamoDB-Tabelle senden. Diese Daten können dann transformiert und in einem in Amazon S3 gehosteten Data Lake gespeichert werden. Anschließend können Sie die Daten abfragen und verarbeiten und potenzielle Fehler vorhersagen, indem Sie serverlose Dienste wie Amazon Athena, Amazon Redshift Spectrum, Amazon Rekognition und verwenden. AWS Glue

Voraussetzungen und Einschränkungen

Voraussetzungen

Ein aktiver. AWS-Konto
AWS Command Line Interface (AWS CLI), installiert und konfiguriert. Weitere Informationen finden Sie AWS CLI in der AWS CLI Dokumentation unter Erste Schritte mit dem.
Node.js (18.x+) und npm, installiert und konfiguriert. Weitere Informationen finden Sie in der Dokumentation unter Node.js und npm herunterladen und installieren. npm
aws-cdk (2.x+), installiert und konfiguriert. Weitere Informationen finden Sie in der Dokumentation unter Erste Schritte mit dem. AWS CDK AWS CDK
Das GitHub aws-dynamodb-kinesisfirehose-s3-Ingestion-Repository, geklont und auf Ihrem lokalen Computer konfiguriert.
Bestehende Beispieldaten für die DynamoDB-Tabelle. Die Daten müssen das folgende Format haben: {"SourceDataId": {"S": "123"},"MessageData":{"S": "Hello World"}}

Architektur

Das folgende Diagramm zeigt einen Beispiel-Workflow für die Übermittlung von Datensätzen von DynamoDB an Amazon S3 mithilfe von Kinesis Data Streams und Firehose.

Ein Beispiel-Workflow für die Übermittlung von Datensätzen von DynamoDB an Amazon S3 mithilfe von Kinesis Data Streams und Firehose.

Das Diagramm zeigt den folgenden Workflow:

Daten werden mit Amazon API Gateway als Proxy für DynamoDB aufgenommen. Sie können auch jede andere Quelle verwenden, um Daten in DynamoDB aufzunehmen.
Änderungen auf Artikelebene werden nahezu in Echtzeit in Kinesis Data Streams generiert und an Amazon S3 übermittelt.
Kinesis Data Streams sendet die Datensätze zur Transformation und Bereitstellung an Firehose.
Eine Lambda-Funktion konvertiert die Datensätze von einem DynamoDB-Datensatzformat in das JSON-Format, das nur die Namen und Werte der Datensatzelementattribute enthält.

Tools

AWS-Services

AWS Cloud Development Kit (AWS CDK)ist ein Softwareentwicklungs-Framework, das Sie bei der Definition und Bereitstellung der AWS-Cloud-Infrastruktur im Code unterstützt.
AWS CDK Toolkit ist ein Cloud-Entwicklungskit für die Befehlszeile, mit dem Sie mit Ihrer AWS CDK App interagieren können.
AWS Command Line Interface (AWS CLI) ist ein Open-Source-Tool, mit dem Sie AWS-Services über Befehle in Ihrer Befehlszeilen-Shell interagieren können.
AWS CloudFormationhilft Ihnen dabei, AWS Ressourcen einzurichten, sie schnell und konsistent bereitzustellen und sie während ihres gesamten Lebenszyklus über und zu verwalten. AWS-Konten AWS-Regionen

Code-Repository

Der Code für dieses Muster ist im GitHub aws-dynamodb-kinesisfirehose-s3-Ingestion-Repository verfügbar.

Epen

Aufgabe Beschreibung Erforderliche Fähigkeiten

Aufgabe	Beschreibung	Erforderliche Fähigkeiten
Installieren Sie die Abhängigkeiten.	Installieren Sie auf Ihrem lokalen Computer die Abhängigkeiten aus den `package.json` Dateien in den `sample-application` Verzeichnissen `pattern/aws-dynamodb-kinesisstreams-s3` und, indem Sie die folgenden Befehle ausführen: `cd <project_root>/pattern/aws-dynamodb-kinesisstreams-s3` `npm install && npm run build` `cd <project_root>/sample-application/` `npm install && npm run build`	App-Entwickler, General AWS
Generieren Sie die CloudFormation Vorlage.	Führen Sie den Befehl `cd <project_root>/sample-application/` aus. Führen Sie den `cdk synth` Befehl aus, um die CloudFormation Vorlage zu generieren. Die `AwsDynamodbKinesisfirehoseS3IngestionStack.template.json` Ausgabe wird im `cdk.out` Verzeichnis gespeichert. Verwenden Sie AWS CDK oder AWS Management Console , um die Vorlage in zu verarbeiten CloudFormation.	App-Entwickler, General AWS, AWS DevOps

Installieren Sie die Abhängigkeiten.

Installieren Sie auf Ihrem lokalen Computer die Abhängigkeiten aus den package.json Dateien in den sample-application Verzeichnissen pattern/aws-dynamodb-kinesisstreams-s3 und, indem Sie die folgenden Befehle ausführen:


cd <project_root>/pattern/aws-dynamodb-kinesisstreams-s3


npm install && npm run build


cd <project_root>/sample-application/


npm install && npm run build

App-Entwickler, General AWS

Generieren Sie die CloudFormation Vorlage.

Führen Sie den Befehl cd <project_root>/sample-application/ aus.
Führen Sie den cdk synth Befehl aus, um die CloudFormation Vorlage zu generieren.
Die AwsDynamodbKinesisfirehoseS3IngestionStack.template.json Ausgabe wird im cdk.out Verzeichnis gespeichert.
Verwenden Sie AWS CDK oder AWS Management Console , um die Vorlage in zu verarbeiten CloudFormation.

App-Entwickler, General AWS, AWS DevOps

Aufgabe	Beschreibung	Erforderliche Fähigkeiten
Überprüfen Sie die Ressourcen und setzen Sie sie ein.	Führen Sie den `cdk diff` Befehl aus, um die Ressourcentypen zu identifizieren, die durch das AWS CDK Konstrukt erstellt wurden. Führen Sie den `cdk deploy` Befehl aus, um die Ressourcen bereitzustellen.	App-Entwickler, General AWS, AWS DevOps

Aufgabe Beschreibung Erforderliche Fähigkeiten

Aufgabe	Beschreibung	Erforderliche Fähigkeiten
Nehmen Sie Ihre Beispieldaten in die DynamoDB-Tabelle auf.	Senden Sie eine Anfrage an Ihre DynamoDB-Tabelle, indem Sie den folgenden Befehl in ausführen: AWS CLI `aws dynamodb put-item --table-name <your_table_name> --item '{"<table_partition_key>": {"S": "<partition_key_ID>"},"MessageData":{"S": "<data>"}}'` Beispiel: `aws dynamodb put-item --table-name SourceData_table --item '{"SourceDataId": {"S": "123"},"MessageData":{"S": "Hello World"}}'` Standardmäßig `put-item` gibt der keinen Wert als Ausgabe zurück, wenn der Vorgang erfolgreich ist. Wenn der Vorgang fehlschlägt, wird ein Fehler zurückgegeben. Die Daten werden in DynamoDB gespeichert und dann an Kinesis Data Streams und Firehose gesendet. Anmerkung Sie verwenden unterschiedliche Methoden, um Daten zu einer DynamoDB-Tabelle hinzuzufügen. Weitere Informationen finden Sie unter Daten in Tabellen laden in der DynamoDB-Dokumentation.	App-Developer
Stellen Sie sicher, dass ein neues Objekt im S3-Bucket erstellt wurde.	Melden Sie sich beim S3-Bucket an AWS Management Console und überwachen Sie den S3-Bucket, um sicherzustellen, dass mit den von Ihnen gesendeten Daten ein neues Objekt erstellt wurde. Weitere Informationen finden Sie GetObjectin der Amazon S3 S3-Dokumentation.	App-Entwickler, General AWS

Nehmen Sie Ihre Beispieldaten in die DynamoDB-Tabelle auf.

Senden Sie eine Anfrage an Ihre DynamoDB-Tabelle, indem Sie den folgenden Befehl in ausführen: AWS CLI

aws dynamodb put-item --table-name <your_table_name> --item '{"<table_partition_key>": {"S": "<partition_key_ID>"},"MessageData":{"S": "<data>"}}'

Beispiel:

aws dynamodb put-item --table-name SourceData_table --item '{"SourceDataId": {"S": "123"},"MessageData":{"S": "Hello World"}}'

Standardmäßig put-item gibt der keinen Wert als Ausgabe zurück, wenn der Vorgang erfolgreich ist. Wenn der Vorgang fehlschlägt, wird ein Fehler zurückgegeben. Die Daten werden in DynamoDB gespeichert und dann an Kinesis Data Streams und Firehose gesendet.

Anmerkung

Sie verwenden unterschiedliche Methoden, um Daten zu einer DynamoDB-Tabelle hinzuzufügen. Weitere Informationen finden Sie unter Daten in Tabellen laden in der DynamoDB-Dokumentation.

App-Developer

Stellen Sie sicher, dass ein neues Objekt im S3-Bucket erstellt wurde.

Melden Sie sich beim S3-Bucket an AWS Management Console und überwachen Sie den S3-Bucket, um sicherzustellen, dass mit den von Ihnen gesendeten Daten ein neues Objekt erstellt wurde.

Weitere Informationen finden Sie GetObjectin der Amazon S3 S3-Dokumentation.

App-Entwickler, General AWS

Aufgabe	Beschreibung	Erforderliche Fähigkeiten
Bereinigen von Ressourcen.	Führen Sie den `cdk destroy` Befehl aus, um alle von diesem Muster verwendeten Ressourcen zu löschen.	App-Entwickler, General AWS

Zugehörige Ressourcen

static-site-stacks3-.ts (GitHub Repository)
aws-apigateway-dynamodb Modul (GitHub Repositorium)
aws-kinesisstreams-kinesisfirehose-s3-Modul (GitHub Repositorium)
Erfassung von Änderungsdaten für DynamoDB Streams (DynamoDB-Dokumentation)
Verwenden von Kinesis Data Streams zur Erfassung von Änderungen an DynamoDB (DynamoDB-Dokumentation)

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Erstellen Sie eine kontoübergreifende Amazon-Verbindung EventBridge

Implementieren Sie die pfadbasierte API-Versionierung mithilfe von API Gateway