Erstellen eines Studio-Notebooks - Managed Service für Apache Flink

Amazon Managed Service für Apache Flink war zuvor als Amazon Kinesis Data Analytics für Apache Flink bekannt.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines Studio-Notebooks

Ein Studio-Notebook enthält in SQL, Python oder Scala geschriebene Abfragen oder Programme, die auf Streaming-Daten ausgeführt werden und Analyseergebnisse zurückgeben. Sie erstellen Ihre Anwendung entweder mit der Konsole oder der CLI und stellen Abfragen zur Analyse der Daten aus Ihrer Datenquelle bereit.

Die Anwendung besteht aus folgenden Komponenten:

  • Einer Datenquelle, z. B. einem Amazon-MSK-Cluster, einem Kinesis-Datenstrom oder einem Amazon-S3-Bucket.

  • Eine Datenbank. AWS Glue Diese Datenbank enthält Tabellen, in denen Ihre Datenquellen- und Zielschemas und Endpunkte gespeichert sind. Weitere Informationen finden Sie unter Arbeitet mit AWS Glue.

  • Ihr Anwendungscode. Ihr Code implementiert Ihre Analyseabfrage oder Ihr Analyseprogramm.

  • Ihre Anwendungseinstellungen und Laufzeiteigenschaften. Informationen zu Anwendungseinstellungen und Laufzeiteigenschaften finden Sie unter den folgenden Themen im Entwicklerhandbuch für Apache-Flink-Anwendungen:

    • Anwendungsparallelität und -skalierung: Sie verwenden die Parallelitätseinstellung Ihrer Anwendung, um die Anzahl der Abfragen zu steuern, die Ihre Anwendung gleichzeitig ausführen kann. Ihre Abfragen können auch von der erhöhten Parallelität profitieren, wenn sie mehrere Ausführungspfade haben, z. B. unter den folgenden Umständen:

      • Bei der Verarbeitung mehrerer Shards eines Kinesis-Datenstroms

      • Bei der Partitionierung von Daten mit dem KeyBy-Operator.

      • Bei Verwendung mehrerer Fensteroperatoren

      Weitere Informationen zur Anwendungsskalierung finden Sie unter Anwendungsskalierung in Managed Service für Apache Flink.

    • Protokollierung und Überwachung: Informationen zur Anwendungsprotokollierung und -überwachung finden Sie unter Protokollierung und Überwachung in Amazon Managed Service für Apache Flink.

    • Ihre Anwendung verwendet Checkpoints und Savepoints aus Gründen der Fehlertoleranz. Checkpoints und Savepoints sind für Studio-Notebooks standardmäßig nicht aktiviert.

Sie können Ihr Studio-Notizbuch entweder mit dem AWS Management Console oder dem erstellen AWS CLI.

Beim Erstellen der Anwendung über die Konsole stehen Ihnen die folgenden Optionen zur Verfügung:

  • Wählen Sie in der Amazon-MSK-Konsole Ihren Cluster aus und wählen Sie dann Daten in Echtzeit verarbeiten.

  • Wählen Sie in der Konsole von Kinesis Data Streams Ihren Datenstrom und dann auf der Registerkarte Anwendungen die Option Daten in Echtzeit verarbeiten aus.

  • Wählen Sie in der Konsole von Managed Service für Apache Flink die Registerkarte Studio und dann Studio-Notebook erstellen aus.

Ein Tutorial finden Sie unter Ereigniserkennung mit Managed Service für Apache Flink.

Ein Beispiel für eine erweiterte Studio-Notebook-Lösung finden Sie unter Apache Flink in Amazon Managed Service für Apache Flink Studio.