Le service géré Amazon pour Apache Flink était auparavant connu sous le nom d’Amazon Kinesis Data Analytics pour Apache Flink.
Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'un bloc-notes Studio
Un bloc-notes Studio contient des requêtes ou des programmes écrits en SQL Python ou Scala qui s'exécutent sur des données de streaming et renvoient des résultats analytiques. Vous créez votre application à l'aide de la console ou duCLI, et vous fournissez des requêtes pour analyser les données de votre source de données.
Votre application comporte les composants suivants :
Une source de données, telle qu'un MSK cluster Amazon, un flux de données Kinesis ou un compartiment Amazon S3.
Une AWS Glue base de données. Cette base de données contient des tables qui stockent vos schémas et points de terminaison de source de données et de destination. Pour plus d’informations, consultez Travaillez avec AWS Glue.
Votre code d’application. Votre code implémente votre requête ou votre programme d’analyse.
Les paramètres et les propriétés d’exécution de votre application. Pour obtenir des informations sur les paramètres et les propriétés d’exécution de votre application, consultez les rubriques suivantes dans le Guide du développeur pour les applications Apache Flink :
Parallélisme et mise à l’échelle de l’application : vous utilisez le paramètre de parallélisme de votre application pour contrôler le nombre de requêtes que votre application peut exécuter simultanément. Vos requêtes peuvent également tirer parti d’un parallélisme accru si elles comportent plusieurs chemins d’exécution, par exemple dans les circonstances suivantes :
Lors du traitement de plusieurs partitions d’un flux de données Kinesis
Lorsque vous partitionnez des données à l’aide de l’opérateur
KeyBy
.Lors de l’utilisation de plusieurs opérateurs de fenêtre
Pour plus d’informations sur la mise à l’échelle des applications, consultez Mise à l’échelle des applications dans le service géré pour Apache Flink.
Journalisation et surveillance : pour obtenir des informations sur la journalisation et la surveillance des applications, consultez la section Journalisation et surveillance dans le service géré Amazon pour Apache Flink.
-
Votre application utilise des points de contrôle et des points de sauvegarde pour la tolérance aux pannes. Les points de contrôle et de sauvegarde ne sont pas activés par défaut pour les blocs-notes Studio.
Vous pouvez créer votre bloc-notes Studio à l'aide du AWS Management Console ou du AWS CLI.
Lorsque vous créez l’application à partir de la console, vous disposez des options suivantes :
Dans la MSK console Amazon, choisissez votre cluster, puis choisissez Traiter les données en temps réel.
Dans la console Kinesis Data Streams, choisissez votre flux de données, puis dans l’onglet Applications, choisissez Traiter les données en temps réel.
Dans la console du service géré pour Apache Flink, choisissez l’onglet Studio, puis sélectionnez Créer un bloc-notes Studio.
Pour un didacticiel, consultez Détection d’événements avec le service géré pour Apache Flink
Pour un exemple de solution de bloc-notes Studio plus avancée, consultez Studio sur le service géré Amazon pour Apache Flink