Qu'est-ce qu'Amazon Managed Service pour Apache Flink ?

Mode de mise au point

Qu'est-ce qu'Amazon Managed Service pour Apache Flink ? - Service géré pour Apache Flink

Choisissez entre utiliser le service géré pour Apache Flink ou le service géré pour Apache Flink Studio Choisissez l'Apache Flink APIs à utiliser dans le service géré pour Apache Flink Commencez avec les applications de streaming de données

Le service géré Amazon pour Apache Flink était auparavant connu sous le nom d’Amazon Kinesis Data Analytics pour Apache Flink.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Le service géré Amazon pour Apache Flink était auparavant connu sous le nom d’Amazon Kinesis Data Analytics pour Apache Flink.

Avec Amazon Managed Service pour Apache Flink, vous pouvez utiliser Java, Scala, Python ou SQL pour traiter et analyser les données de streaming. Le service vous permet de créer et d'exécuter du code à partir de sources de streaming et de sources statiques pour effectuer des analyses de séries chronologiques, alimenter des tableaux de bord en temps réel et des métriques.

Vous pouvez créer des applications avec le langage de votre choix dans Managed Service for Apache Flink à l'aide de bibliothèques open source basées sur Apache Flink. Apache Flink est un framework et un moteur populaires permettant de traiter des flux de données.

Le service géré pour Apache Flink fournit l’infrastructure sous-jacente pour vos applications Apache Flink. Il gère les fonctionnalités de base telles que le provisionnement des ressources informatiques, la résilience au basculement en mode AZ, le calcul parallèle, le dimensionnement automatique et les sauvegardes d'applications (mises en œuvre sous forme de points de contrôle et de snapshots). Vous pouvez utiliser les fonctionnalités de programmation de haut niveau de Flink (telles que les opérateurs, les fonctions, les sources et les récepteurs) de la même manière que lorsque vous hébergez vous-même l’infrastructure Flink.

Choisissez entre utiliser le service géré pour Apache Flink ou le service géré pour Apache Flink Studio

Vous avez deux options pour exécuter vos tâches Flink avec Amazon Managed Service pour Apache Flink. Avec Managed Service for Apache Flink, vous créez des applications Flink en Java, Scala ou Python (et en SQL intégré) à l'aide de l'IDE de votre choix et du flux de données ou de la table Apache Flink. APIs Avec le service géré pour Apache Flink Studio, vous pouvez interroger des flux de données de manière interactive en temps réel et créer et exécuter facilement des applications de traitement de flux à l'aide de SQL, Python et Scala standard.

Vous pouvez sélectionner la méthode qui convient le mieux à votre cas d'utilisation. En cas de doute, cette section propose des conseils de haut niveau pour vous aider.

Decision tree for selecting Flink application, Deployed Studio application, or Studio Notebook based on use case and programming experience.

Avant de décider d'utiliser Amazon Managed Service pour Apache Flink ou Amazon Managed Service pour Apache Flink Studio, vous devez prendre en compte votre cas d'utilisation.

Si vous envisagez d'exploiter une application de longue durée qui prendra en charge des charges de travail telles que le streaming ETL ou les applications continues, vous devriez envisager d'utiliser le service géré pour Apache Flink. En effet, vous pouvez créer votre application Flink en utilisant le Flink APIs directement dans l'IDE de votre choix. Le développement local avec votre IDE vous permet également de tirer parti des processus et outils courants du cycle de vie du développement logiciel (SDLC) tels que le versionnement du code dans Git, l'automatisation CI/CD ou les tests unitaires.

Si vous êtes intéressé par l'exploration de données ad hoc, si vous souhaitez interroger des données de streaming de manière interactive ou créer des tableaux de bord privés en temps réel, le service géré pour Apache Flink Studio vous aidera à atteindre ces objectifs en quelques clics. Les utilisateurs familiarisés avec SQL peuvent envisager de déployer une application de longue durée directement depuis Studio.

Note

Vous pouvez transformer votre bloc-notes Studio en une application de longue durée. Toutefois, si vous souhaitez intégrer vos outils SDLC tels que la gestion des versions de code sur Git et l'automatisation CI/CD, ou des techniques telles que les tests unitaires, nous recommandons Managed Service pour Apache Flink en utilisant l'IDE de votre choix.

Choisissez l'Apache Flink APIs à utiliser dans le service géré pour Apache Flink

Vous pouvez créer des applications à l'aide de Java, Python et Scala dans Managed Service pour Apache Flink à l'aide d'Apache Flink APIs dans l'IDE de votre choix. Vous trouverez des conseils sur la façon de créer des applications à l'aide de Flink Datastream et de l'API Table dans la documentation. Vous pouvez sélectionner la langue dans laquelle vous créez votre application Flink et celle APIs que vous utilisez pour répondre au mieux aux besoins de votre application et de vos opérations. En cas de doute, cette section fournit des conseils de haut niveau pour vous aider.

Choisissez une API Flink

Les Apache Flink APIs ont différents niveaux d'abstraction qui peuvent affecter la façon dont vous décidez de créer votre application. Ils sont expressifs et flexibles et peuvent être utilisés ensemble pour créer votre application. Vous n'êtes pas obligé d'utiliser une seule API Flink. Pour en savoir plus sur le Flink, consultez la APIs documentation d'Apache Flink.

Flink propose quatre niveaux d'abstraction d'API : Flink SQL, Table API, DataStream API et Process Function, qui sont utilisés conjointement avec l' DataStream API. Ils sont tous pris en charge dans Amazon Managed Service pour Apache Flink. Il est conseillé de commencer par un niveau d'abstraction plus élevé lorsque cela est possible, mais certaines fonctionnalités de Flink ne sont disponibles qu'avec l'API Datastream, où vous pouvez créer votre application en Java, Python ou Scala. Vous devriez envisager d'utiliser l'API Datastream si :

Vous avez besoin d'un contrôle précis de l'État
Vous souhaitez tirer parti de la possibilité d'appeler une base de données externe ou un point de terminaison de manière asynchrone (par exemple pour l'inférence)
Vous souhaitez utiliser des minuteries personnalisées (par exemple pour implémenter un fenêtrage personnalisé ou une gestion des événements tardifs)
Vous souhaitez pouvoir modifier le flux de votre application sans réinitialiser l'état

Apache Flink APIs diagram showing abstraction levels and programming languages for different APIs.

Note

Choix d'une langue avec l'DataStreamAPI :

Le SQL peut être intégré dans n'importe quelle application Flink, quel que soit le langage de programmation choisi.
Si vous envisagez d'utiliser l' DataStream API, tous les connecteurs ne sont pas pris en charge en Python.
Si vous avez besoin d'une faible valeur, latency/high-throughput you should consider Java/Scala quelle que soit l'API.
Si vous envisagez d'utiliser Async IO dans l'API Process Functions, vous devez utiliser Java.

Le choix de l'API peut également avoir un impact sur votre capacité à faire évoluer la logique de l'application sans avoir à réinitialiser l'état. Cela dépend d'une fonctionnalité spécifique, la possibilité de définir un UID sur les opérateurs, qui n'est disponible que dans l'DataStreamAPI pour Java et Python. Pour plus d'informations, consultez la section Définir UUIDs pour tous les opérateurs dans la documentation d'Apache Flink.

Commencez avec les applications de streaming de données

Vous pouvez commencer par créer une application de service géré pour Apache Flink qui lit et traite en continu les données en streaming. Créez ensuite votre code à l’aide de l’IDE de votre choix et testez-le avec des données de diffusion en direct. Vous pouvez également configurer des destinations où vous voulez que le service géré pour Apache Flink envoie les résultats.

Nous vous recommandons de commencer par lire les sections suivantes :

Vous pouvez également commencer par créer un service géré pour le bloc-notes Apache Flink Studio qui vous permet d'interroger des flux de données de manière interactive en temps réel, et de créer et d'exécuter facilement des applications de traitement de flux à l'aide de SQL, Python et Scala standard. En quelques clics AWS Management Console, vous pouvez lancer un bloc-notes sans serveur pour interroger des flux de données et obtenir des résultats en quelques secondes. Nous vous recommandons de commencer par lire les sections suivantes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Comment ça marche

Rubrique suivante :

Comment ça marche

Avez-vous besoin d’aide ?

Sur cette page

Cette page vous a-t-elle été utile ?

Faire un commentaire

Confidentialité Conditions d'utilisation du site Préférences de cookies

Sélectionner vos préférences de cookies

Personnaliser les préférences de cookies

Essentiels

Performances

Fonctionnels

Publicitaires

Impossible d'enregistrer les préférences concernant les cookies

Qu'est-ce qu'Amazon Managed Service pour Apache Flink ?

Choisissez entre utiliser le service géré pour Apache Flink ou le service géré pour Apache Flink Studio

Note

Choisissez l'Apache Flink APIs à utiliser dans le service géré pour Apache Flink

Choisissez une API Flink

Note

Commencez avec les applications de streaming de données

Rubrique suivante :

Avez-vous besoin d’aide ?

Sur cette page

Cette page vous a-t-elle été utile ?

Decision tree for selecting Flink application, Deployed Studio application, or Studio Notebook based on use case and programming experience.

Apache Flink APIs diagram showing abstraction levels and programming languages for different APIs.