Introducción a Amazon Managed Service para Apache Flink para Python - Managed Service para Apache Flink

Amazon Managed Service para Apache Flink Amazon se denominaba anteriormente Amazon Kinesis Data Analytics para Apache Flink.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Introducción a Amazon Managed Service para Apache Flink para Python

Esta sección presenta una introducción a los conceptos fundamentales de un Managed Service para Apache Flink utilizando Python y la API de tabla. Describe las opciones disponibles para crear y probar sus aplicaciones. También proporciona instrucciones para instalar las herramientas necesarias para completar los tutoriales de esta guía y crear su primera aplicación.

Introducción a Pyflink: el intérprete de Python para Apache | Amazon Web Services

Antes de comenzar, le recomendamos que vea el siguiente vídeo:

Componentes de una aplicación de servicio gestionado para Apache Flink

Para procesar los datos, su aplicación de Managed Service para Apache Flink utiliza una aplicación Python que procesa las entradas y produce las salidas mediante el tiempo de ejecución de Apache Flink.

La aplicación de Managed Service para Apache Flink tiene los siguientes componentes:

  • Propiedades de tiempo de ejecución: puede usar las propiedades de tiempo de ejecución para configurar su aplicación sin tener que volver a compilar el código de la aplicación.

  • Fuente de tabla: la aplicación consume datos mediante una fuente. Un conector de origen lee los datos de un flujo de datos de Kinesis, un tema de Amazon MSK o similar. Para obtener más información, consulte Tabla: fuentes de API.

  • Funciones: la aplicación procesa los datos mediante una o más funciones. Una función puede transformar, enriquecer o agregar datos.

  • Receptor: la aplicación produce datos para fuentes externas mediante el uso de receptores. Un conector receptor escribe datos en una transmisión de datos de Kinesis, una transmisión de Firehose Firehose, un tema de Amazon MSK, un bucket de Amazon S3, etc. Para obtener más información, consulte Tabla: sumideros de API.

Después de crear y empaquetar el código de la aplicación, debe cargar el paquete del código a un bucket de Amazon S3. Luego debe crear la aplicación de Managed Service para Apache Flink. Introduce la ubicación del paquete del código, el origen de datos de streaming y, normalmente, una ubicación de streaming o archivo que recibe los datos procesados de la aplicación.

Requisitos previos

Antes de iniciar este tutorial, complete los dos primeros pasos de Introducción a Amazon Managed Service para Apache Flink (DataStreamAPI):

Para empezar, consulte Creación de una aplicación.