Creación de un cuaderno de Studio - Managed Service para Apache Flink

Amazon Managed Service para Apache Flink Amazon se denominaba anteriormente Amazon Kinesis Data Analytics para Apache Flink.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de un cuaderno de Studio

Un cuaderno de Studio contiene consultas o programas escritos en SQL, Python o Scala que se ejecutan en datos de streaming y devuelven resultados analíticos. La aplicación se crea mediante la consola o la CLI y se proporcionan consultas para analizar los datos del origen de datos.

Su aplicación tiene los siguientes componentes:

  • Un origen de datos, como un clúster de Amazon MSK, un flujo de datos de Kinesis o un bucket de Amazon S3.

  • Una AWS Glue base de datos. Esta base de datos contiene tablas en las que se almacenan el origen de datos, los esquemas de destino y los puntos de conexión. Para obtener más información, consulte Trabajando con AWS Glue.

  • Verifique el código de la aplicación. El código implementa la consulta o el programa de análisis.

  • La configuración de la aplicación y las propiedades del tiempo de ejecución. Para obtener información acerca de la configuración de la aplicación y las propiedades del tiempo de ejecución, consulte los siguientes temas en la Guía para desarrolladores de aplicaciones Apache Flink:

    • Paralelismo y escalado de la aplicación: utilice la configuración de paralelismo de la aplicación para controlar el número de consultas que la aplicación puede ejecutar simultáneamente. Las consultas también pueden aprovechar el aumento del paralelismo si tienen varias rutas de ejecución, por ejemplo, en las siguientes circunstancias:

      • Al procesar varios fragmentos de un flujo de datos de Kinesis

      • Al particionar los datos mediante el operador KeyBy.

      • Cuando se utilizan operadores de ventanas múltiples

      Para obtener más información acerca del escalado de aplicaciones, consulte Application Scaling in Managed Service for Apache Flink for Apache Flink.

    • Registro y monitorización: para obtener información sobre el registro y la monitorización de aplicaciones, consulte Logging and Monitoring in Amazon Managed Service for Apache Flink for Apache Flink.

    • La aplicación utiliza puntos de control y puntos de almacenamiento para garantizar la tolerancia a los errores. Los puntos de control y los puntos de almacenamiento no están habilitados de forma predeterminada en los cuadernos de Studio.

Puede crear su bloc de notas de Studio utilizando el AWS Management Console o el AWS CLI.

Al crear la aplicación desde la consola, tiene las siguientes opciones:

  • En la consola de Amazon MSK, elija su clúster y, a continuación, elija Procesar datos en tiempo real.

  • En la consola de Kinesis Data Streams, elija su flujo de datos y, en la pestaña Aplicaciones, elija Procesar datos en tiempo real.

  • En la consola de Managed Service para Apache Flink, seleccione la pestaña Studio y, a continuación, seleccione Crear cuaderno de Studio.

Para ver un tutorial, consulte Detección de eventos con servicio administrado para Apache Flink.

Para ver un ejemplo de una solución de cuaderno de Studio más avanzada, consulta Apache Flink en Amazon Managed Service para Apache Flink Studio.