Tutorial: Analice datos bursátiles en tiempo real con Amazon Managed Service para Apache Flink - Amazon Kinesis Data Streams

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tutorial: Analice datos bursátiles en tiempo real con Amazon Managed Service para Apache Flink

El escenario que planteamos en este tutorial comprende la adquisición de operaciones bursátiles en un flujo de datos y la escritura de una aplicación de Amazon Managed Service para Apache Flink sencilla que realiza cálculos con dicho flujo. Aprenderá a enviar un flujo de registros a Kinesis Data Streams y a implementar una aplicación que consuma y procese los registros prácticamente en tiempo real.

Con Amazon Managed Service para Apache Flink, puede usar Java o Scala para procesar y analizar los datos de streaming. El servicio le permite crear y ejecutar código Java o Scala en fuentes de streaming para realizar análisis de series temporales, alimentar cuadros de mando en tiempo real y crear métricas en tiempo real.

Puede crear aplicaciones Flink en Managed Service para Apache Flink mediante bibliotecas de código abierto basadas en Apache Flink. Apache Flink es un marco y un motor usados habitualmente para procesar flujos de datos.

importante

Después de crear dos transmisiones de datos y una aplicación, su cuenta incurre en cargos nominales por el uso de Kinesis Data Streams y Managed Service for Apache Flink, ya que no son aptas para el AWS Nivel gratuito. Cuando haya terminado con esta aplicación, elimine su AWS recursos para dejar de incurrir en cargos.

El código no obtiene acceso a datos bursátiles reales, sino que, en su lugar, simula la secuencia de operaciones bursátiles. Lo hace a través de un generador de operaciones bursátiles aleatorias. Si tiene acceso a una secuencia de operaciones bursátiles en tiempo real, puede que le interese derivar estadísticas útiles y puntuales a partir de dicha secuencia. Por ejemplo, es posible que desee realizar un análisis de ventana deslizante en el que se determina el valor más popular adquirido durante los últimos 5 minutos. O también cabe la posibilidad de que quiera recibir una notificación cada vez que haya una orden de venta que sea demasiado grande (es decir, con demasiadas acciones). Puede ampliar el código de esta serie para proporcionar esta funcionalidad.

Los ejemplos que se muestran utilizan la región del oeste de EE. UU. (Oregón), pero funcionan en cualquiera de las AWS Regiones que admiten el servicio gestionado de Apache Flink.

Requisitos previos para completar los ejercicios

Para completar los pasos de esta guía, debe disponer de lo siguiente:

  • Kit de desarrollo de Java (JDK) versión 8. Configure la variable de JAVA_HOME entorno para que apunte a la ubicación de JDK instalación.

  • Le recomendamos utilizar un entorno de desarrollo (como Eclipse Java Neon o IntelliJ Idea) para desarrollar y compilar su aplicación.

  • Cliente Git. Si aún no lo ha hecho, instale el cliente Git.

  • Apache Maven Compiler Plugin. Maven debe estar en su ruta de trabajo. Para probar la instalación de Apache Maven, introduzca lo siguiente:

    $ mvn -version

Para empezar, vaya a Configure un AWS cuenta y crea un usuario administrador.