Paso 2: Crear una aplicación de análisis - Guía para desarrolladores de Amazon Kinesis Data Analytics para aplicaciones SQL

Para proyectos nuevos, le recomendamos que utilice el nuevo Kinesis Data Analytics Studio en lugar de Kinesis Data Analytics para aplicaciones SQL. Kinesis Data Analytics Studio combina la facilidad de uso con funciones analíticas avanzadas, lo que le permite crear sofisticadas aplicaciones de procesamiento de transmisiones en minutos.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Paso 2: Crear una aplicación de análisis

En esta sección, creará una aplicación de Amazon Kinesis Data Analytics y la configurará para usar la transmisión de datos de Kinesis que creó como fuente de transmisión enPaso 1: Preparar los datos. A continuación, ejecutará código de la aplicación que utiliza la función RANDOM_CUT_FOREST_WITH_EXPLANATION.

Para crear una aplicación

  1. Abra la consola de Kinesis en https://console.aws.amazon.com/kinesis.

  2. Elija Data Analytics (Análisis de datos) en el panel de navegación y, a continuación, elija Create application (Crear aplicación).

  3. Proporcione un nombre y una descripción (opcional) para la aplicación y elija Create application.

  4. ElegirConnect datos de streamingy, a continuación, elijaExampleInputStreamde la lista.

  5. Elija Discover esquema y asegúrese de que Systolic y Diastolic aparecen como columnas de tipo INTEGER. Si son de otro tipo, seleccione Edit schema y asigne el tipo INTEGER a cada una de ellas.

  6. En Real time analytics, elija Go to SQL editor. Cuando se le pregunte, elija la opción de ejecutar la aplicación.

  7. Pegue el código siguiente en el editor de SQL y, a continuación, elija Save and run SQL.

    --Creates a temporary stream. CREATE OR REPLACE STREAM "TEMP_STREAM" ( "Systolic" INTEGER, "Diastolic" INTEGER, "BloodPressureLevel" varchar(20), "ANOMALY_SCORE" DOUBLE, "ANOMALY_EXPLANATION" varchar(512)); --Creates another stream for application output. CREATE OR REPLACE STREAM "DESTINATION_SQL_STREAM" ( "Systolic" INTEGER, "Diastolic" INTEGER, "BloodPressureLevel" varchar(20), "ANOMALY_SCORE" DOUBLE, "ANOMALY_EXPLANATION" varchar(512)); -- Compute an anomaly score with explanation for each record in the input stream -- using RANDOM_CUT_FOREST_WITH_EXPLANATION CREATE OR REPLACE PUMP "STREAM_PUMP" AS INSERT INTO "TEMP_STREAM" SELECT STREAM "Systolic", "Diastolic", "BloodPressureLevel", ANOMALY_SCORE, ANOMALY_EXPLANATION FROM TABLE(RANDOM_CUT_FOREST_WITH_EXPLANATION( CURSOR(SELECT STREAM * FROM "SOURCE_SQL_STREAM_001"), 100, 256, 100000, 1, true)); -- Sort records by descending anomaly score, insert into output stream CREATE OR REPLACE PUMP "OUTPUT_PUMP" AS INSERT INTO "DESTINATION_SQL_STREAM" SELECT STREAM * FROM "TEMP_STREAM" ORDER BY FLOOR("TEMP_STREAM".ROWTIME TO SECOND), ANOMALY_SCORE DESC;

Paso siguiente

Paso 3: Examinar los resultados