Uso del editor de esquemas - Amazon Kinesis Data AnalyticsGuía para desarrolladores de for SQL Applications

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso del editor de esquemas

El esquema de la secuencia de entrada de una aplicación de Amazon Kinesis Data Analytics define la forma en que los datos de la secuencia están disponibles para consultas de SQL en la aplicación.


                    Diagrama que muestra la relación entre la entrada de streaming, la configuración del esquema de origen y las secuencias de entrada en la aplicación

El esquema contiene criterios de selección para determinar qué parte de la entrada de streaming se transforma en una columna de datos en la secuencia de entrada en la aplicación. Esta entrada puede ser una de las siguientes:

  • Una expresión JSONPath para secuencias de entrada de JSON. JSONPath es una herramienta para la consulta de datos de JSON.

  • Un número de columna para secuencias de entrada con formato de valores separados por comas (CSV).

  • Un nombre de columna y un tipo de datos SQL para presentar los datos en la secuencia de datos en la aplicación. El tipo de datos también contiene un máximo de caracteres o datos binarios.

La consola intenta generar el esquema utilizando DiscoverInputSchema. Si la detección de esquema produce un error o devuelve un esquema incorrecto o incompleto, debe editar el esquema manualmente mediante el editor de esquemas.

Pantalla principal del editor de esquemas

En la siguiente captura de pantalla se muestra la pantalla principal del editor de esquemas.


                        Imagen de pantalla de la página Edit schema.

Puede aplicar las siguientes modificaciones al esquema:

  • Añadir una columna (1): Es posible que necesite añadir una columna de datos si no se detecta automáticamente un elemento de datos.

  • Eliminar una columna (2): Puede excluir datos de la fuente de origen si su aplicación no lo requiere. Esta exclusión no afecta los datos de la secuencia de origen. Si se excluyen los datos, esos datos simplemente no se ponen a disposición de la aplicación.

  • Cambiar el nombre a una columna (3). El nombre de una columna no puede quedar vacío, debe tener más de un carácter y no debe contener palabras claves reservadas de SQL. El nombre también debe cumplir los criterios de nombres de identificadores comunes de SQL: El nombre debe comenzar con una letra y contener solo letras, caracteres de guión bajo y dígitos.

  • Cambie el tipo de datos (4) o la longitud (5) de una columna: Puede especificar un tipo de datos compatible para una columna. Si especifica un tipo de datos incompatible, la columna se rellena con valores NULL o no se rellena de ningún modo la secuencia en la aplicación. En este último caso, los errores están escritos en la secuencia de errores. Si especifica una longitud para una columna que es demasiado pequeña, los datos entrantes están truncados.

  • Cambiar los criterios de selección de una columna (6): Puede editar la expresión de jsonpath o el orden de columna CSV utilizado para determinar el origen de los datos en una columna. Para cambiar los criterios de selección para un esquema JSON, introduzca un nuevo valor para la expresión de la ruta de la fila. Un esquema CSV utiliza el orden de la columna como criterios de selección. Para cambiar los criterios de selección para un esquema CSV, cambie el orden de las columnas.

Edición del esquema para un origen de streaming

Si necesita editar un esquema para un origen de streaming, siga estos pasos.

Editar el esquema para un origen de streaming

  1. En la página Source, elija Edit schema.

    
                                Imagen de pantalla de la pestaña Formatted stream sample que contiene datos bursátiles, con el botón Edit schema resaltado.
  2. En la página Edit schema, edite el esquema de la fuente.

    
                                Imagen de pantalla de la página Edit schema.
  3. En Format, seleccione JSON o CSV. Para el formato JSON o CSV, se admite la codificación ISO 8859-1.

Para obtener más información sobre la edición del esquema para el formato JSON o CSV, consulte los procedimientos en las próximas secciones.

Edición de esquemas JSON

Puede editar un esquema JSON siguiendo los siguientes pasos.

Para editar un esquema JSON

  1. En el editor de esquemas, elija Add column para añadir una columna.

    Una nueva columna aparece en la posición de la primera columna. Para cambiar el orden de una columna, elija las flechas hacia arriba y abajo que se encuentran junto al nombre de la columna.

    Para obtener una nueva columna, proporcione la siguiente información:

    • En Column name, escriba un nombre.

      El nombre de una columna no puede quedar vacío, debe tener más de un carácter y no debe contener palabras claves reservadas de SQL. También debe cumplir los criterios de nombres de identificadores comunes de SQL: Debe comenzar con una letra y contener solo letras, caracteres subrayados y dígitos.

    • En Column type, escriba un tipo de datos SQL.

      Un tipo de columna puede ser cualquier tipo de datos SQL compatible. Si el nuevo tipo de datos es CHAR, VARBINARY o VARCHAR, especifique una longitud en Length. Para obtener más información, consulte Data Types.

    • En Row path, proporcione una ruta de la fila. Una ruta de fila es una expresión JSONPath válida que se mapea a un elemento JSON.

      nota

      El valor base de Row path es la ruta del origen de nivel superior que contiene los datos que se deben importar. Este valor es $ de forma predeterminada. Para obtener más información, consulte RecordRowPath en JSONMappingParameters.

  2. Para eliminar una columna, elija el icono x situado junto al número de la columna.

    
                                    Imagen de pantalla del editor de esquemas que muestra el icono x junto al número de columna.​
  3. Para cambiar el nombre de una columna, introduzca un nuevo nombre en Column name (Nombre de columna). El nuevo nombre de una columna no puede quedar vacío, debe tener más de un carácter y no debe contener palabras claves reservadas de SQL. También debe cumplir los criterios de nombres de identificadores comunes de SQL: Debe comenzar con una letra y contener solo letras, caracteres subrayados y dígitos.

  4. Para cambiar el tipo de datos de una columna, elija un tipo de datos nuevo en Column type. Si el nuevo tipo de datos es CHAR, VARBINARY o VARCHAR, especifique una longitud en Length (Longitud). Para obtener más información, consulte Data Types.

  5. Elija Save schema and update stream para guardar los cambios.

El esquema modificado aparece en el editor y será similar al siguiente.


                            Imagen de pantalla del editor de esquemas que muestra el esquema modificado.

Si su esquema tiene varias filas, puede filtrarlas usando Filter by column name. Por ejemplo, para editar los nombres de una columna que empieza con P, como la columna Price, introduzca P en la casilla Filter by column name (Filtrar por nombre de columna).

Edición de esquemas CSV

Para editar un esquema CSV siga los pasos que se indican a continuación.

Para editar un esquema CSV

  1. En el editor de esquemas, en Row delimiter, elija el delimitador utilizado por la secuencia de datos entrantes. Este es el delimitador entre los registros de datos en su secuencia, como, por ejemplo, un carácter de nueva línea.

  2. En Column delimiter, elija el delimitador utilizado por la secuencia de datos entrantes. Este es el delimitador entre los campos de datos en su secuencia, como, por ejemplo, una coma.

  3. Para añadir una columna, elija Add column.

    Una nueva columna aparece en la posición de la primera columna. Para cambiar el orden de una columna, elija las flechas hacia arriba y abajo que se encuentran junto al nombre de la columna.

    Para obtener una nueva columna, proporcione la siguiente información:

    • En Column name (Nombre de columna), introduzca un nombre.

      El nombre de una columna no puede quedar vacío, debe tener más de un carácter y no debe contener palabras claves reservadas de SQL. También debe cumplir los criterios de nombres de identificadores comunes de SQL: Debe comenzar con una letra y contener solo letras, caracteres subrayados y dígitos.

    • En Column type (Tipo de columna), introduzca un tipo de datos SQL.

      Un tipo de columna puede ser cualquier tipo de datos SQL compatible. Si el nuevo tipo de datos es CHAR, VARBINARY o VARCHAR, especifique una longitud en Length. Para obtener más información, consulte Data Types.

  4. Para eliminar una columna, elija el icono x situado junto al número de la columna.

    
                                    Imagen de pantalla del editor de esquemas que muestra el icono x junto al número de columna.​
  5. Para cambiar el nombre de una columna, introduzca un nuevo nombre en Column name (Nombre de columna). El nuevo nombre de una columna no puede quedar vacío, debe tener más de un carácter y no debe contener palabras claves reservadas de SQL. También debe cumplir los criterios de nombres de identificadores comunes de SQL: Debe comenzar con una letra y contener solo letras, caracteres subrayados y dígitos.

  6. Para cambiar el tipo de datos de una columna, elija un tipo de datos nuevo en Column type. Si el nuevo tipo de datos es CHAR, VARBINARY o VARCHAR, especifique una longitud en Length. Para obtener más información, consulte Data Types.

  7. Elija Save schema and update stream para guardar los cambios.

El esquema modificado aparece en el editor y será similar al siguiente.


                            Imagen de pantalla del editor de esquemas que muestra el esquema modificado.

Si su esquema tiene varias filas, puede filtrarlas usando Filter by column name. Por ejemplo, para editar los nombres de una columna que empieza con P, como la columna Price, introduzca P en la casilla Filter by column name (Filtrar por nombre de columna).