Creación de una fuente de datos con datos de Amazon Redshift (consola) - Amazon Machine Learning

Ya no actualizamos el servicio Amazon Machine Learning ni aceptamos nuevos usuarios para él. Esta documentación está disponible para los usuarios actuales, pero ya no la actualizamos. Para obtener más información, consulte Qué es Amazon Machine Learning.

Creación de una fuente de datos con datos de Amazon Redshift (consola)

La consola de Amazon ML ofrece dos formas para crear un origen de datos utilizando datos de Amazon Redshift. Puede crear una fuente de datos completando el asistente para la creación de una fuente de datos o, si ya dispone de una fuente de datos creada a partir de datos de Amazon Redshift, puede copiar la fuente de datos original y modificar su configuración. Copiar una fuente de datos le permite crear múltiples fuentes de datos similares fácilmente.

Para obtener más información sobre la creación de un origen de datos mediante la API;, consulte CreateDataSourceFromRedshift.

Para obtener más información sobre los parámetros de los siguientes procedimientos, consulte Parámetros necesarios para el asistente Create Datasource.

Creación de una fuente de datos (consola)

Para descargar datos de Amazon Redshift en un origen de datos de Amazon ML, utilice el asistente para la creación de un origen de datos.

Para crear una fuente de datos a partir de datos de Amazon Redshift
  1. Abra la consola de Amazon Machine Learning en https://console.aws.amazon.com/machinelearning/.

  2. En el panel de Amazon ML, en Entidades, seleccione Crear nuevo... y, a continuación, seleccione Origen de datos.

  3. En la página Datos de entrada, elija Amazon Redshift.

  4. En el asistente de creación de orígenes de datos, en Cluster identifier (Identificador de clúster), escriba el nombre del clúster.

  5. En Nombre de la base de datos, escriba el nombre de la base de datos de Amazon Redshift.

  6. En Database user name (Nombre de usuario de base de datos), escriba el nombre de usuario de la base de datos.

  7. En Database password, escriba la contraseña de la base de datos.

  8. En IAM role, seleccione el rol de IAM. Si aún no tiene uno, seleccione Crear nuevo rol. Amazon ML crea un rol de IAM de Amazon Redshift para usted.

  9. Para probar la configuración de Amazon Redshift, elija Probar acceso (junto a Rol de IAM). Si Amazon ML no puede conectarse a Amazon Redshift con la configuración proporcionada, no puede continuar la creación de un origen de datos. Para obtener ayuda sobre la resolución de problemas, consulte Solución de errores.

  10. En SQL query, escriba la consulta SQL.

  11. En Ubicación del esquema, seleccione si desea que Amazon ML cree un esquema automáticamente. Si ya ha creado un esquema, escriba la ruta de Amazon S3 del archivo del esquema.

  12. En Ubicación de almacenamiento provisional de Amazon S3, escriba la ruta de Amazon S3 del bucket donde desea que Amazon ML almacene los datos que descarga de Amazon Redshift.

  13. (Opcional) En Datasource name, escriba un nombre para el origen de datos.

  14. Elija Verify (Verificar). Amazon ML verifica que pueda conectarse a la base de datos de Amazon Redshift.

  15. En la página Schema (Esquema), revise los tipos de datos de todos los atributos y corríjalos, según sea necesario.

  16. Elija Continue (Continuar).

  17. Si desea usar este origen de datos para crear o evaluar un modelo de ML, en Do you plan to use this dataset to create or evaluate an ML model? (¿Va a usar este conjunto de datos para crear o evaluar un modelo de ML?), elija Yes (Sí). Si elige Yes, seleccione la línea de destino. Para obtener más información sobre destinos, consulte Funcionamiento del campo targetAttributeName.

    Si desea utilizar este origen de datos junto con un modelo que ya ha creado para generar predicciones, seleccione No.

  18. Elija Continue (Continuar).

  19. En Does your data contain an identifier? (¿Sus datos contienen un identificador?), si sus datos no contienen un identificador de fila, elija No.

    Si los datos contienen un identificador de línea, seleccione Yes. Para obtener información sobre identificadores de línea, consulte Funcionamiento del campo rowID.

  20. Elija Review.

  21. En la página Review, revise los ajustes y, a continuación, seleccione Finish.

Una vez que haya creado una fuente de datos, puede usarla para create an ML model. Si ya ha creado un modelo, puede usar la fuente de datos para evaluate an ML model o generate predictions.

Copiar una fuente de datos (consola)

Cuando desee crear una fuente de datos que sea similar a una fuente de datos existente, puede utilizar la consola de Amazon ML para copiar la fuente de datos original y modificar su configuración. Por ejemplo, puede optar por comenzar con un origen de datos existente y, a continuación, modificar el esquema de datos para que coincida más con los datos; cambie la consulta SQL utilizada para descargar datos de Amazon Redshift o especifique otro usuario de AWS Identity and Access Management (IAM) para acceder al clúster de Amazon Redshift.

Para copiar y modificar una fuente de datos de Amazon Redshift
  1. Abra la consola de Amazon Machine Learning en https://console.aws.amazon.com/machinelearning/.

  2. En el panel de Amazon ML, en Entidades, seleccione Crear nuevo... y, a continuación, seleccione Origen de datos.

  3. En la página Datos de entrada, en ¿Dónde están los datos?, elija Amazon Redshift. Si ya tiene una fuente de datos creada a partir de datos de Amazon Redshift, tiene la opción de copiar la configuración de otra fuente de datos.

    Amazon S3 and Amazon Redshift icons with option to copy settings from existing datasource.

    Si aún no tiene ninguna fuente de datos creada a partir de datos de Amazon Redshift, esta opción no aparecerá.

  4. Seleccione Find a datasource (Buscar un origen de datos).

  5. Seleccione la fuente de datos que desee copiar y seleccione Copiar configuración. Amazon ML rellena la mayor parte de la configuración de la fuente de datos automáticamente con la configuración de la fuente de datos original. No copia la contraseña de la base de datos, la ubicación del esquema o el nombre de la fuente de datos de la fuente de datos original.

  6. Modifique la configuración rellenada automáticamente que desee cambiar. Por ejemplo, si desea cambiar los datos que descarga Amazon ML de Amazon Redshift, cambie la consulta SQL.

  7. En Database password, escriba la contraseña de la base de datos. Amazon ML no almacena ni reutiliza la contraseña, por lo que debe proporcionarla siempre.

  8. (Opcional) En Ubicación del esquema, Amazon ML selecciona Deseo que Amazon ML genere un esquema recomendado de forma previa y automática. Si ya ha creado un esquema, seleccione Deseo usar el esquema que he creado y almacenado en Amazon S3 y escriba la ruta del archivo del esquema de Amazon S3.

  9. (Opcional) En Datasource name, escriba un nombre para el origen de datos. De lo contrario, Amazon ML genera un nuevo nombre de la fuente de datos.

  10. Elija Verify (Verificar). Amazon ML verifica que pueda conectarse a la base de datos de Amazon Redshift.

  11. (Opcional) Si Amazon ML infiere el esquema por usted, en la página Esquema, revise los tipos de datos de todos los atributos y corríjalos, según sea necesario.

  12. Elija Continue (Continuar).

  13. Si desea usar este origen de datos para crear o evaluar un modelo de ML, en Do you plan to use this dataset to create or evaluate an ML model? (¿Va a usar este conjunto de datos para crear o evaluar un modelo de ML?), elija Yes (Sí). Si elige Yes, seleccione la línea de destino. Para obtener más información sobre destinos, consulte Funcionamiento del campo targetAttributeName.

    Si desea utilizar este origen de datos junto con un modelo que ya ha creado para generar predicciones, seleccione No.

  14. Elija Continue (Continuar).

  15. En Does your data contain an identifier? (¿Sus datos contienen un identificador?), si sus datos no contienen un identificador de fila, elija No.

    Si los datos contienen un identificador de fila, seleccione Yes y seleccione la fila que desee utilizar como identificador. Para obtener información sobre identificadores de línea, consulte Funcionamiento del campo rowID.

  16. Elija Review.

  17. Revise la configuración y, a continuación seleccione Finish.

Una vez que haya creado una fuente de datos, puede usarla para create an ML model. Si ya ha creado un modelo, puede usar la fuente de datos para evaluate an ML model o generate predictions.