Uso de machine learning en Amazon Redshift - Amazon Redshift

Uso de machine learning en Amazon Redshift

El machine learning de Amazon Redshift (Amazon Redshift ML) es un servicio robusto basado en la nube que permite a los analistas y los científicos de datos con todos los niveles de habilidades usar tecnología de machine learning con más facilidad. Se proporcionan a Amazon Redshift los datos a partir de los cuales se desea formar un modelo y los metadatos asociados a las entradas de datos. A continuación, Amazon Redshift ML crea modelos capaces de detectar patrones en los datos de entrada. Luego, puede utilizar estos modelos para generar predicciones respecto de los nuevos datos de entrada sin incurrir en costos adicionales.

Funcionamiento de Amazon Redshift ML con Amazon SageMaker

Amazon Redshift opera con Amazon SageMaker Autopilot para obtener automáticamente el modelo más adecuado y hacer que la función de predicción esté disponible en Amazon Redshift.

En el siguiente diagrama, se ilustra cómo funciona Amazon Redshift ML.

Workflow diagram showing data collection, analysis, model creation, training, deployment, and prediction stages in Amazon Redshift ML.

El flujo de trabajo general es el siguiente:

  1. Amazon Redshift exporta los datos de formación a Amazon S3.

  2. Amazon SageMaker Autopilot procesa previamente los datos de formación. El procesamiento previo cumple funciones esenciales, tales como la imputación de los valores faltantes. Reconoce que ciertas columnas son categóricas (como el código postal), les da el formato adecuado para la formación y realiza muchas otras tareas. Elegir los mejores preprocesadores que se aplicarán en el conjunto de datos de formación supone un problema en sí mismo, por lo que Amazon SageMaker Autopilot automatiza su solución.

  3. Amazon SageMaker Autopilot encuentra el algoritmo y los hiperparámetros del algoritmo que ofrecen el modelo con las predicciones más precisas.

  4. Amazon Redshift registra la función de predicción como una función SQL en el clúster de Amazon Redshift.

  5. Cuando se ejecutan instrucciones CREATE MODEL, Amazon Redshift utiliza Amazon SageMaker para la formación. Por lo tanto, la formación de su modelo conlleva un costo adicional. Se trata de una partida independiente en su factura de AWS por Amazon SageMaker. También se paga por el almacenamiento utilizado en Amazon S3 para guardar los datos de formación. No se cobra la inferencia mediante modelos creados con CREATE MODEL que puede compilar y ejecutar en su clúster de Redshift. No se aplican cargos adicionales a Amazon Redshift por utilizar Amazon Redshift ML.