Utilisation du machine learning dans Amazon Redshift - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation du machine learning dans Amazon Redshift

Le machine learning d'Amazon Redshift (Amazon Redshift ML) est un service robuste, basé sur le cloud, qui facilite l'utilisation de la technologie de machine learning par les analystes et les scientifiques des données de tous niveaux de compétence. Vous fournissez les données que vous souhaitez pour entraîner un modèle et les métadonnées associées aux données en entrée à Amazon Redshift. Amazon Redshift ML crée ensuite des modèles qui capturent les modèles dans les données entrées. Vous pouvez ensuite utiliser ces modèles pour générer des prédictions pour de nouvelles données entrées sans encourir de coûts supplémentaires.

Comment Amazon Redshift ML fonctionne avec Amazon SageMaker

Amazon Redshift fonctionne avec Amazon SageMaker Autopilot pour obtenir automatiquement le meilleur modèle et rendre la fonction de prédiction disponible dans Amazon Redshift.

Le schéma suivant illustre le fonctionnement d'Amazon Redshift ML.

De manière générale, procédez comme suit :

  1. Amazon Redshift exporte les données d'entraînement vers Amazon S3.

  2. Amazon SageMaker Autopilot prétraite les données d'entraînement. Le prétraitement remplit des fonctions importantes, telles que l'imputation des valeurs manquantes. Il reconnaît que certaines colonnes sont catégoriques (comme le code postal), les formate correctement pour l'entraînement, et effectue de nombreuses autres tâches. Choisir les meilleurs préprocesseurs à appliquer à l'ensemble de données de formation est un problème en soi, et Amazon SageMaker Autopilot automatise sa solution.

  3. Amazon SageMaker Autopilot trouve l'algorithme et les hyperparamètres de l'algorithme qui fournissent au modèle les prédictions les plus précises.

  4. Amazon Redshift enregistre la fonction de prédiction en tant que fonction SQL dans votre cluster Amazon Redshift.

  5. Lorsque vous exécutez des instructions CREATE MODEL, Amazon Redshift utilise Amazon SageMaker pour la formation. Par conséquent, il y a un coût associé pour l'entraînement de votre modèle. Il s'agit d'un article distinct pour Amazon sur SageMaker votre AWS facture. Vous payez également les frais de stockage de vos données d'entraînement dans Amazon S3. L'inférence qui utilise des modèles créés avec CREATE MODEL pouvant être compilés et exécutés sur votre cluster Redshift ne sera pas facturée. L'utilisation d'Amazon Redshift ML n'entraîne pas de frais supplémentaires pour Amazon Redshift.