Création d'un modèle d'apprentissage-machine - Amazon Machine Learning

Nous ne mettons plus à jour le service Amazon Machine Learning et n'acceptons plus de nouveaux utilisateurs pour ce service. Cette documentation est disponible pour les utilisateurs existants, mais nous ne la mettons plus à jour. Pour plus d'informations, veuillez consulter la rubriqueQu'est-ce qu'Amazon Machine Learning.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'un modèle d'apprentissage-machine

Une fois que vous avez créé une source de données, vous êtes prêt à créer un modèle d'apprentissage-machine. Si vous utilisez la console Amazon Machine Learning pour créer un modèle, vous pouvez choisir d'utiliser les paramètres par défaut ou vous personnalisez votre modèle en appliquant des options personnalisées.

Les options personnalisées sont les suivantes :

  • Paramètres d'évaluation : Vous pouvez choisir qu'Amazon ML réserve une partie des données d'entrée pour évaluer la qualité prédictive du modèle d'apprentissage-machine. Pour obtenir des informations sur les évaluations, consultez Evaluation des modèles d'apprentissage-machine.

  • Recette : Une recette indique à Amazon ML quels attributs et transformations d'attribut sont disponibles pour la formation du modèle. Pour obtenir des informations sur les recettes Amazon ML, consultezTransformations d'entités à l'aide de recettes de données.

  • Paramètres de formation : Les paramètres contrôlent certaines propriétés du processus de formation et du modèle d'apprentissage-machine qui en résulte. Pour plus d'informations sur les paramètres de formation, consultez Paramètres de formation.

Pour sélectionner ou spécifier des valeurs pour ces paramètres, choisissez l'option Personnalisé lorsque vous utilisez l'assistant de création de modèle d'apprentissage-machine. Pour qu'Amazon ML applique les paramètres par défaut, choisissezPar défaut.

Lorsque vous créez un modèle d'apprentissage-machine, Amazon ML sélectionne le type d'algorithme d'apprentissage qu'il utilisera en fonction du type d'attribut de votre attribut cible. (L'attribut cible est l'attribut qui contient les réponses « correctes ».) Si votre attribut cible est binaire, Amazon ML crée un modèle de classification binaire, qui utilise l'algorithme de régression logistique. Si votre attribut cible est de type catégorie (Categorical), Amazon ML crée un modèle multiclasse, qui utilise un algorithme de régression logistique multinomiale. Si votre attribut cible est de type numérique (Numeric), Amazon ML crée un modèle de régression, qui utilise un algorithme de régression linéaire.

Prérequis

Avant d'utiliser la console Amazon ML pour créer un modèle d'apprentissage-machine, vous devez créer deux sources de données, l'une pour former le modèle et l'autre pour l'évaluer. Si vous n'avez pas créé deux sources de données, consultez Étape 2 : Création d'une source de données de formation dans ce didacticiel.

Création d'un modèle d'apprentissage-machine avec les options par défaut

Cliquez sur l'ongletPar défautsi vous souhaitez qu'Amazon ML :

  • fractionne les données d'entrée pour en utiliser 70 % pour la formation et les 30 % restants pour l'évaluation ;

  • suggère une recette basée sur les statistiques collectées sur la source de données de formation, qui représente 70 % de la source de données d'entrée ;

  • choisisse les paramètres de formation par défaut.

Pour choisir les options par défaut
  1. Dans la console Amazon ML, choisissezAmazon Machine LearningChoisissez, puis choisissezDes modèles d'apprentissage-machine.

  2. Dans la page récapitulative ML models, choisissez Create a new ML model.

  3. Dans la page Input data, assurez-vous que l'option I already created a datasource pointing to my S3 data est sélectionnée.

  4. Dans la table, choisissez votre source de données, puis choisissez Continue.

  5. Dans la page ML model settings, pour ML model name, tapez un nom pour votre modèle d'apprentissage-machine.

  6. Pour Training and evaluation settings, assurez-vous que la valeur Par défaut est sélectionnée.

  7. PourNommer cette évaluation, tapez un nom pour l'évaluation, puis choisissezVérification. Amazon ML contourne le reste de l'assistant et vous permet d'accéder auVérification.

  8. Passez en revue vos données, supprimez les balises copiées depuis la source de données que vous ne voulez pas appliquer à votre modèle et à vos évaluations, puis choisissez Terminer.

Création d'un modèle d'apprentissage-machine avec des options personnalisées

La personnalisation de votre modèle d'apprentissage-machine vous offre les possibilités suivantes :

  • Fournir votre propre recette. Pour obtenir des informations sur la façon de fournir votre propre recette, consultez Référence de format des recettes.

  • Choisir les paramètres de formation. Pour plus d'informations sur les paramètres de formation, consultez Paramètres de formation.

  • Choisir un rapport de fractionnement pour formation/évaluation autre que le rapport 70/30 par défaut ou fournir une autre source de données que vous avez déjà préparée pour l'évaluation. Pour obtenir des informations sur les stratégies de fractionnement, consultez Fractionnement des données.

Vous pouvez également choisir les valeurs par défaut d'un ou plusieurs de ces paramètres.

Si vous avez déjà créé un modèle à l'aide des options par défaut et que vous souhaitez améliorer les performances prédictives de votre modèle, utilisez l'option Personnalisé pour créer un nouveau modèle avec certains paramètres personnalisés. Par exemple, vous pouvez ajouter des transformations d'entité supplémentaires à la recette ou augmenter le nombre de passages dans le paramètre de formation.

Pour créer un modèle avec des options personnalisées
  1. Dans la console Amazon ML, choisissezAmazon Machine LearningChoisissez, puis choisissezDes modèles d'apprentissage-machine.

  2. Dans la page récapitulative ML models, choisissez Create a new ML model.

  3. Si vous avez déjà créé une source de données, dans la page Input data, choisissez I already created a datasource pointing to my S3 data. Dans la table, choisissez votre source de données, puis choisissez Continue.

    Si vous avez besoin de créer une source de données, choisissez My data is in S3, and I need to create a datasource, puis Continue. Vous êtes redirigé vers l'assistant Create a Datasource. Spécifiez si vos données se trouvent dans S3 ou Redshift, puis choisissez Vérifier. Terminez la procédure de création d'une source de données.

    Une fois que vous avez créé une source de données, vous êtes redirigé vers l'étape suivante dans l'assistant Create ML Model.

  4. Dans la page ML model settings, pour ML model name, tapez un nom pour votre modèle d'apprentissage-machine.

  5. Dans Select training and evaluation settings, choisissez Custom, puis choisissez Continue.

  6. Dans la page Recette, vous pouvez customize a recipe. Si vous ne voulez pas personnaliser de recette, Amazon ML vous en suggère une. Choisissez Continuer.

  7. Dans la page Advanced settings (Paramètres avancés), spécifiez les valeurs Maximum ML model Size (Taille maximum de modèle d'apprentissage automatique), Maximum number of data passes (Nombre maximum de passes de données), Shuffle type for training data (Type de réorganisation pour les données de formation), Regularization type (Type de réorganisation) et Regularization amount (Montant de régularisation). Si vous ne spécifiez pas ces paramètres, Amazon ML utilise les paramètres de formation par défaut.

    Pour plus d'informations sur ces paramètres et leurs valeurs par défaut, consultez Paramètres de formation.

    Choisissez Continuer.

  8. Dans la page Evaluation, spécifiez si vous souhaitez évaluer le modèle d'apprentissage-machine immédiatement. Si vous ne voulez pas évaluer le modèle d'apprentissage-machine maintenant, choisissez Review.

    Si vous souhaitez évaluer le modèle d'apprentissage-machine maintenant :

    1. Pour Name this evaluation (Nommer cette évaluation), tapez un nom pour l'évaluation.

    2. PourSélectionnez les données d'évaluationChoisissez si vous souhaitez qu'Amazon ML réserve une partie des données d'entrée pour l'évaluation et, si tel est le cas, la façon dont vous souhaitez fractionner la source de données, ou choisissez de fournir une autre source de données d'évaluation.

    3. Choisissez Examiner.

  9. Dans la page Review, modifiez vos sélections, supprimez les balises copiées depuis la source de données que vous ne voulez pas appliquer à votre modèle et à vos évaluations, puis choisissez Finish.

Une fois que vous avez créé le modèle, consultez Étape 4 : Examen des performances prédictives du modèle d'apprentissage-machine et définition d'un score seuil.