Exigences et meilleures pratiques pour créer des produits d'apprentissage automatique - AWS Marketplace

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exigences et meilleures pratiques pour créer des produits d'apprentissage automatique

Il est important que vos acheteurs puissent facilement tester votre package modèle et vos produits algorithmiques. Les sections suivantes décrivent les exigences relatives à la création de listes de produits d'apprentissage automatique (ML) et les meilleures pratiques relatives aux produits de machine learning. Pour un résumé complet des exigences et des recommandations, consultez leRésumé des exigences et des recommandations relatives aux listes de produits ML.

Note

Un AWS Marketplace représentant peut vous contacter pour vous aider à satisfaire à ces exigences si vos produits publiés ne les respectent pas.

Actifs nécessaires

Avant de créer une liste de produits d'apprentissage automatique, assurez-vous de disposer des ressources requises suivantes :

Bonnes pratiques générales pour les produits ML

Fournissez les informations suivantes pour votre produit d'apprentissage automatique :

  • Pour les descriptions des produits, incluez les éléments suivants :

    • Ce que fait votre modèle

    • Qui est le client cible

    • Quel est le cas d'utilisation le plus important

    • Comment votre modèle a été entraîné ou quantité de données utilisée

    • Quels sont les indicateurs de performance et les données de validation utilisées

    • S'il s'agit d'un usage médical, que votre modèle soit destiné ou non à un usage diagnostique

  • Par défaut, les produits de machine learning sont configurés pour avoir une visibilité publique. Cependant, vous pouvez créer un produit avec une visibilité privée. Pour de plus amples informations, veuillez consulter Création de votre liste de produits.

  • (Facultatif) Pour les produits payants, offrez un essai gratuit de 14 à 30 jours aux clients pour qu'ils puissent essayer votre produit. Pour de plus amples informations, veuillez consulter Tarification des produits d'apprentissage automatique pour AWS Marketplace.

  • (Facultatif) Pour les modèles de produits, si vous souhaitez activer une démonstration de produit en temps réel sur votre page de liste de produits, contactez l'équipe des opérations des AWS Marketplace vendeurs. La démonstration du produit permet à un acheteur potentiel d'essayer votre modèle directement sur la page de mise en vente sans s'abonner au modèle ni le déployer lui-même.

Exigences relatives aux informations d'utilisation

Des informations d'utilisation claires décrivant les entrées et les sorties attendues de votre produit (avec des exemples) sont essentielles pour offrir une expérience client positive.

À chaque nouvelle version de votre ressource que vous ajoutez à votre liste de produits, vous devez fournir des informations d'utilisation.

Pour ajouter des informations d'utilisation pour un nouveau produit que vous publiez pour la première fois, connectez-vous à la Portail de gestion AWS Marketplace console. Dans le menu déroulant Produits, sélectionnez Machine learning. Sélectionnez votre produit. Dans la section Présentation du produit, sous l'option Lancer, indiquez le package ARN de votre modèle ou la ressource de votre algorithme, puis choisissez Ajouter.

Pour modifier les informations d'utilisation existantes pour une version spécifique, choisissez Modifier sous l'option Lancer, puis Modifier la version.

Exigences relatives aux entrées et aux sorties

Une explication claire de votre format, avec des exemples d'entrées et de sorties, est importante pour aider vos acheteurs à comprendre et à utiliser votre produit. Cette compréhension aide vos acheteurs à effectuer les transformations nécessaires sur les données d'entrée afin d'obtenir les meilleurs résultats d'inférence.

Les informations suivantes vous seront demandées lorsque vous ajouterez votre SageMaker ressource Amazon à votre liste de produits.

Entrées et sorties d'inférence

Pour la saisie d'inférence, indiquez le format d'entrée pour le point final en temps réel et pour la tâche de transformation par lots. Incluez des extraits de code pour tout prétraitement nécessaire des données. Incluez les types de MIME contenu pris en charge (par exemple, image/png, image/bmp), les descriptions des valeurs, le cas échéant, et les limites. Incluez des échantillons d'entrée hébergés sur GitHub.

Pour la sortie d'inférence, indiquez le format de sortie pour le point final en temps réel et pour la tâche de transformation par lots. Incluez MIME le type de contenu de sortie (par exemple, application/json, jpeg) et la description des valeurs, le cas échéant. Incluez les échantillons de sortie hébergés sur GitHub.

Pour les échantillons, fournissez des fichiers d'entrée compatibles avec votre produit. Si votre modèle effectue une classification multiclasse, fournissez au moins un exemple de fichier d'entrée pour chaque classe.

Apports de formation

Dans la section Informations pour entraîner un modèle, indiquez le format des données d'entrée et les extraits de code nécessaires au prétraitement des données. Incluez les types de MIME contenu pris en charge (par exemple, image/png, image/bmp), la description des valeurs, le cas échéant, et les limites. Assurez-vous d'inclure des échantillons d'entrée hébergés sur GitHub.

Expliquez les fonctionnalités facultatives et obligatoires qui peuvent être fournies par l'acheteur et précisez si le mode de PIPE saisie est pris en charge. Si la formation distribuée (formation avec plus d'une GPU instanceCPU) est prise en charge, spécifiez-la. Pour le réglage, listez les hyperparamètres recommandés.

Exigences relatives au bloc-notes Jupyter

Lorsque vous ajoutez votre SageMaker ressource à votre liste de produits, fournissez un lien vers un exemple de bloc-notes Jupyter hébergé sur celui-ci GitHubqui illustre le flux de travail complet sans demander à l'acheteur de télécharger ou de rechercher des données.

Utilisez AWS SDK for Python (Boto). Un carnet d'échantillons bien conçu permet aux acheteurs d'essayer et d'utiliser plus facilement votre annonce.

Pour les modèles de packages, votre bloc-notes d'exemple montre la préparation des données d'entrée, la création d'un point de terminaison pour une inférence en temps réel et les performances des tâches de transformation par lots. Pour plus d'informations, voir la liste des modèles de packages et les exemples de bloc-notes sur GitHub. Pour un exemple de bloc-notes, voir auto_insurance. Le bloc-notes fonctionne dans l'ensemble Régions AWS, sans saisie de paramètres et sans qu'un acheteur ait besoin de localiser des échantillons de données.

Note

Un exemple de bloc-notes Jupyter sous-développé ne présentant pas les multiples entrées possibles et les étapes de prétraitement des données peut empêcher l'acheteur de bien comprendre la proposition de valeur de votre produit.

Pour les produits d'algorithmes, le bloc-notes d'exemple décrit la formation complète, le réglage, la création de modèles, la création d'un point de terminaison pour une inférence en temps réel et les performances des tâches de transformation par lots. Pour plus d'informations, voir Liste des algorithmes et bloc-notes d'échantillons sur GitHub. Pour des exemples de blocs-notes, consultez amazon_demo_product et automl on. GitHub Ces exemples de carnets fonctionnent dans toutes les régions sans avoir à saisir de paramètres et sans qu'un acheteur n'ait besoin de localiser des échantillons de données.

Note

L'absence d'exemples de données de formation peut empêcher votre acheteur de gérer correctement le bloc-notes Jupyter. Un carnet d'échantillons sous-développé peut empêcher vos acheteurs d'utiliser votre produit et entraver son adoption.

Résumé des exigences et des recommandations relatives aux listes de produits ML

Le tableau suivant fournit un résumé des exigences et des recommandations relatives à une page de liste de produits d'apprentissage automatique.

Détails Pour les listes de modèles de packages Pour les listes d'algorithmes
Product descriptions
Expliquez en détail ce que le produit fait pour les types de contenu pris en charge (par exemple, « détecte X dans les images »). Obligatoire Obligatoire
Fournissez des informations convaincantes et différenciantes sur le produit (évitez les adjectifs tels que « meilleure » ou les allégations non fondées). Recommandée Recommandée
Répertoriez les principaux cas d'utilisation de ce produit. Obligatoire Obligatoire
Décrivez les données (source et taille) sur lesquelles il a été formé et dressez la liste des limites connues. Obligatoire Ne s’applique pas
Décrivez le cadre de base sur lequel le modèle a été construit. Recommandée Recommandée
Résumez la métrique de performance du modèle sur les données de validation (par exemple, « Le pourcentage de précision de XX.YY a été comparé à l'aide du jeu de données Z »). Obligatoire Ne s’applique pas
Résumez les mesures de latence et/ou de débit du modèle selon le type d'instance recommandé. Obligatoire Ne s’applique pas
Décrivez la catégorie d'algorithme. Par exemple, « cet algorithme de régression de forêt décisionnelle est basé sur un ensemble de classificateurs arborescents conçus à l'aide de la technique générale d'agrégation bootstrap et d'un choix aléatoire de fonctionnalités ». Ne s’applique pas Obligatoire
Usage information
À des fins d'inférence, fournissez le format d'entrée pour le point final en temps réel et pour la tâche de transformation par lots. Incluez les types de MIME contenu pris en charge (par exemple, image/png, image/bmp), la description des valeurs, le cas échéant, et les limites. Consultez Exigences relatives aux entrées et aux sorties. Obligatoire Obligatoire
À des fins d'inférence, fournissez des échantillons d'entrée pour le point final en temps réel et pour la tâche de transformation par lots. Les échantillons doivent être hébergés sur GitHub. Consultez Exigences relatives aux entrées et aux sorties. Obligatoire Obligatoire
À des fins d'inférence, fournissez le format de sortie pour le point final en temps réel et pour la tâche de transformation par lots. Incluez MIME le type de contenu de sortie (par exemple, application/json, jpeg) et la description des valeurs, le cas échéant. Consultez Exigences relatives aux entrées et aux sorties. Obligatoire Obligatoire
À des fins d'inférence, fournissez des échantillons de sortie pour le point final en temps réel et pour la tâche de transformation par lots. Les échantillons doivent être hébergés sur GitHub. Consultez Exigences relatives aux entrées et aux sorties. Obligatoire Obligatoire
À des fins d'inférence, fournissez un exemple d'utilisation d'un point de terminaison ou d'une tâche de transformation par lots. Incluez un exemple de code utilisant les commandes AWS Command Line Interface (AWS CLI) ou un AWS SDK. Obligatoire Obligatoire
Pour la formation, indiquez le format de saisie. Incluez les types de MIME contenu pris en charge (par exemple, image/png, image/bmp), la description des valeurs, le cas échéant, et les limites (par exemple, le nombre minimum de lignes de données requises). Consultez Exigences relatives aux entrées et aux sorties. Ne s’applique pas Obligatoire
Pour la formation, fournissez des échantillons d'entrée hébergés sur GitHub. Consultez Exigences relatives aux entrées et aux sorties. Ne s’applique pas Obligatoire
Pour ce qui est de la formation, donnez un exemple d'exécution de tâches de formation. Décrivez les hyperparamètres pris en charge, leurs plages et leur impact global. Spécifiez si l'algorithme prend en charge le réglage des hyperparamètres, l'apprentissage distribué ou GPU les instances. Incluez un exemple de code tel que AWS CLI des commandes ou l'utilisation d'un AWS SDK, par exemple. Ne s’applique pas Obligatoire
Fournissez un bloc-notes Jupyter hébergé pour GitHub démontrer l'utilisation complète de votre produit. Consultez Exigences relatives au bloc-notes Jupyter. Obligatoire Obligatoire
Fournissez des informations techniques relatives à l'utilisation du produit, notamment des manuels d'utilisation et des exemples de données. Recommandée Recommandée