Utiliser Amazon SageMaker Ground Truth Plus pour étiqueter les données - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser Amazon SageMaker Ground Truth Plus pour étiqueter les données

Amazon SageMaker Ground Truth Plus est un service d'étiquetage de données clé en main qui fait appel à une main-d'œuvre experte pour fournir rapidement des annotations de haute qualité et réduit les coûts jusqu'à 40 %. Grâce à SageMaker Ground Truth Plus, les scientifiques des données et les responsables commerciaux, tels que les responsables des opérations de données et les responsables de programmes, peuvent créer des ensembles de données de formation de haute qualité sans avoir à créer d'applications d'étiquetage ni à gérer eux-mêmes le personnel chargé de l'étiquetage. Vous pouvez commencer à utiliser Amazon SageMaker Ground Truth Plus en téléchargeant des données ainsi que les exigences en matière d'étiquetage dans Amazon S3.

Pourquoi utiliser SageMaker Ground Truth Plus ?

Pour entraîner un modèle de machine learning (ML), les scientifiques des données ont besoin d'un jeu de données étiquetées volumineux et de grande qualité. À mesure que l'adoption du ML augmente, les besoins en étiquetage augmentent. Les scientifiques des données sont obligés de consacrer des semaines à la création de flux d'étiquetage des données et à la gestion d'une main-d'œuvre d'étiquetage des données. Malheureusement, cela ralentit l'innovation et augmente les coûts. Pour s'assurer de pouvoir consacrer leur temps à la création, à l'entraînement et au déploiement des modèles de ML, les scientifiques des données demandent généralement à d'autres équipes internes composées de responsables des opérations sur les données et de gestionnaires de programmes de produire des jeux de données d'entraînement de haute qualité. Toutefois, ces équipes n'ont généralement pas accès aux compétences requises pour fournir des jeux de données d'entraînement de haute qualité, ce qui affecte les résultats du ML. Une alternative consiste à rechercher un partenaire d'étiquetage des données qui peut les aider à créer des jeux de données d'entraînement de haute qualité à grande échelle sans faire appel aux ressources internes.

Lorsque vous téléchargez les données, SageMaker Ground Truth Plus met en place les flux de travail d'étiquetage des données et les gère en votre nom. À partir de là, un personnel expert formé à diverses tâches d'apprentissage automatique (ML) effectue l'étiquetage des données. SageMaker Ground Truth Plus propose actuellement deux types de main-d'œuvre experte : une main-d'œuvre employée par Amazon et une liste organisée de fournisseurs tiers. SageMaker Ground Truth Plus vous offre la flexibilité de choisir le personnel d'étiquetage. AWSdes experts sélectionnent le meilleur personnel d'étiquetage en fonction des exigences de votre projet. Par exemple, si vous avez besoin de personnes compétentes en matière d'étiquetage de fichiers audio, spécifiez-le dans les directives fournies à SageMaker Ground Truth Plus, et le service sélectionnera automatiquement les étiqueteurs possédant ces compétences.

Important

SageMaker Ground Truth Plus ne prend pas en charge les données certifiées PHI, PCI ou FedRAMP, et vous ne devez pas fournir ces données à Ground SageMaker Truth Plus.

Comment fonctionne SageMaker Ground Truth Plus ?

Le flux de travail comporte cinq composants principaux.

  • Demande d'un projet

  • Création d'une équipe de projet

  • Accès au portail du projet pour contrôler la progression des jeux de données d'entraînement et examiner les données étiquetées

  • Création d'un lot

  • Réception des données étiquetées

Comment utiliser SageMaker Ground Truth Plus ?

Si vous utilisez SageMaker Ground Truth Plus pour la première fois, utilisez Commencer à utiliser Amazon SageMaker Ground Truth Plus get started. Pour accéder à SageMaker Ground Truth Plus à l'aide de la SageMaker console, vous devez vous trouver dans l'est des États-Unis (Virginie du Nord) (us-east-1).