Vue d'ensemble du volant - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vue d'ensemble du volant

Un volant est une ressource Amazon Comprehend qui orchestre la formation et l'évaluation des nouvelles versions d'un modèle personnalisé. Vous pouvez créer un volant pour utiliser un modèle entraîné existant, ou Amazon Comprehend peut créer et entraîner un nouveau modèle pour le volant. Utilisez des volants avec des modèles personnalisés en texte brut pour une classification personnalisée ou une reconnaissance d'entités personnalisée.

Vous pouvez configurer et gérer les volants à l'aide de la console ou de l'API Amazon Comprehend. Vous pouvez également configurer les volants à l'aide AWS CloudFormation de.

Lorsque vous créez un volant, Amazon Comprehend crée un lac de données dans votre compte. Le lac de données stocke et gère toutes les données relatives au volant, telles que les données d'entraînement et les données de test pour toutes les versions du modèle.

Vous définissez la version du modèle actif comme étant la version du modèle de volant que vous souhaitez utiliser pour les tâches d'inférence ou les points de terminaison Amazon Comprehend. Au départ, le volant contient une version du modèle. Au fil du temps, lorsque vous entraînez de nouvelles versions de modèles, vous sélectionnez la version la plus performante comme version active. Lorsqu'un utilisateur spécifie l'ARN du volant pour exécuter une tâche d'inférence, Amazon Comprehend exécute la tâche en utilisant la version du modèle actif du volant.

Régulièrement, vous obtenez de nouvelles données étiquetées (données d'entraînement ou données de test) pour le modèle. Vous mettez de nouvelles données à la disposition du volant en créant un ou plusieurs ensembles de données. Un jeu de données contient des données d'entrée pour l'entraînement ou le test du modèle personnalisé associé à un volant. Amazon Comprehend télécharge les données d'entrée dans le lac de données du volant.

Pour intégrer les nouveaux ensembles de données dans votre modèle personnalisé, vous devez créer et exécuter une itération en volant. Une itération en volant est un flux de travail qui utilise les nouveaux ensembles de données pour évaluer la version active du modèle et pour entraîner une nouvelle version du modèle. Sur la base des statistiques relatives aux versions existantes et nouvelles du modèle, vous pouvez décider de promouvoir ou non la nouvelle version du modèle en tant que version active.

Vous pouvez utiliser la version du modèle actif au volant pour exécuter des analyses personnalisées (tâches en temps réel ou asynchrones). Pour utiliser le modèle de volant à des fins d'analyse en temps réel, vous devez créer un point de terminaison pour le volant.

Il n'y a pas de frais supplémentaires pour l'utilisation des volants. Toutefois, lorsque vous exécutez une itération en volant, vous devez payer les frais standard pour l'entraînement d'une nouvelle version du modèle et le stockage des données du modèle. Pour obtenir des informations détaillées sur les prix, consultez Amazon Comprehend Pricing.

Ensembles de données Flywheel

Pour ajouter de nouvelles données étiquetées à un volant, vous devez créer un jeu de données. Vous configurez chaque ensemble de données en tant que données d'entraînement ou données de test. Vous associez le jeu de données à un volant spécifique et à un modèle personnalisé.

Une fois que vous avez créé un ensemble de données, Amazon Comprehend télécharge les données dans le lac de données du volant. Pour plus d’informations, consultez Lacs de données Flywheel.

Création d'un volant

Lorsque vous créez un volant, vous pouvez associer le volant à un modèle entraîné existant, ou le volant peut créer un nouveau modèle.

Lorsque vous créez un volant à partir d'un modèle existant, vous spécifiez la version du modèle actif. Amazon Comprehend copie les données d'entraînement et les données de test du modèle dans le data lake du volant. Assurez-vous que les données d'entraînement et de test du modèle se trouvent au même emplacement Amazon S3 que lorsque vous avez créé le modèle.

Pour créer un volant pour un nouveau modèle, vous devez fournir un jeu de données pour les données d'entraînement (et un ensemble de données facultatif pour les données de test) lorsque vous créez le volant. Lorsque vous lancez le volant pour créer la première itération du volant, le volant entraîne le nouveau modèle.

Lorsque vous entraînez un modèle personnalisé, vous spécifiez une liste d'étiquettes personnalisées (classification personnalisée) ou d'entités personnalisées (reconnaissance d'entités personnalisée) que le modèle doit reconnaître. Notez les points importants suivants concernant les étiquettes/entités personnalisées :

  • Lorsque vous créez un volant pour un nouveau modèle, la liste des étiquettes/entités que vous fournissez lors de la création du volant est la liste finale du volant.

  • Lorsque vous créez un volant à partir d'un modèle existant, la liste des étiquettes/entités associées à ce modèle devient la liste finale du volant.

  • Si vous associez un nouvel ensemble de données au volant et que cet ensemble de données contient des étiquettes/entités supplémentaires, Amazon Comprehend ignore les nouvelles étiquettes/entités.

  • Vous pouvez consulter la liste des étiquettes/entités d'un volant à l'aide de l'DescribeFlywheelopération API.

    Note

    Pour une classification personnalisée, Amazon Comprehend renseigne la liste des étiquettes une fois que le statut du volant devient ACTIF. Attendez que le volant soit actif avant d'appeler l'opération DescribeFlywheel API.

États du volant

Un volant passe d'un état à l'autre :

  • CRÉATION - Amazon Comprehend est en train de créer les ressources du volant. Vous pouvez effectuer des opérations de lecture sur le volant, telles queDescribeFlywheel.

  • ACTIF - Le volant est actif. Vous pouvez déterminer si une itération au volant est en cours et consulter le statut de l'itération. Vous pouvez effectuer des actions de lecture sur le volant et des actions telles que DeleteFlywheel etUpdateFlywheel.

  • MISE À JOUR - Amazon Comprehend est en train de mettre à jour le volant. Vous pouvez effectuer des opérations de lecture sur le volant.

  • SUPPRESSION - Amazon Comprehend est en train de supprimer le volant. Vous pouvez effectuer des opérations de lecture sur le volant.

  • ÉCHEC : l'opération de création du volant a échoué.

Une fois qu'Amazon Comprehend a supprimé un volant, vous conservez l'accès à toutes les données du modèle dans le lac de données du volant. Amazon Comprehend supprime toutes les métadonnées internes requises pour gérer les ressources du volant. Amazon Comprehend supprime également les ensembles de données associés à ce volant (les données du modèle sont enregistrées dans le lac de données).

Itérations du volant

Lorsque vous obtenez de nouvelles données d'entraînement ou de test pour un modèle de volant, vous créez un ou plusieurs nouveaux ensembles de données pour télécharger les nouvelles données dans le lac de données du volant.

Vous lancez ensuite le volant pour créer une nouvelle itération du volant. L'itération du volant évalue la version active actuelle du modèle à l'aide des nouvelles données et stocke les résultats dans le lac de données. Le volant crée et entraîne également une nouvelle version du modèle.

Si le nouveau modèle présente de meilleures performances que la version du modèle actif actuel, vous pouvez promouvoir la nouvelle version du modèle en tant que version du modèle actif. Vous pouvez utiliser la console ou l'opération UpdateFlywheelAPI pour mettre à jour la version du modèle actif.