Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Bonnes pratiques
Cette section fournit un aperçu des AWS meilleures pratiques pourMLOps.
Gestion et séparation des comptes
AWS les meilleures pratiques en matière de gestion des comptes recommandent de diviser vos comptes en quatre comptes pour chaque cas d'utilisation : expérimentation, développement, test et production. Il est également recommandé de disposer d'un compte de gouvernance pour fournir des MLOps ressources partagées au sein de l'organisation et d'un compte de lac de données pour fournir un accès centralisé aux données. Cette démarche vise à séparer complètement les environnements de développement, de test et de production, à éviter les retards causés par les limites de service atteintes en raison de cas d'utilisation multiples et d'équipes de science des données partageant le même ensemble de comptes, mais aussi à fournir une vue d'ensemble des coûts pour chaque cas d'utilisation. Enfin, il est recommandé de séparer les données au niveau des comptes, car chaque cas d'utilisation possède son propre ensemble de comptes.
Normes de sécurité
Pour répondre aux exigences de sécurité, il est recommandé de désactiver l'accès public à Internet et de chiffrer toutes les données à l'aide de clés personnalisées. Vous pouvez ensuite déployer une instance sécurisée d'Amazon SageMaker Studio sur le compte de développement en quelques minutes à l'aide de Service Catalog. Vous pouvez également bénéficier de fonctionnalités d'audit et de surveillance des modèles pour chaque cas d'utilisation en utilisant SageMaker des modèles déployés avec SageMaker Projects.
Fonctionnalités de cas d'utilisation
Une fois la configuration du compte terminée, les data scientists de votre organisation peuvent demander un nouveau modèle de cas d'utilisation à l'aide de SageMaker Projects in SageMaker Studio. Ce processus déploie l'infrastructure nécessaire pour intégrer des MLOps fonctionnalités dans le compte de développement (avec un support minimal requis de la part des équipes centrales), telles que les pipelines CI/CD, les tests unitaires, les tests de modèles et la surveillance des modèles.
Chaque cas d'utilisation est ensuite développé (ou refactorisé dans le cas d'une base de code d'application existante) pour s'exécuter dans une SageMaker architecture en utilisant des SageMaker fonctionnalités telles que le suivi des expériences, l'explicabilité du modèle, la détection des biais et le suivi de la qualité des données/modèles. Vous pouvez ajouter ces fonctionnalités à chaque pipeline de cas d'utilisation en utilisant les étapes des SageMaker pipelines dans Pipelines.
MLOpsparcours de maturité
Le parcours de MLOps maturité définit les MLOps capacités nécessaires mises à disposition dans une configuration à l'échelle de l'entreprise pour garantir la mise en place d'un end-to-end modèle de flux de travail. Le parcours de maturité comprend quatre étapes :
Initial : dans cette étape, vous établissez le compte d'expérimentation. Vous créez également un nouveau AWS compte au sein de votre organisation où vous pouvez tester SageMaker Studio et d'autres nouveaux AWS services.
Répétable : dans cette étape, vous normalisez les référentiels de code et le développement de la solution de ML. Vous adoptez également une approche d'implémentation de comptes multiples et vous normalisez vos référentiels de code pour prendre en charge la gouvernance des modèles et les audits de modèles à mesure que l'offre monte en puissance. Il est recommandé d'adopter une approche de développement de modèle prête à la production avec des solutions standard fournies par un compte de gouvernance. Les données sont stockées dans un compte de lac de données et les cas d'utilisation sont développés dans deux comptes. Le premier compte concerne l'expérimentation pendant la période d'exploration de la science des données. Dans ce compte, les scientifiques des données découvrent des modèles permettant de résoudre les problèmes métier et expérimentent plusieurs possibilités. L'autre compte concerne le développement, qui a lieu une fois que le meilleur modèle a été identifié et que l'équipe de science des données est prête à travailler sur le pipeline d'inférence.
Fiable : dans cette étape, vous introduisez les tests, le déploiement et le déploiement de comptes multiples. Vous devez comprendre les MLOps exigences et introduire des tests automatisés. Mettez en œuvre les MLOps meilleures pratiques pour garantir la robustesse et la sécurité des modèles. Au cours de cette phase, introduisez deux nouveaux comptes de cas d'utilisation : un compte de test pour tester les modèles développés dans un environnement qui émule l'environnement de production et un compte de production pour exécuter l'inférence de modèles dans le cadre des opérations métier. Enfin, utilisez le test, le déploiement et la surveillance automatisés des modèles dans une configuration à comptes multiples pour vous assurer que vos modèles répondent aux rigoureuses normes de qualité et de performance que vous avez définies.
Évolutif : dans cette étape, vous modélisez et produisez plusieurs solutions de machine learning. Plusieurs équipes et cas d'utilisation du machine learning commencent à être adoptés MLOps au cours du processus de création du end-to-end modèle. Pour atteindre la capacité de mise à l'échelle dans cette étape, vous augmentez également le nombre de modèles dans votre bibliothèque de modèles grâce aux contributions d'une base plus large de scientifiques des données, vous réduisez le délai de valorisation entre l'idée et le modèle de production pour un plus grand nombre d'équipes au sein de l'organisation, et vous itérez à mesure de votre mise à l'échelle.
Pour plus d'informations sur le modèle de MLOps maturité, consultez MLOpsla feuille de route de base pour les entreprises SageMaker utilisant Amazon