Machine learning

L'apprentissage automatique permet aux entreprises d'analyser rapidement les données collectées afin d'identifier des modèles, puis de prendre des décisions avec une intervention humaine minimale. L'apprentissage automatique commence par un ensemble initial de données, appelées données d'entraînement. Ces données d'entraînement contribuent à améliorer la précision des prévisions d'un modèle d'apprentissage automatique et constituent la base de l'apprentissage de ce modèle. Une fois que le modèle est considéré comme suffisamment précis pour répondre aux besoins de l'entreprise, il est déployé en production. Le kit de développement logiciel (SDK) pour la science des AWS Step Functions données est une bibliothèque open source qui vous permet de créer facilement des flux de travail qui prétraitent les données, entraînent puis publient vos modèles à l'aide d'Amazon SageMaker et de Step Functions.

Le prétraitement des ensembles de données existants est la façon dont une organisation crée souvent des données de formation. Cette méthode ajoute des informations, par exemple en étiquetant des objets dans une image, en annotant du texte ou en traitant du son. Pour prétraiter les donnéesAWS Glue, vous pouvez utiliser ou créer une instance de SageMaker bloc-notes qui exécute l'application Jupyter Notebook. Une fois que vos données sont prêtes, vous pouvez les charger sur Amazon S3 pour y accéder facilement. Au fur et à mesure que les modèles d'apprentissage automatique sont entraînés, vous pouvez ajuster les paramètres de chaque modèle afin d'améliorer la précision jusqu'à ce qu'il soit prêt à être déployé.

Step Functions vous permet d'orchestrer des flux de travail de machine learning de bout en bout sur. SageMaker Ces flux de travail peuvent inclure le prétraitement des données, le post-traitement, l'ingénierie des fonctionnalités, la validation des données et l'évaluation des modèles. Une fois le modèle déployé en production, vous pouvez affiner et tester de nouvelles approches afin d'améliorer continuellement les résultats commerciaux. Vous pouvez créer des flux de travail prêts pour la production directement dans Python, ou vous pouvez utiliser le SDK Step Functions Data Science pour copier ce flux de travail, expérimenter de nouvelles options et placer le flux de travail affiné en production.

Certains types de flux de travail d'apprentissage automatique pour lesquels les clients utilisent Step Functions incluent :

Détection des fraudes

Identifiez et empêchez les transactions frauduleuses, telles que la fraude au crédit, de se produire.
Détectez et empêchez les piratages de comptes à l'aide de modèles d'apprentissage automatique entraînés.
Identifiez les abus promotionnels, y compris la création de faux comptes, afin de pouvoir agir rapidement.

Personnalisation et recommandations

Recommandez des produits à des clients cibles en fonction de ce qui devrait susciter leur intérêt.
Prévoyez si un client fera passer son compte d'un niveau gratuit à un abonnement payant.

Enrichissement des données

Utilisez l'enrichissement des données dans le cadre du prétraitement afin de fournir de meilleures données d'entraînement pour des modèles d'apprentissage automatique plus précis.
Annotez du texte et des extraits audio pour ajouter des informations syntaxiques, telles que du sarcasme et de l'argot.
Étiquetez des objets supplémentaires dans les images pour fournir des informations essentielles dont le modèle pourra tirer des leçons, par exemple s'il s'agit d'une pomme, d'un ballon de basket, d'un rocher ou d'un animal.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Traitement des données

Orchestration de microservices