Algorithmes intégrés non supervisés SageMaker - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Algorithmes intégrés non supervisés SageMaker

Amazon SageMaker fournit plusieurs algorithmes intégrés qui peuvent être utilisés pour diverses tâches d'apprentissage non supervisées, telles que le clustering, la réduction des dimensions, la reconnaissance de formes et la détection d'anomalies.

  • IP Insights : apprend les modèles d'utilisation des adresses IPv4. Il est conçu pour capturer les associations entre les adresses IPv4 et diverses entités, telles que les noms d'utilisateur ou les numéros de compte.

  • Algorithme des k-moyennes (k-means) : tente de trouver des regroupements discrets au sein des données, au sein desquels les membres d'un groupe sont aussi semblables que possible les uns des autres et aussi différents que possible des membres des autres groupes.

  • Algorithme d'analyse en composantes principales (PCA) : réduit la dimensionnalité (nombre de fonctions) au sein d'un jeu de données en projetant des points de données sur les premiers composants principaux. L'objectif est de conserver autant d'informations ou de variations que possible. Pour les mathématiciens, les composants principaux sont les vecteurs propres de la matrice de covariance des données.

  • Algorithme Random Cut Forest (RCF) : détecte les points de données anormaux d'un jeu de données qui s'écartent de données autrement bien structurées ou calquées.

Nom de l'algorithme Nom du canal Mode d'entrée de l'entraînement Type de fichier Classe d'instance Parallélisable
IP Insights train et (facultativement) validation Fichier CSV CPU ou GPU Oui
K-Means train et (facultativement) test Fichier ou Tube recordIO-protobuf ou CSV UC ou GPU (un seul appareil GPU sur une ou plusieurs instances) Non
PCA train et (facultativement) test Fichier ou Tube recordIO-protobuf ou CSV GPU ou CPU Oui
Random Cut Forest train et (facultativement) test Fichier ou Tube recordIO-protobuf ou CSV CPU Oui