Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Algorithmes intégrés non supervisés SageMaker
Amazon SageMaker fournit plusieurs algorithmes intégrés qui peuvent être utilisés pour diverses tâches d'apprentissage non supervisées, telles que le clustering, la réduction des dimensions, la reconnaissance de formes et la détection d'anomalies.
-
IP Insights : apprend les modèles d'utilisation des adresses IPv4. Il est conçu pour capturer les associations entre les adresses IPv4 et diverses entités, telles que les noms d'utilisateur ou les numéros de compte.
-
Algorithme des k-moyennes (k-means) : tente de trouver des regroupements discrets au sein des données, au sein desquels les membres d'un groupe sont aussi semblables que possible les uns des autres et aussi différents que possible des membres des autres groupes.
-
Algorithme d'analyse en composantes principales (PCA) : réduit la dimensionnalité (nombre de fonctions) au sein d'un jeu de données en projetant des points de données sur les premiers composants principaux. L'objectif est de conserver autant d'informations ou de variations que possible. Pour les mathématiciens, les composants principaux sont les vecteurs propres de la matrice de covariance des données.
-
Algorithme Random Cut Forest (RCF) : détecte les points de données anormaux d'un jeu de données qui s'écartent de données autrement bien structurées ou calquées.
Nom de l'algorithme | Nom du canal | Mode d'entrée de l'entraînement | Type de fichier | Classe d'instance | Parallélisable |
---|---|---|---|---|---|
IP Insights | train et (facultativement) validation | Fichier | CSV | CPU ou GPU | Oui |
K-Means | train et (facultativement) test | Fichier ou Tube | recordIO-protobuf ou CSV | UC ou GPU (un seul appareil GPU sur une ou plusieurs instances) | Non |
PCA | train et (facultativement) test | Fichier ou Tube | recordIO-protobuf ou CSV | GPU ou CPU | Oui |
Random Cut Forest | train et (facultativement) test | Fichier ou Tube | recordIO-protobuf ou CSV | CPU | Oui |