Paramètres communs des algorithmes intégrés - Amazon SageMaker

Paramètres communs des algorithmes intégrés

Le tableau suivant répertorie les paramètres de chacun des algorithmes fournis par Amazon SageMaker.

Nom de l'algorithme Nom du canal Chemin de registre de l'image d'entraînement et de l'image d'inférence Mode d'entrée de l'entraînement Type de fichier Classe d'instance Parallélisable
BlazingText train

<ecr_path>/blazingtext:<tag>

Fichier ou Tube Fichier texte (une phrase par ligne avec des jetons séparés par des espaces) GPU (une seule instance uniquement) ou CPU Non
Prévisions DeepAR train et (facultativement) test

<ecr_path>/forecasting-deepar:<tag>

Fichier JSON Lines ou Parquet GPU ou CPU Oui
Machines de factorisation train et (facultativement) test

<ecr_path>/factorization-machines:<tag>

Fichier ou Tube recordIO-protobuf CPU (GPU pour les données denses) Oui
Classification d'images train et validation, (facultativement) train_lst, validation_lst et model

<ecr_path>/image-classification:<tag>

Fichier ou Tube recordIO ou fichiers d'image (.jpg ou .png) GPU Oui
IP Insights train et (facultativement) validation

<ecr_path>/ipinsights:<tag>

Fichier CSV CPU ou GPU Oui
k-moyennes (k-means) train et (facultativement) test

<ecr_path>/kmeans:<tag>

Fichier ou Tube recordIO-protobuf ou CSV UC ou GPU (un seul appareil GPU sur une ou plusieurs instances) Non
k-nearest-neighbor (k-NN) train et (facultativement) test

<ecr_path>/knn:<tag>

Fichier ou Tube recordIO-protobuf ou CSV UC ou GPU (un seul appareil GPU sur une ou plusieurs instances) Oui

LDA

train et (facultativement) test

<ecr_path>/lda:<tag>

Fichier ou Tube recordIO-protobuf ou CSV CPU (une seule instance uniquement) Non
Linear Learner train et (facultativement) validation, test, ou les deux <ecr_path>/linear-learner:<tag> Fichier ou Tube recordIO-protobuf ou CSV CPU ou GPU Oui
Neural Topic Model (NTM) train et (facultativement) validation, test, ou les deux

<ecr_path>/ntm:<tag>

Fichier ou Tube recordIO-protobuf ou CSV GPU ou CPU Oui
Object2Vec train et (facultativement) validation, test, ou les deux

<ecr_path>/object2vec:<tag>

Fichier JSON Lines GPU ou UC (une seule instance uniquement) Non
Détection d'objets train et validation, (facultativement) train_annotation, validation_annotation et model

<ecr_path>/object-detection:<tag>

Fichier ou Tube recordIO ou fichiers d'image (.jpg ou .png) GPU Oui
PCA train et (facultativement) test

<ecr_path>/pca:<tag>

Fichier ou Tube recordIO-protobuf ou CSV GPU ou CPU Oui
Random Cut Forest train et (facultativement) test

<ecr_path>/randomcutforest:<tag>

Fichier ou Tube recordIO-protobuf ou CSV Processeur Oui
Segmentation sémantique train et validation, train_annotation, validation_annotation et (facultativement) label_map et model

<ecr_path>/semantic-segmentation:<tag>

Fichier ou Tube fichiers image GPU (une seule instance uniquement) Non

Modélisation Seq2Seq

train, validation et vocab <ecr_path>/seq2seq:<tag> Fichier recordIO-protobuf GPU (une seule instance uniquement) Non
XGBoost train et (facultativement) validation

<ecr_path>/xgboost:<tag>

Fichier CSV ou LibSVM Processeur Oui

Les algorithmes qui sont parallélisables peuvent être déployés sur plusieurs instances de calcul pour l'entraînement distribué. Pour la colonne Training Image and Inference Image Registry Path (Chemin de registre de l'image d'entraînement et de l'image d'inférence), utilisez la balise de version :1 afin de vous assurer d'utiliser une version stable de l'algorithme. Vous pouvez héberger de façon fiable un modèle entraîné à l'aide d'une image avec la balise :1 sur une image d'inférence possédant la balise :1. Le fait d'utiliser la balise :latest dans le chemin de registre vous permet de bénéficier de la version la plus récente de l'algorithme, mais peut entraîner des problèmes de rétrocompatibilité. Évitez d'utiliser la balise :latest à des fins de production.

Pour la colonne Training Image and Inference Image Registry Path (Chemin de registre de l'image d'entraînement et de l'image d'inférence), selon la région et l'algorithme, utilisez l'une des valeurs suivantes pour <ecr_path>..

Algorithmes : BlazingText, classification d'images, détection d'objets, segmentation sémantique, Seq2Seq et XGBoost (0.72)

Région AWS Chemin de registre de l'image d'entraînement et de l'image d'inférence
us-west-1 632365934929.dkr.ecr.us-west-1.amazonaws.com
us-west-2 433757028032.dkr.ecr.us-west-2.amazonaws.com
us-east-1 811284229777.dkr.ecr.us-east-1.amazonaws.com
us-east-2 825641698319.dkr.ecr.us-east-2.amazonaws.com
ap us-east-1 286214385809.dkr.ecr.ap-east-1.amazonaws.com
ap-northeast-1 501404015308.dkr.ecr.ap-northeast-1.amazonaws.com
ap-northeast-2 306986355934.dkr.ecr.ap-northeast-2.amazonaws.com
ap-south-1 991648021394.dkr.ecr.ap-south-1.amazonaws.com
ap-southeast-1 475088953585.dkr.ecr.ap-southeast-1.amazonaws.com
ap-southeast-2 544295431143.dkr.ecr.ap-southeast-2.amazonaws.com
ca-central-1 469771592824.dkr.ecr.ca-central-1.amazonaws.com
cn-north-1 390948362332.dkr.ecr.cn-north-1.amazonaws.com.cn
cn-northwest-1 387376663083.dkr.ecr.cn-northwest-1.amazonaws.com.cn
eu-central-1 813361260812.dkr.ecr.eu-central-1.amazonaws.com
eu-north-1 669576153137.dkr.ecr.eu-north-1.amazonaws.com
eu-west-1 685385470294.dkr.ecr.eu-west-1.amazonaws.com
eu-west-2 644912444149.dkr.ecr.eu-west-2.amazonaws.com
eu-west-3 749696950732.dkr.ecr.eu-west-3.amazonaws.com
me-south-1 249704162688.dkr.ecr.me-south-1.amazonaws.com
sa-east-1 855470959533.dkr.ecr.sa-east-1.amazonaws.com
us-gov-west-1 226302683700.dkr.ecr.us-gov-west-1.amazonaws.com

Algorithmes : prévisions DeepAR

Région AWS Chemin de registre de l'image d'entraînement et de l'image d'inférence
us-west-1 632365934929.dkr.ecr.us-west-1.amazonaws.com
us-west-2 156387875391.dkr.ecr.us-west-2.amazonaws.com
us-east-1 522234722520.dkr.ecr.us-east-1.amazonaws.com
us-east-2 566113047672.dkr.ecr.us-east-2.amazonaws.com
ap us-east-1 286214385809.dkr.ecr.ap-east-1.amazonaws.com
ap-northeast-1 633353088612.dkr.ecr.ap-northeast-1.amazonaws.com
ap-northeast-2 204372634319.dkr.ecr.ap-northeast-2.amazonaws.com
ap-south-1 991648021394.dkr.ecr.ap-south-1.amazonaws.com
ap-southeast-1 475088953585.dkr.ecr.ap-southeast-1.amazonaws.com
ap-southeast-2 514117268639.dkr.ecr.ap-southeast-2.amazonaws.com
ca-central-1 469771592824.dkr.ecr.ca-central-1.amazonaws.com
cn-north-1 390948362332.dkr.ecr.cn-north-1.amazonaws.com.cn
cn-northwest-1 387376663083.dkr.ecr.cn-northwest-1.amazonaws.com.cn
eu-north-1 669576153137.dkr.ecr.eu-north-1.amazonaws.com
eu-central-1 495149712605.dkr.ecr.eu-central-1.amazonaws.com
eu-west-1 224300973850.dkr.ecr.eu-west-1.amazonaws.com
eu-west-2 644912444149.dkr.ecr.eu-west-2.amazonaws.com
eu-west-3 749696950732.dkr.ecr.eu-west-3.amazonaws.com
me-south-1 249704162688.dkr.ecr.me-south-1.amazonaws.com
sa-east-1 855470959533.dkr.ecr.sa-east-1.amazonaws.com
us-gov-west-1 226302683700.dkr.ecr.us-gov-west-1.amazonaws.com

Algorithmes : Machines de factorisation, IP Insights, k-moyennes (k-means), k-nearest-neighbor, Linear Learner, Object2Vec, Neural Topic Model (NTM), PCA et Random Cut Forest

Région AWS Chemin de registre de l'image d'entraînement et de l'image d'inférence
us-west-1 632365934929.dkr.ecr.us-west-1.amazonaws.com
us-west-2 174872318107.dkr.ecr.us-west-2.amazonaws.com
us-east-1 382416733822.dkr.ecr.us-east-1.amazonaws.com
us-east-2 404615174143.dkr.ecr.us-east-2.amazonaws.com
ap us-east-1 286214385809.dkr.ecr.ap-east-1.amazonaws.com
ap-northeast-1 351501993468.dkr.ecr.ap-northeast-1.amazonaws.com
ap-northeast-2 835164637446.dkr.ecr.ap-northeast-2.amazonaws.com
ap-south-1 991648021394.dkr.ecr.ap-south-1.amazonaws.com
ap-southeast-1 475088953585.dkr.ecr.ap-southeast-1.amazonaws.com
ap-southeast-2 712309505854.dkr.ecr.ap-southeast-2.amazonaws.com
ca-central-1 469771592824.dkr.ecr.ca-central-1.amazonaws.com
cn-north-1 390948362332.dkr.ecr.cn-north-1.amazonaws.com.cn
cn-northwest-1 387376663083.dkr.ecr.cn-northwest-1.amazonaws.com.cn
eu-central-1 664544806723.dkr.ecr.eu-central-1.amazonaws.com
eu-north-1 669576153137.dkr.ecr.eu-north-1.amazonaws.com
eu-west-1 438346466558.dkr.ecr.eu-west-1.amazonaws.com
eu-west-2 644912444149.dkr.ecr.eu-west-2.amazonaws.com
eu-west-3 749696950732.dkr.ecr.eu-west-3.amazonaws.com
me-south-1 249704162688.dkr.ecr.me-south-1.amazonaws.com
sa-east-1 855470959533.dkr.ecr.sa-east-1.amazonaws.com
us-gov-west-1 226302683700.dkr.ecr.us-gov-west-1.amazonaws.com

Algorithmes : Allocation de Dirichlet latente (LDA)

Région AWS Chemin de registre de l'image d'entraînement et de l'image d'inférence
us-west-1 632365934929.dkr.ecr.us-west-1.amazonaws.com
us-west-2 266724342769.dkr.ecr.us-west-2.amazonaws.com
us-east-1 766337827248.dkr.ecr.us-east-1.amazonaws.com
us-east-2 999911452149.dkr.ecr.us-east-2.amazonaws.com
ap-northeast-1 258307448986.dkr.ecr.ap-northeast-1.amazonaws.com
ap-northeast-2 293181348795.dkr.ecr.ap-northeast-2.amazonaws.com
ap-south-1 991648021394.dkr.ecr.ap-south-1.amazonaws.com
ap-southeast-1 475088953585.dkr.ecr.ap-southeast-1.amazonaws.com
ap-southeast-2 297031611018.dkr.ecr.ap-southeast-2.amazonaws.com
ca-central-1 469771592824.dkr.ecr.ca-central-1.amazonaws.com
eu-central-1 353608530281.dkr.ecr.eu-central-1.amazonaws.com
eu-west-1 999678624901.dkr.ecr.eu-west-1.amazonaws.com
eu-west-2 644912444149.dkr.ecr.eu-west-2.amazonaws.com
us-gov-west-1 226302683700.dkr.ecr.us-gov-west-1.amazonaws.com

Algorithmes : XGBoost (0.90)

Région AWS Chemin de registre de l'image d'entraînement et de l'image d'inférence
us-west-1 746614075791.dkr.ecr.us-west-1.amazonaws.com
us-west-2 246618743249.dkr.ecr.us-west-2.amazonaws.com
us-east-1 683313688378.dkr.ecr.us-east-1.amazonaws.com
us-east-2 257758044811.dkr.ecr.us-east-2.amazonaws.com
ap-northeast-1 354813040037.dkr.ecr.ap-northeast-1.amazonaws.com
ap-northeast-2 366743142698.dkr.ecr.ap-northeast-2.amazonaws.com
ap-southeast-1 121021644041.dkr.ecr.ap-southeast-1.amazonaws.com
ap-southeast-2 783357654285.dkr.ecr.ap-southeast-2.amazonaws.com
ap-south-1 720646828776.dkr.ecr.ap-south-1.amazonaws.com
ap us-east-1 651117190479.dkr.ecr.ap-east-1.amazonaws.com
ca-central-1 341280168497.dkr.ecr.ca-central-1.amazonaws.com
cn-north-1 450853457545.dkr.ecr.cn-north-1.amazonaws.com.cn
cn-northwest-1 451049120500.dkr.ecr.cn-northwest-1.amazonaws.com.cn
eu-central-1 492215442770.dkr.ecr.eu-central-1.amazonaws.com
eu-north-1 662702820516.dkr.ecr.eu-north-1.amazonaws.com
eu-west-1 141502667606.dkr.ecr.eu-west-1.amazonaws.com
eu-west-2 764974769150.dkr.ecr.eu-west-2.amazonaws.com
eu-west-3 659782779980.dkr.ecr.eu-west-3.amazonaws.com
me-south-1 801668240914.dkr.ecr.me-south-1.amazonaws.com
sa-east-1 737474898029.dkr.ecr.sa-east-1.amazonaws.com
us-gov-west-1 414596584902.dkr.ecr.us-gov-west-1.amazonaws.com

Utilisez les chemins d'accès et le mode d'entrée d'entraînement comme suit :

  • Pour créer une tâche d'entraînement (avec une demande à l'API CreateTrainingJob), spécifiez le chemin de registre Docker et le mode d'entrée d'entraînement pour l'image d'entraînement. Vous créez une tâche d'entraînement pour entraîner un modèle à l'aide d'un ensemble de données spécifique.

     

  • Pour créer un modèle (avec une demande CreateModel), spécifiez le chemin de l'image d'inférence dans le registre Docker. Amazon SageMaker lance les instances de calcul de Machine Learning qui sont basées sur la configuration de point de terminaison et déploie le modèle, qui comprend les artefacts (le résultat de l'entraînement du modèle).