Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Información común sobre los algoritmos integrados
En la siguiente tabla se muestran los parámetros de cada uno de los algoritmos proporcionados por Amazon SageMaker.
Nombre de algoritmo | Nombre de canal | Modo de entrada de capacitación | Tipo de archivo | Clase de instancia | Paralelizable |
---|---|---|---|---|---|
AutoGluon-Tabular | entrenamiento y validación (opcional) | Archivos | CSV | CPU o GPU (solo instancia única) | No |
BlazingText | capacitación | Archivo o canalización | Archivo de texto (una frase por línea con tokens separados por espacios) | CPU o GPU (solo instancia única) | No |
CatBoost | entrenamiento y validación (opcional) | Archivos | CSV | CPU (solo instancia única) | No |
Previsión DeepAR | capacitación y prueba (opcional) | Archivos | Líneas de JSON o Parquet | CPU o GPU | Sí |
Máquinas de factorización | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf | CPU (GPU para datos densos) | Sí |
Image Classification - MXNet | capacitación y validación, (opcional) train_lst, validation_lst y modelo | Archivo o canalización | recordIO o archivos de imagen (.jpg o .png) | GPU | Sí |
Clasificación de imágenes - TensorFlow | entrenamiento y validación | Archivos | archivos de imagen (.jpg, .jpeg o.png) | CPU o GPU | Sí (solo en múltiples GPU en una sola instancia) |
Información de IP | capacitación y validación (opcional) | Archivos | CSV | CPU o GPU | Sí |
K-Means | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf o CSV | CPU o GPUCommon (dispositivo de GPU único en una o varias instancias) | No |
K-Nearest-Neighbors (k-NN) | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf o CSV | CPU o GPU (dispositivo de GPU único en una o varias instancias) | Sí |
LDA | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf o CSV | CPU (solo instancia única) | No |
LightGBM | entrenamiento/entrenar y validación (opcional) | Archivos | CSV | CPU | Sí |
Aprendiz lineal | capacitación y validación (opcional), prueba o ambos | Archivo o canalización | recordIO-protobuf o CSV | CPU o GPU | Sí |
Modelo de temas neuronal | capacitación y validación (opcional), prueba o ambos | Archivo o canalización | recordIO-protobuf o CSV | CPU o GPU | Sí |
Object2Vec | capacitación y validación (opcional), prueba o ambos | Archivos | Líneas de JSON | CPU o GPU (solo instancia única) | No |
Detección de objetos - MXNet | capacitación y validación, (opcional) train_annotation, validation_annotation y modelo | Archivo o canalización | recordIO o archivos de imagen (.jpg o .png) | GPU | Sí |
Detección de objetos - TensorFlow | entrenamiento y validación | Archivos | archivos de imagen (.jpg, .jpeg o.png) | GPU | Sí (solo en múltiples GPU en una sola instancia) |
PCA | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf o CSV | CPU o GPU | Sí |
Bosque de corte aleatorio | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf o CSV | CPU | Sí |
Segmentación semántica | capacitación y validación, train_annotation, validation_annotation y (opcional) label_map y modelo | Archivo o canalización | Archivos de imagen | GPU (solo instancia única) | No |
Modelo Seq2Seq | capacitación, validación y vocabulario | Archivos | recordIO-protobuf | GPU (solo instancia única) | No |
TabTransformer | entrenamiento y validación (opcional) | Archivos | CSV | CPU o GPU (solo instancia única) | No |
Clasificación de texto - TensorFlow | entrenamiento y validación | Archivos | CSV | CPU o GPU | Sí (solo en múltiples GPU en una sola instancia) |
XGBoost (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) | capacitación y validación (opcional) | Archivo o canalización | CSV, LibSVM o Parquet | CPU (o GPU para 1.2-1) | Sí |
Los algoritmos que son paralelizables se pueden implementar en varias instancias de cómputo para capacitación distribuida.
En los temas siguientes se proporciona información sobre los formatos de datos, los tipos de instancias de Amazon EC2 recomendados y CloudWatch los registros comunes a todos los algoritmos integrados que proporciona Amazon. SageMaker
nota
Para buscar los URI de las imágenes de Docker de los algoritmos integrados gestionados por ellos SageMaker, consulte las rutas de registro y el código de ejemplo de Docker.