Información común sobre los algoritmos integrados - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Información común sobre los algoritmos integrados

En la siguiente tabla se muestran los parámetros de cada uno de los algoritmos proporcionados por Amazon SageMaker.

Nombre de algoritmo Nombre de canal Modo de entrada de capacitación Tipo de archivo Clase de instancia Paralelizable
AutoGluon-Tabular entrenamiento y validación (opcional) Archivos CSV CPU o GPU (solo instancia única) No
BlazingText capacitación Archivo o canalización Archivo de texto (una frase por línea con tokens separados por espacios) CPU o GPU (solo instancia única) No
CatBoost entrenamiento y validación (opcional) Archivos CSV CPU (solo instancia única) No
Previsión DeepAR capacitación y prueba (opcional) Archivos Líneas de JSON o Parquet CPU o GPU
Máquinas de factorización capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf CPU (GPU para datos densos)
Image Classification - MXNet capacitación y validación, (opcional) train_lst, validation_lst y modelo Archivo o canalización recordIO o archivos de imagen (.jpg o .png) GPU
Clasificación de imágenes - TensorFlow entrenamiento y validación Archivos archivos de imagen (.jpg, .jpeg o.png) CPU o GPU Sí (solo en múltiples GPU en una sola instancia)
Información de IP capacitación y validación (opcional) Archivos CSV CPU o GPU
K-Means capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf o CSV CPU o GPUCommon (dispositivo de GPU único en una o varias instancias) No
K-Nearest-Neighbors (k-NN) capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf o CSV CPU o GPU (dispositivo de GPU único en una o varias instancias)
LDA capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf o CSV CPU (solo instancia única) No
LightGBM entrenamiento/entrenar y validación (opcional) Archivos CSV CPU
Aprendiz lineal capacitación y validación (opcional), prueba o ambos Archivo o canalización recordIO-protobuf o CSV CPU o GPU
Modelo de temas neuronal capacitación y validación (opcional), prueba o ambos Archivo o canalización recordIO-protobuf o CSV CPU o GPU
Object2Vec capacitación y validación (opcional), prueba o ambos Archivos Líneas de JSON CPU o GPU (solo instancia única) No
Detección de objetos - MXNet capacitación y validación, (opcional) train_annotation, validation_annotation y modelo Archivo o canalización recordIO o archivos de imagen (.jpg o .png) GPU
Detección de objetos - TensorFlow entrenamiento y validación Archivos archivos de imagen (.jpg, .jpeg o.png) GPU Sí (solo en múltiples GPU en una sola instancia)
PCA capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf o CSV CPU o GPU
Bosque de corte aleatorio capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf o CSV CPU
Segmentación semántica capacitación y validación, train_annotation, validation_annotation y (opcional) label_map y modelo Archivo o canalización Archivos de imagen GPU (solo instancia única) No
Modelo Seq2Seq capacitación, validación y vocabulario Archivos recordIO-protobuf GPU (solo instancia única) No
TabTransformer entrenamiento y validación (opcional) Archivos CSV CPU o GPU (solo instancia única) No
Clasificación de texto - TensorFlow entrenamiento y validación Archivos CSV CPU o GPU Sí (solo en múltiples GPU en una sola instancia)
XGBoost (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) capacitación y validación (opcional) Archivo o canalización CSV, LibSVM o Parquet CPU (o GPU para 1.2-1)

Los algoritmos que son paralelizables se pueden implementar en varias instancias de cómputo para capacitación distribuida.

En los temas siguientes se proporciona información sobre los formatos de datos, los tipos de instancias de Amazon EC2 recomendados y CloudWatch los registros comunes a todos los algoritmos integrados que proporciona Amazon. SageMaker

nota

Para buscar los URI de las imágenes de Docker de los algoritmos integrados gestionados por ellos SageMaker, consulte las rutas de registro y el código de ejemplo de Docker.