Allgemeine Informationen zu integrierten Algorithmen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Allgemeine Informationen zu integrierten Algorithmen

In der folgenden Tabelle sind die Parameter für jeden der von Amazon bereitgestellten Algorithmen aufgeführt. SageMaker.

Algorithmusname Kanalname Schulungseingabemodus Dateityp Instance class Parallelisierbar
AutoGluon-Tabelle Schulung und (optional) Validierung Datei CSV CPU oder GPU (nur Einzelinstanz) Nein
BlazingText "train" Datei oder Pipe Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token) CPU oder GPU (nur Einzelinstanz) Nein
CatBoost Schulung und (optional) Validierung Datei CSV CPU (nur einzelne Instance) Nein
DeepAR-Prognosen "train" und (optional) "test" Datei JSON-Zeilen oder Parquet CPU oder GPU Ja
Factorization Machines "train" und (optional) "test" Datei oder Pipe recordIO-protobuf CPU (GPU für Daten mit hoher Dichte) Ja
Bildklassifizierung - MXNet "train" und "validation", (optional) "train_lst", "validation_lst" und "model" Datei oder Pipe recordIO oder Bilddateien (JPEG oder PNG) GPU Ja
Bildklassifizierung - TensorFlow Schulung und Validierung Datei Bilddateien (.jpg, .jpeg oder .png) CPU oder GPU Ja (nur über mehrere GPUs in einer einzigen Instanz hinweg)
IP Insights "train" und (optional) "validation" Datei CSV CPU oder GPU Ja
K-Mittel "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) Nein
K-NNeighbors (k-Nearest-Neighbors "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPU (einzelnes GPU-Gerät auf einer oder mehreren Instances) Ja
LDA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU (nur einzelne Instance) Nein
Leichtes GBM Schulung und (optional) Validierung Datei CSV CPU (nur einzelne Instance) Nein
Lineares Lernen "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Neural Topic Modeling "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Object2Vec "train" und (optional) "validation", "test" oder beides Datei JSON Lines CPU oder GPU (nur Einzelinstanz) Nein
Objekterkennung "train" und "validation", (optional) "train_annotation", "validation_annotation" und "model" Datei oder Pipe recordIO oder Bilddateien (JPEG oder PNG) GPU Ja
PCA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Random Cut Forest "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU Ja
Semantische Segmentierung "train" und "validation", "train_annotation", "validation_annotation" und (optional) "label_map" und "model" Datei oder Pipe Abbildungsdateien GPU (nur einzelne Instance) Nein
Seq2Seq Modeling "train", "validation" und "vocab" Datei recordIO-protobuf GPU (nur einzelne Instance) Nein
TabTransformer Schulung und (optional) Validierung Datei CSV CPU oder GPU (nur Einzelinstanz) Nein
XGBoost (0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21) "train" und (optional) "validation" Datei oder Pipe CSV, LibSVM oder Parquet CPU (oder GPU für 1.2-1) Ja

Algorithmen, die parallelisierbar sind, lassen sich für verteilte Schulungen auf mehreren Datenverarbeitungs-Instances bereitstellen.

Die folgenden Themen enthalten Informationen zu Docker-Registrierungspfaden, Datenformaten, empfohlenen Amazon EC2 EC2-Instance-Typen und CloudWatch Protokolle, die allen von Amazon bereitgestellten integrierten Algorithmen gemeinsam sind SageMaker.