Häufige Informationen zu integrierten Algorithmen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Häufige Informationen zu integrierten Algorithmen

In der folgenden Tabelle sind Parameter für jeden der von Amazon SageMaker bereitgestellten Algorithmen aufgelistet.

Algorithmusname Kanalname Schulungseingabemodus Dateityp Instance class Parallelisierbar
BlazingText "train" Datei oder Pipe Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token) GPU (nur einzelne Instance) oder CPU Nein
DeepAR-Prognosen "train" und (optional) "test" Datei JSON-Zeilen oder Parquet GPU oder CPU Ja
Factorization Machines "train" und (optional) "test" Datei oder Pipe recordIO-protobuf CPU (GPU für Daten mit hoher Dichte) Ja
Bildklassifikation "train" und "validation", (optional) "train_lst", "validation_lst" und "model" Datei oder Pipe recordIO oder Bilddateien (JPEG oder PNG) GPU Ja
IP Insights "train" und (optional) "validation" Datei CSV CPU oder GPU Ja
k-means "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) Nein
k-nearest-neighbor (k-NN) "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPU (einzelnes GPU-Gerät auf einer oder mehreren Instances) Ja

LDA

"train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU (nur einzelne Instance) Nein
Lineares Lernen "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Neural Topic Modeling "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV GPU oder CPU Ja
Object2Vec "train" und (optional) "validation", "test" oder beides Datei JSON Lines GPU oder CPU (nur einzelne Instance) Nein
Objekterkennung "train" und "validation", (optional) "train_annotation", "validation_annotation" und "model" Datei oder Pipe recordIO oder Bilddateien (JPEG oder PNG) GPU Ja
PCA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV GPU oder CPU Ja
Random Cut Forest "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU Ja
Semantische Segmentierung "train" und "validation", "train_annotation", "validation_annotation" und (optional) "label_map" und "model" Datei oder Pipe Abbildungsdateien GPU (nur einzelne Instance) Nein

Seq2Seq Modeling

"train", "validation" und "vocab" Datei recordIO-protobuf GPU (nur einzelne Instance) Nein
XGBoost (0.90-1, 0.90-2, 1.0-1, 1.0-1, 1.2-21 "train" und (optional) "validation" Datei oder Pipe CSV, LibSVM oder Parkett CPU (oder GPU für 1.2-1) Ja

Algorithmen, die parallelisierbar sind, lassen sich für verteilte Schulungen auf mehreren Datenverarbeitungs-Instances bereitstellen.

Die folgenden Themen enthalten Informationen zu Docker-Registrierungspfaden, Datenformaten, empfohlenen Amazon EC2 Instance-Typen und CloudWatch Protokollen, die für alle integrierten Algorithmen von Amazon SageMaker verwendet werden.