So führen Sie einen verteilten Schulungsauftrag mit der SageMaker Bibliothek für verteilte Datenparallelität aus - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So führen Sie einen verteilten Schulungsauftrag mit der SageMaker Bibliothek für verteilte Datenparallelität aus

Die Bibliothek für SageMaker verteilte Datenparallelität (SMDDP) ist benutzerfreundlich und bietet eine nahtlose Integration mit PyTorch.

Wenn Sie ein Deep-Learning-Modell mit der SMDDP-Bibliothek auf trainieren SageMaker, können Sie sich darauf konzentrieren, Ihr Trainingsskript und Ihr Modelltraining zu schreiben.

Importieren Sie zunächst die SMDDP-Bibliothek, um ihre kollektiven Operationen zu verwenden, die für optimiert sindAWS. Die folgenden Themen enthalten Anweisungen dazu, was Ihrem Trainingsskript hinzugefügt werden soll, je nachdem, welchen kollektiven Vorgang Sie optimieren möchten.