SageMaker JumpStart - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker JumpStart

SageMaker JumpStart bietet vortrainierte Open-Source-Modelle für eine Vielzahl von Problemtypen, die Ihnen den Einstieg in das maschinelle Lernen erleichtern. Sie können diese Modelle vor der Bereitstellung schrittweise trainieren und tunen. JumpStart bietet auch Lösungsvorlagen, die eine Infrastruktur für allgemeine Anwendungsfälle einrichten, und ausführbare Beispiel-Notebooks für maschinelles Lernen mit SageMaker.

Sie können über die JumpStart-Zielseite in Amazon auf die vortrainierten Modelle, Lösungsvorlagen und Beispiele zugreifen SageMaker Studiostudio. Die folgenden Schritte zeigen Ihnen, wie Sie auf JumpStart Modelle und Lösungen mit Amazon SageMaker Studiostudio.

Sie können auf die Modelle auch über die SageMaker Python SDK. Weitere Informationen zur Verwendung der Verwendung von finden Sie JumpStart modelle programmgesteuert über API, sieheVerwenden von SageMaker JumpStart-Algorithmen mit vortrainierten Modellenaus.

Öffnen Sie JumpStart

In Amazon SageMaker Studio, offen JumpStart indem Sie einen der Folgenden verwenden:

  • Die JumpStart Launcher imErste SchritteAbschnitts erstellt.

  • Die JumpStart ( 
          The JumpStart icon.
        ) imLinke Seitenleisteaus.

  • DieDurchsuchen von JumpStartim Bereich „gestartete Assets“ -Schaltfläche.


          SageMaker Studio-Schnittstelle mit JumpStart Launcher JumpStart -Symbol und Stöbern JumpStart .
Wichtig

Vor dem Herunterladen oder Verwenden von Inhalten von Drittanbietern: Sie sind dafür verantwortlich, alle geltenden Lizenzbedingungen zu überprüfen und einzuhalten und sicherzustellen, dass sie für Ihren Anwendungsfall akzeptabel sind.

Verwendung von JumpStart

From SageMaker Auf der JumpStart-Zielseite können Sie nach Lösungen, Modellen, Notebooks und anderen Ressourcen suchen. Sie können auch Ihre derzeit eingeführten Lösungen, Endpunkte und Schulungsjobs anzeigen. Verwendung der JumpStart Suchleiste können Sie nach interessanten Themen suchen.


      The SageMaker JumpStart landing page with search bar and autosuggest options.

Sie finden JumpStart Ressourcen mithilfe der Suche oder durch Durchsuchen jeder Kategorie, die dem Suchfeld folgt:

  • Vorgestellt— Die neuesten oder am häufigsten verwendeten Lösungen, Modelle und Beispiele.

  • Lösungen— Starten Sie in einem Schritt umfassende Lösungen für maschinelles Lernen, die binden SageMaker auf SonstigesAWS-Services. SelectAlle Lösungen entdeckenum alle verfügbaren Lösungen anzuzeigen.

  • Modelle— Finden Sie aus der Sammlung von Text, Vision und Tabellenmodellen ein Modell, das Ihren Anforderungen entspricht. Sie können die Sammlung nach Problemtypen, Datentypen und Frameworks filtern. Stellen Sie dann vortrainierte Modelle für die Bildklassifizierung und Objekterkennung in einem Schritt bereit und verfeinern Sie sie. SelectAlle Modelle entdeckenum alle verfügbaren Modelle zu sehen.

  • Ressourcen— Verwenden Sie Beispiel-Notebooks, Blogs und Video-Tutorials, um Ihre Problemtypen zu lernen und zu starten.

    • Beispiel-Notebooks— Führen Sie Beispiel-Notebooks aus, die verwenden SageMaker Funktionen wie Spot-Instance-Schulungen und Experimente in einer Vielzahl von Modelltypen und Anwendungsfällen.

    • Blogs— Lesen Sie Details und Lösungen von Experten für maschinelles Lernen, die von Amazon gehostet werden.

    • Video-Tutorials— Sehen Sie sich Video-Tutorials an für SageMaker Funktionen und Anwendungsfälle für maschinelles Lernen von Experten für maschinelles Lernen, die von Amazon gehostet werden.

Lösungs-Vorlagen

From JumpStart Zielseite erhalten Sie Lösungsvorlagen, die die vollständige Infrastruktur für allgemeine Anwendungsfälle einrichten.

Wenn Sie eine Lösungsvorlage wählen, JumpStart zeigt eine Beschreibung der Lösung und einestarten. Wenn Sie wählenstartenerstellt JumpStart alle Ressourcen, die Sie zum Ausführen der Lösung benötigen. Dies beinhaltet Schulungs- und Modellhosting-Instanzen.

Nach JumpStart startet die Lösung JumpStart zeigt eineÖffnen eines Notebooks. Wählen Sie die Schaltfläche, um die bereitgestellten Notebooks zu verwenden und die Funktionen der Lösung zu erkunden. Wenn Artefakte generiert werden, während des Starts oder nach dem Ausführen der bereitgestellten Notebooks werden sie imGenerierte Artefaktetabelle. Sie können einzelne Artefakte mit dem Papierkorb-Symbol löschen ( 
          The trash icon for JumpStart.
        ) enthalten. Sie können alle Ressourcen der Lösung löschen, indem SieLösungsressourcen löschenaus.

Es folgt eine Liste mit verfügbaren Lösungsvorlagen:

Anwendungsfall Solution name (Name der Lösung) Beschreibung Melden Sie sich in der &console; an und öffnen Sie die Seite &ConsolePageURL;.
Prognosen für Zeitreihen Nachfrageprognosen Nachfrageprognosen für multivariate Zeitreihendaten unter Verwendung von drei hochmodernen Zeitreihenprognosealgorithmen: LSTNet,Prophet, undSageMaker DeepARaus.

GitHub“

Prognose der Kreditwürdigkeit Prognose der Kreditwürdigkeit von Unternehmen Multimodales (Langtext und tabellarisch) maschinelles Lernen für Qualitätskreditprognosen mitAWS AutoGluon Tabellarischeaus. GitHub“
Grafbasierte Kredit-Scoring Prognostizieren Sie Unternehmenskreditbewertungen mithilfe von Tabellendaten und einem Unternehmensnetzwerk durch Schulung einesGraph Neuronales Netzwerk GraphSageundAWS AutoGluon Tabellarische-Modell. In Amazon suchen SageMaker Studiostudio.
Erklären Sie Kreditentscheidungen Prognostizieren Sie den Kreditausfall in Kreditanträgen und geben Sie Erklärungen mitLightGBMundSHAP (ShapLey Additive Erklärungen)aus.

GitHub“

Extrahieren und analysieren Sie Daten aus Dokumenten Datenschutz für die Einstufung Anonymisieren von Textum die Privatsphäre der Benutzer bei der Stimmungsklassifizierung besser zu schützen.

GitHub“

Zusammenfassung von Dokumenten, Entitäts- und Beziehungsextraktion Dokumentenzusammenfassung, Entität und Beziehungsextraktion unter Verwendung derTransformatoren-Bibliothek in PyTorch.

GitHub“

Handschrifterkennung Erkennen Sie handgeschriebenen Text in Bildern, indem Sie eineObjekterkennungsmodellundHandschrifterkennungsmodellaus. Beschriften Sie Ihre eigenen Daten mitSageMaker Ground Truthaus. GitHub“
Ausfüllen fehlender Werte in tabellarischen Datensätzen Füllen Sie fehlende Werte in tabellarische Datensätze, indem Sie eineSageMaker AutoPilot-Modell.

GitHub“

Betrugserkennung Erkennen böswilliger Benutzer und Transaktionen Erkennen Sie potenziell betrügerische Aktivitäten bei Transaktionen automatisch mitSageMaker XGBoostmit der Over-Sampling-TechnikSynthetische Minderheiten-Überprobenahme(SCHLUG).

GitHub“

Betrugserkennung bei Finanztransaktionen mit Deep Graph-Bibliothek Erkennen Sie Betrug bei Finanztransaktionen durch Schulung einesGraph Faltungsnetzmit demDeep-Graph-Bibliothekund einSageMaker XGBoost-Modell.

GitHub“

Prädiktive Wartung Vorausschauende Wartung für Fahrzeugflotten Prognostizieren Sie Ausfälle der Fahrzeugflotte mithilfe von Fahrzeugsensor- und Wartungsinformationen mit einem Faltungsmodell für neuronale Netze.

GitHub“

Vorausschauende Wartung für die Fertigung Sagen Sie die verbleibende Nutzungsdauer für jeden Sensor voraus, indem Sie einegestapeltes Bidirektionales neuronales LSTM-NetzModell unter Verwendung historischer Sensorwerte.

GitHub“

Computervision Erkennung von Produktfehlern in Bildern Identifizieren Sie fehlerhafte Regionen in Produktbildern, indem Sie eineObjekterkennungsmodellaus.

GitHub“

Churn-Vorhersage Vorhersage mit Text abwandern Vorhersage der Abwanderung mit numerischen, kategorischen und textuellen Merkmalen mitBERT-EncoderundRandomForestClassifieraus.

GitHub“

Personalisierte Empfehlungen Entity-Auflösung in Identitätsdiagrammen mit Deep Graph-Bibliothek Führen Sie geräteübergreifende Entity-Verknüpfungen für Online-Werbung durch Schulung einesGraph FaltungsnetzmitDeep-Graph-Bibliothekaus.

GitHub“

Kaufen von Modellierung Sagen Sie voraus, ob ein Kunde einen Kauf tätigt, indem Sie eineSageMaker XGBoost-Modell.

GitHub“

Bestärkendes Lernen Verstärkungslernen für Battlesnake KI-Wettbewerbe Stellen Sie einen Workflow zur Verstärkung des Lernens für Schulungen und Schlussfolgerungen zur VerfügungBattleSnakeKI-Wettbewerbe.

GitHub“

Verteiltes Verstärkungslernen für Procgen Challenge Starterkit für verteiltes Verstärkungslernen fürNeurIPs 2020 ProcgenHerausforderung für das Reinforcement Learning. GitHub“

Modelle

JumpStart unterstützt Modelle aus fünfzehn der beliebtesten Problemtypen. Von den unterstützten Problemtypen sind Vision- und NLP-bezogene Typen insgesamt dreizehn. Es gibt acht Problemtypen, die inkrementelles Training und Feinabstimmung unterstützen. Weitere Informationen zum inkrementellen Training und zur Hyperparameteroptimierung finden Sie unterAutomatische Modelloptimierung von Sage. JumpStart unterstützt auch vier gängige Algorithmen für die tabellarische Datenmodellierung.

Sie können Modelle von der JumpStart Landingpage im Studio. Wenn Sie ein Modell auswählen, enthält die Modelldetailseite Informationen zum Modell, und Sie können Ihr Modell in wenigen Schritten trainieren und bereitstellen. Der Beschreibungsabschnitt beschreibt, was Sie mit dem Modell machen können, die erwarteten Arten von Ein- und Ausgängen und den Datentyp, der für die Feinabstimmung Ihres Modells benötigt wird.

Sie können Modelle auch programmgesteuert mit demSageMaker Python SDKaus.

Die Liste der Problemtypen und Links zu ihren Beispiel-Jupyter-Notebooks ist in der folgenden Tabelle zusammengefasst. Für eine vollständige Liste von JumpStart Modelle, sieheJumpStart Verfügbare Modelltabelleaus.

Problemtypen Unterstützt Inferenz bei vortrainierten Modellen Trainierbar für einen benutzerdefinierten Datensatz Unterstützte Frameworks Beispiel-Notebooks
Bildklassifizierung Ja Ja

PyTorch, TensorFlow

Einführung in JumpStart - Bildklassifizierung

Objekterkennung Ja Ja PyTorch, TensorFlow, MXNet

Einführung in JumpStart - Objekterkennung

Semantische Segmentierung Ja Ja MXNet

Einführung in JumpStart - Semantische Segmentierung

Instanzsegmentierung Ja Ja MXNet

Einführung in JumpStart - Instanzsegmentierung

Einbetten von Bildern Ja Nein TensorFlow

Einführung in JumpStart - Bild-Einbetten

Textklassifizierung Ja Ja TensorFlow

Einführung in JumpStart - Textklassifizierung

Satzpaar-Klassifizierung Ja Ja TensorFlow, Umarmendes Gesicht

Einführung in JumpStart - Satzpaar-Klassifizierung

Beantwortung der Frage Ja Ja PyTorch

Einführung in JumpStart — Beantwortung von Fragen

Benannte Entitäten Ja Nein Umarmendes Gesicht

Einführung in JumpStart - Entity Recognition

Zusammenfassung des Textes Ja Nein Umarmendes Gesicht

Einführung in JumpStart - Zusammenfassung des Textes

Texterzeugung Ja Nein Umarmendes Gesicht

Einführung in JumpStart - Texterzeugung

Maschinelle Übersetzung Ja Nein Umarmendes Gesicht

Einführung in JumpStart - Maschinelle Übersetzung

Einbetten von Text Ja Nein TensorFlow

Einführung in JumpStart - Einbetten von Texten

Tabellarische Klassifizierung Ja Ja LightGBM, CatBoost, XgBoost, Linearer Lernender

Einführung in JumpStart - Tabellarische Klassifizierung - LightGBM, CatBoost

Einführung in JumpStart - Tabellarische Klassifizierung - XGBoost, Linear Learner

Tabellarische Regression Ja Ja LightGBM, CatBoost, XgBoost, Linearer Lernender

Einführung in JumpStart - Tabellarische Regression - LightGBM, CatBoost

Einführung in JumpStart - Tabellarische Regression - XGBoost, Linear Learner

Bereitstellen eines Modells

Wenn Sie ein Modell von JumpStart aus bereitstellen, SageMaker hostet das Modell und stellt einen Endpunkt bereit, den Sie für Inferenzen verwenden können. JumpStart enthält auch ein Beispiel-Notebook, mit dem Sie nach der Bereitstellung auf das Modell zugreifen können.

Konfiguration der Modellbereitstellung

Nachdem Sie sich für ein Modell entschieden haben, wird derBereitstellen von Modellwird geöffnet. Klicken Sie aufBereitstellungskonfigurationum Ihre Modellbereitstellung zu konfigurieren.


          Deploy Model pane option to open settings for Deployment Configuration and Security Settings.

Der Standardinstanztyp für die Bereitstellung eines Modells hängt vom Modell ab. Der Instanztyp ist die Hardware, auf der der Trainingsjob ausgeführt wird. Im folgenden Beispiel wird derml.g4dn.xlarge-Instanz ist der Standardwert für dieses bestimmte BERT-Modell.

Sie können auch dieEndpoint name (Endpunktname)aus.


          JumpStart Deploy Model pane with Deployment Configuration open to select its
            settings.

Klicken Sie aufSicherheitseinstellungenum dieAWS Identity and Access Management(IAM) -Rolle, Amazon Virtual Private Cloud (Amazon VPC) und Verschlüsselungsschlüssel für das Modell.


          JumpStart Deploy Model pane with Security Settings open to select its
            settings.

Sicherheit für Modellbereitstellung

Wenn Sie ein Modell mit JumpStart bereitstellen, können Sie eine IAM-Rolle, Amazon VPC und Verschlüsselungsschlüssel für das Modell angeben. Wenn Sie für diese Einträge keine Werte angeben: Die Standard-IAM-Rolle ist Your Studio-Laufzeitrolle; Standardverschlüsselung wird verwendet; es wird keine Amazon VPC verwendet.

IAM role (IAM-Rolle)

Sie können eine IAM-Rolle auswählen, die im Rahmen von Schulungsjobs und Hosting-Jobs übergeben wird. SageMaker verwendet diese Rolle, um auf Trainingsdaten und Modellartefakte zuzugreifen. Wenn Sie keine IAM-Rolle auswählen, SageMaker stellt das Modell mit Ihrer Studio-Laufzeitrolle bereit. Weitere Informationen zu IAM-Rollen finden Sie unterIdentity and Access Management für Amazon SageMakeraus.

Die Rolle, die Sie übergeben, muss Zugriff auf die Ressourcen haben, die das Modell benötigt, und muss alle folgenden Punkte enthalten.

Anmerkung

Sie können die Amazon S3 S3-Berechtigungen, die in jeder der folgenden Rollen gewährt wurden, einschränken. Verwenden Sie dazu den Amazon-Ressourcennamen (ARN) Ihres Amazon Simple Storage Service (Amazon S3) -Bucket und des JumpStart Amazon S3-Bucket.

{ "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListMultipartUploadParts" ], "Resources": [ "arn:aws:s3:<region>::bucket/jumpstart-cache-prod-<region>/*", "arn:aws:s3:<region>:<account>:bucket/*", ] },{ "Effect": "Allow", "Action": [ "s3:ListBucket", ], "Resources": [ "arn:aws:s3:<region>::bucket/jumpstart-cache-prod-<region>", "arn:aws:s3:<region>:<account>:bucket", ]

IAM-Rolle suchen

Wenn Sie diese Option auswählen, müssen Sie eine vorhandene IAM-Rolle aus der Dropdown-Liste auswählen.


              JumpStart Security Settings IAM section with Find IAM role selected.

Input-IAM-Rolle

Wenn Sie diese Option auswählen, müssen Sie den ARN für eine vorhandene IAM-Rolle manuell eingeben. Wenn Ihre Studio-Laufzeitrolle oder Amazon VPC dieiam:list* call, müssen Sie diese Option verwenden, um eine vorhandene IAM-Rolle zu verwenden.


              JumpStart Security Settings IAM section with Input IAM role selected.

Amazon VPC

Alle JumpStart Modelle laufen im Isolationsmodus des Netzwerks. Nachdem der Modellcontainer erstellt wurde, können keine Anrufe mehr getätigt werden. Sie können eine Amazon VPC auswählen, die im Rahmen von Schulungsjobs und Hosting-Jobs bestanden wird. SageMaker Verwenden Sie diese Amazon VPC, um Ressourcen aus Ihrem Amazon S3 S3-Bucket zu verschieben und abzurufen. Diese Amazon VPC unterscheidet sich von der Amazon VPC, die den Zugriff auf das öffentliche Internet von Ihrer Studio-Instanz einschränkt. Weitere Informationen zur Studio Amazon VPC finden Sie unterVerbinden SageMaker Studio-Notebooks in einer VPC zu externen Ressourcenaus.

Die Amazon VPC, die Sie übergeben, benötigt keinen Zugriff auf das öffentliche Internet, benötigt jedoch Zugriff auf Amazon S3. Der Amazon VPC-Endpunkt für Amazon S3 muss den Zugriff auf mindestens die folgenden Ressourcen ermöglichen, die das Modell benötigt.

{ "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListMultipartUploadParts" ], "Resources": [ "arn:aws:s3:<region>::bucket/jumpstart-cache-prod-<region>/*", "arn:aws:s3:<region>:<account>:bucket/*", ] },{ "Effect": "Allow", "Action": [ "s3:ListBucket", ], "Resources": [ "arn:aws:s3:<region>::bucket/jumpstart-cache-prod-<region>", "arn:aws:s3:<region>:<account>:bucket", ]

Wenn Sie keine Amazon VPC auswählen, wird keine Amazon VPC verwendet.

Finden Sie VPC

Wenn Sie diese Option auswählen, müssen Sie eine vorhandene Amazon VPC aus der Dropdown-Liste auswählen. Nachdem Sie eine Amazon VPC ausgewählt haben, müssen Sie ein Subnetz und eine Sicherheitsgruppe für Ihre Amazon VPC auswählen. Weitere Informationen zu Subnetzen und Sicherheitsgruppen finden Sie unter.Übersicht über VPCs und Subnetzeaus.


              JumpStart Security Settings VPC section with Find VPC selected.

Eingabe-VPC

Wenn Sie diese Option auswählen, müssen Sie manuell das Subnetz- und Sicherheitsgruppe auswählen, aus denen Ihre Amazon VPC besteht. Wenn Ihre Studio-Laufzeitrolle oder Amazon VPC dieec2:list*call, müssen Sie diese Option verwenden, um das Subnetz und die Sicherheitsgruppe auszuwählen.


              JumpStart Security Settings VPC section with Input VPC selected.

Verschlüsselungsschlüssel

Sie können einen auswählenAWS KMSSchlüssel, der im Rahmen von Ausbildungsjobs und Hosting Jobs übergeben wird. SageMaker verwendet diesen Schlüssel, um das Amazon EBS-Volume für den Container und das neu verpackte Modell in Amazon S3 für das Hosting von Jobs und die Ausgabe für Schulungsjobs zu verschlüsseln. Weitere Informationen zuAWS KMSSchlüssel, sieheAWS KMSSchlüsselaus.

Der Schlüssel, den Sie übergeben, muss der IAM-Rolle vertrauen, die Sie übergeben. Wenn Sie keine IAM-Rolle angeben, wird dieAWS KMSSchlüssel muss Ihrer Studio-Laufzeitrolle vertrauen.

Wenn Sie keinAWS KMS-Schlüssel, SageMaker bietet Standardverschlüsselung für die Daten im Amazon EBS-Volume und die Amazon S3 S3-Artefakte.

Suche nach Verschlüsselungsschlüsseln

Wenn Sie diese Option auswählen, müssen Sie vorhandene auswählenAWS KMSSchlüssel aus der Dropdown-Liste.


              JumpStart Security Settings encryption section with Find encryption keys selected.

Eingabeschlüssel

Wenn Sie diese Option auswählen, müssen Sie dieAWS KMSSchlüssel. Wenn Ihre Studio-Ausführungsrolle oder Amazon VPC diekms:list* call, Sie müssen diese Option verwenden, um vorhandene auszuwählenAWS KMSSchlüssel.


              JumpStart Security Settings encryption section with Input encryption keys selected.

Feinabstimmung eines Modells

Die Feinabstimmung trainiert ein vortrainiertes Modell auf einem neuen Datensatz ohne Training von Grund auf neu. Dieser Prozess, auch Transfer Learning genannt, kann genaue Modelle mit kleineren Datensätzen und weniger Trainingszeit erzeugen.

Feinabstimmung der Datenquelle

Wenn Sie ein Modell feinabstimmen, können Sie den Standarddataset verwenden oder Ihre eigenen Daten auswählen, die sich in einem Amazon S3 S3-Bucket befinden.

Um die verfügbaren Buckets zu durchsuchen, wählen SieSuchen Sie S3-Bucketaus. Diese Buckets sind durch die Berechtigungen beschränkt, die zum Einrichten Ihres Studio-Kontos verwendet werden. Sie können auch einen Amazon S3 S3-URI angeben, indem Sie wählenSpeicherort des Amazon-S3-Bucket-aus.


      JumpStart data source settings with default dataset selected.

Tipp

Um herauszufinden, wie Sie die Daten in Ihrem Bucket formatieren, wählen SieWeitere Informationenaus. Der Beschreibungsabschnitt für das Modell enthält detaillierte Informationen zu Ein- und Ausgängen. 

Für Textmodelle:

  • Der Bucket muss eine Datei data.csv haben.

  • Die erste Spalte muss eine eindeutige ganze Zahl für die Klassenbezeichnung sein. Beispiel:1,2,3,4,n

  • Die zweite Spalte muss eine Zeichenfolge sein.

  • Die zweite Spalte sollte den entsprechenden Text enthalten, der dem Typ und der Sprache für das Modell entspricht. 

Für Vision-Modelle:

  • Der Bucket muss so viele Unterverzeichnisse haben wie die Anzahl der Klassen.

  • Jedes Unterverzeichnis sollte Bilder enthalten, die im JPG-Format zu dieser Klasse gehören.

Anmerkung

Der Amazon S3 S3-Bucket muss sich im selben befindenAWS-Regionwo du rennst SageMaker Studio weil SageMaker lässt keine regionsübergreifenden Anforderungen zu.

Feinabstimmung der Bereitstellungskonfiguration

Die p3-Familie wird als schnellste für Deep-Learning-Training empfohlen, und dies wird zur Feinabstimmung eines Modells empfohlen. Die folgende Tabelle zeigt die Anzahl der GPUs in jedem Instance-Typ. Es gibt andere verfügbare Optionen, aus denen Sie wählen können, einschließlich p2- und g4-Instanztypen.

Instance-Typ GPUs
p3.2xlarge 1
p3.8xlarge 4
p3.16xlarge 8
p3dn.24xlarge 8

Hyperparameter

Sie können die Hyperparameter des Trainingsauftrags anpassen, die zur Feinabstimmung des Modells verwendet werden. 

Wenn Sie das Standarddataset für Textmodelle verwenden, ohne die Hyperparameter zu ändern, erhalten Sie als Ergebnis ein nahezu identisches Modell. Bei Vision-Modellen unterscheidet sich der Standarddatensatz von dem Datensatz, der zum Trainieren der vortrainierten Modelle verwendet wird, sodass Ihr Modell infolgedessen anders ist.

Sie haben die folgenden Hyperparameter-Optionen:

  • Epochen— Eine Epoche ist ein Zyklus durch den gesamten Datensatz. Mehrere Intervalle vervollständigen eine Charge, und mehrere Chargen vervollständigen schließlich eine Epoche. Mehrere Epochen werden ausgeführt, bis die Genauigkeit des Modells ein akzeptables Niveau erreicht oder wenn die Fehlerrate unter ein akzeptables Niveau fällt.

  • Learning rate (Lernrate)— Der Betrag, in dem Werte zwischen Epochen geändert werden sollten. Während das Modell verfeinert wird, werden seine internen Gewichte angestoßen und die Fehlerraten werden überprüft, um festzustellen, ob sich das Modell verbessert. Eine typische Lernrate beträgt 0,1 oder 0,01, wobei 0,01 eine viel kleinere Anpassung ist und dazu führen könnte, dass das Training lange dauert, bis 0,1 viel größer ist und dazu führen kann, dass das Training überschwindet. Es ist einer der primären Hyperparameter, die Sie für das Training Ihres Modells anpassen können. Beachten Sie, dass bei Textmodellen eine viel geringere Lernrate (5e-5 für BERT) zu einem genaueren Modell führen kann.

  • Stapel-Größe— Die Anzahl der Datensätze aus dem Datensatz, die für jedes Intervall ausgewählt werden sollen, das zum Training an die GPUs gesendet werden soll.

    In einem Bildbeispiel könnten Sie 32 Bilder pro GPU senden, also wäre 32 Ihre Chargengröße. Wenn Sie einen Instanztyp mit mehr als einer GPU wählen, wird der Stapel durch die Anzahl der GPUs geteilt. Die vorgeschlagene Chargengröße variiert je nach den Daten und dem Modell, das Sie verwenden. Wie Sie beispielsweise für Bilddaten optimieren, unterscheidet sich von der Art und Weise, wie Sie mit Sprachdaten umgehen.

    Im Instanztypdiagramm im Abschnitt zur Bereitstellungskonfiguration sehen Sie die Anzahl der GPUs pro Instance-Typ. Beginnen Sie mit einer empfohlenen Standard-Losgröße (z. B. 32 für ein Vision-Modell). Multiplizieren Sie dies dann mit der Anzahl der GPUs im ausgewählten Instanztyp. Wenn Sie z. B.p3.8xlarge, dies wäre 32 (Chargengröße) multipliziert mit 4 (GPUs) für insgesamt 128, da sich Ihre Chargengröße an die Anzahl der GPUs anpasst. Versuchen Sie bei einem Textmodell wie BERT mit einer Chargengröße von 64 zu beginnen und dann nach Bedarf zu reduzieren.


          JumpStart Hyperparameter settings with values entered.

Trainingsausgaben

Wenn der Feinabstimmungsprozess abgeschlossen ist, JumpStart enthält Informationen über das Modell: übergeordnetes Modell, Name des Schulungsauftrags, Amazon Resource Name (ARN) des Schulungsauftrags, Schulungszeit und Ausgabepfad. Im Ausgabepfad finden Sie Ihr neues Modell in einem Amazon S3 S3-Bucket. Die Ordnerstruktur verwendet den von Ihnen angegebenen Modellnamen und die Modelldatei befindet sich in einem/outputUnterordner und es heißt immermodel.tar.gzaus. 

Beispiel: s3://bucket/model-name/output/model.tar.gz