Berechtigungsverwaltung Bereitstellen eines Modells

Stellen Sie Ihre Modelle auf einem Endpunkt bereit

In Amazon SageMaker Canvas können Sie Ihre Modelle auf einem Endpunkt bereitstellen, um Vorhersagen zu treffen. SageMaker AI stellt die ML-Infrastruktur bereit, mit der Sie Ihr Modell auf einem Endpunkt mit den von Ihnen ausgewählten Recheninstanzen hosten können. Anschließend können Sie den Endpunkt aufrufen (eine Prognoseanfrage senden) und anhand Ihres Modells eine Vorhersage in Echtzeit abrufen. Mit dieser Funktion können Sie Ihr Modell in der Produktion verwenden, um auf eingehende Anfragen zu antworten, und Sie können Ihr Modell in bestehende Anwendungen und Workflows integrieren.

Zu Beginn sollten Sie über ein Modell verfügen, das Sie bereitstellen möchten. Sie können von Ihnen erstellte benutzerdefinierte Modellversionen, Amazon SageMaker JumpStart Foundation-Modelle und fein abgestimmte JumpStart Foundation-Modelle bereitstellen. Für weitere Informationen zum Erstellen eines Modells in Canvas, siehe So funktionieren benutzerdefinierte Modelle. Weitere Informationen zu JumpStart Foundation-Modellen in Canvas finden Sie unterGenerative KI-Grundmodelle in SageMaker Canvas.

Lesen Sie den folgenden Abschnitt zur Rechteverwaltung und beginnen Sie dann im Abschnitt Modell bereitstellen mit der Erstellung neuer Bereitstellungen.

Berechtigungsverwaltung

Standardmäßig sind Sie berechtigt, Modelle auf SageMaker AI Hosting-Endpunkten bereitzustellen. SageMaker AI gewährt diese Berechtigungen für alle neuen und vorhandenen Canvas-Benutzerprofile über die AmazonSageMakerCanvasFullAccessRichtlinie, die der AWS IAM-Ausführungsrolle für die SageMaker AI-Domäne zugeordnet ist, die Ihre Canvas-Anwendung hostet.

Wenn Ihr Canvas-Administrator eine neue Domäne oder ein neues Benutzerprofil einrichtet, aktiviert SageMaker KI bei der Einrichtung der Domain und bei der Befolgung der erforderlichen Anweisungen in der die Voraussetzungen für die Einrichtung von Amazon SageMaker Canvas Berechtigungen für die Modellbereitstellung über die Option Direkte Bereitstellung von Canvas-Modellen aktivieren, die standardmäßig aktiviert ist.

Der Canvas-Administrator kann die Berechtigungen für die Modellbereitstellung auch auf Benutzerprofilebene verwalten. Wenn der Administrator beispielsweise beim Einrichten einer Domain nicht allen Benutzerprofilen Berechtigungen für die Modellbereitstellung gewähren möchte, kann er nach der Erstellung der Domäne bestimmten Benutzern Berechtigungen gewähren.

Das folgende Verfahren zeigt, wie Sie die Berechtigungen für die Modellbereitstellung für ein bestimmtes Benutzerprofil ändern:

Öffnen Sie die SageMaker AI-Konsole unter https://console.aws.amazon.com/sagemaker/.
Wählen Sie im linken Navigationsbereich Admin-Konfigurationen.
Wählen Sie unter Admin Konfigurationen die Option Domains aus.
Wählen Sie aus der Liste der Domänen die Domäne des Benutzerprofils aus.
Wählen Sie auf der Seite mit den Domänendetails die Registerkarte Benutzerprofile aus.
Wählen Sie Ihr Benutzerprofil aus.
Wählen Sie auf der Seite des Benutzerprofils den Tab App-Konfigurationen aus.
Wählen Sie im Bereich Canvas die Option Bearbeiten aus.
Aktivieren Sie im Bereich ML Ops-Konfiguration die Option Direkte Bereitstellung von Canvas-Modellen aktivieren, um Bereitstellungsberechtigungen zu aktivieren.
Wählen Sie Senden, um die Änderungen an Ihren Domain-Einstellungen zu speichern.

Das Benutzerprofil sollte jetzt über Berechtigungen zur Modellbereitstellung verfügen.

Stellen Sie nach der Erteilung der Berechtigungen für die Domäne oder das Benutzerprofil sicher, dass sich der Benutzer von seiner Canvas-Anwendung abmeldet und wieder anmeldet, um die Berechtigungsänderungen zu übernehmen.

Bereitstellen eines Modells

Um mit der Bereitstellung Ihres Modells zu beginnen, erstellen Sie eine neue Bereitstellung in Canvas und geben die Modellversion an, die Sie zusammen mit der ML-Infrastruktur bereitstellen möchten, z. B. den Typ und die Anzahl der Rechen-Instances, die Sie zum Hosten des Modells verwenden möchten.

Canvas schlägt basierend auf Ihrem Modelltyp einen Standardtyp und eine Standardanzahl von Instances vor. Sie können auch mehr über die verschiedenen SageMaker KI-Instance-Typen auf der Amazon SageMaker AI-Preisseite erfahren. Solange Ihr Endpunkt aktiv ist, werden Ihnen Gebühren auf der Grundlage der SageMaker KI-Instance-Preise berechnet.

Bei der JumpStart Bereitstellung von Basismodellen haben Sie auch die Möglichkeit, die Länge der Bereitstellungszeit anzugeben. Sie können das Modell auf unbestimmte Zeit auf einem Endpunkt bereitstellen (d. h. der Endpunkt ist aktiv, bis Sie die Bereitstellung löschen). Oder, wenn Sie den Endpunkt nur für einen kurzen Zeitraum benötigen und die Kosten senken möchten, können Sie das Modell für einen bestimmten Zeitraum auf einem Endpunkt bereitstellen. Danach fährt SageMaker KI den Endpunkt für Sie herunter.

Anmerkung

Wenn Sie ein Modell für einen bestimmten Zeitraum bereitstellen, bleiben Sie für die Dauer des Endpunkts bei der Canvas-Anwendung angemeldet. Wenn Sie sich von der Anwendung abmelden oder sie löschen, kann Canvas den Endpunkt zum angegebenen Zeitpunkt nicht herunterfahren.

Nachdem Ihr Modell auf einem Echtzeit-Inferenzendpunkt von SageMaker AI Hosting bereitgestellt wurde, können Sie damit beginnen, Vorhersagen zu treffen, indem Sie den Endpunkt aufrufen.

Es gibt verschiedene Möglichkeiten, ein Modell über die Canvas-Anwendung bereitzustellen. Sie können mit einer der folgenden Methoden auf die Modellbereitstellungsoption zugreifen:

Wählen Sie auf der Seite Meine Modelle der Canvas-Anwendung das Modell aus, das Sie bereitstellen möchten. Wählen Sie dann auf der Seite Versionen des Modells das Symbol Weitere Optionen ( ) neben einer Modellversion aus und wählen Sie Bereitstellen aus.
Wählen Sie auf der Detailseite für eine Modellversion auf der Registerkarte Analysieren die Option Bereitstellen aus.
Wenn Sie sich auf der Detailseite für eine Modellversion befinden, klicken Sie oben auf der Seite auf der Registerkarte Prognostizieren auf das Symbol Weitere Optionen ( ) und wählen Sie Bereitstellen aus.
Wählen Sie auf der Seite ML Ops der Canvas-Anwendung die Registerkarte Deployments und dann Create deployment aus.
JumpStart Fundamentmodelle und fein abgestimmte Fundamentmodelle finden Sie auf der Ready-to-use Modellseite der Canvas-Anwendung. Wählen Sie Inhalt generieren, extrahieren und zusammenfassen. Suchen Sie dann das JumpStart Foundation-Modell oder das fein abgestimmte Foundation-Modell, das Sie bereitstellen möchten. Wählen Sie das Modell aus und klicken Sie auf der Chat-Seite des Modells auf die Schaltfläche Bereitstellen.

Bei all diesen Methoden wird der Seitenbereich Deploy-Modell geöffnet, in dem Sie die Bereitstellungskonfiguration für Ihr Modell angeben. Um das Modell über diesen Bereich bereitzustellen, führen Sie die folgenden Schritte aus:

(Optional) Wenn Sie eine Bereitstellung auf der ML Ops-Seite erstellen, haben Sie die Möglichkeit, Modell und Version auszuwählen. Verwenden Sie die Dropdown-Menüs, um das Modell und die Modellversion auszuwählen, die Sie bereitstellen möchten.
Geben Sie einen Namen in das Feld Bereitstellungsname ein.
(Nur für JumpStart Basismodelle und fein abgestimmte Basismodelle) Wählen Sie eine Bereitstellungsdauer aus. Wählen Sie Unbegrenzt, um den Endpunkt aktiv zu lassen, bis Sie ihn herunterfahren, oder wählen Sie Dauer angeben und geben Sie dann den Zeitraum ein, für den der Endpunkt aktiv bleiben soll.
Zum Beispiel Instanztyp erkennt SageMaker KI einen Standard-Instance-Typ und eine Standard-Instance-Nummer, die für Ihr Modell geeignet sind. Sie können jedoch den Instance-Typ ändern, den Sie für das Hosten Ihres Modells verwenden möchten.

Anmerkung
Wenn das Instance-Kontingent für den ausgewählten Instance-Typ in Ihrem AWS Konto aufgebraucht ist, können Sie eine Erhöhung des Kontingents beantragen. Weitere Informationen zu den Standardkontingenten und dazu, wie Sie eine Erhöhung beantragen können, finden Sie unter Amazon SageMaker AI-Endpunkte und Kontingente im AWS Allgemeinen Referenzhandbuch.
Unter Anzahl der Instances können Sie die Anzahl der aktiven Instances festlegen, die für Ihren Endpunkt verwendet werden. SageMaker KI erkennt eine Standardnummer, die für Ihr Modell geeignet ist. Sie können diese Zahl jedoch ändern.
Wenn Sie bereit sind, Ihr Modell bereitzustellen, wählen Sie Bereitstellen aus.

Ihr Modell sollte jetzt auf einem Endpunkt bereitgestellt werden.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Registrieren Sie eine Modellversion in der AI-Modellregistrierung SageMaker

Sehen Sie sich Ihre Bereitstellungen an