Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Schnellstart: Erstellen Sie eine SageMaker Sandbox-Domain, um EMR Amazon-Cluster in Studio zu starten
Dieser Abschnitt führt Sie durch die schnelle Einrichtung einer vollständigen Testumgebung in Amazon SageMaker Studio. Sie werden eine neue Studio-Domain erstellen, mit der Benutzer neue EMR Amazon-Cluster direkt von Studio aus starten können. Die Schritte stellen ein Beispiel-Notebook dar, das Sie mit einem EMR Amazon-Cluster verbinden können, um es zu starten Spark Arbeitslasten. Mit diesem Notizbuch erstellen Sie ein Retrieval Augmented Generation System (RAG) mithilfe der verteilten Verarbeitungs- und OpenSearch Vektordatenbank von Amazon EMR Spark.
Anmerkung
Um zu beginnen, melden Sie sich bei der AWS Management-Konsole mit einem AWS Identity and Access Management (IAM) Benutzerkonto mit Administratorberechtigungen. Für Informationen darüber, wie Sie sich für ein registrieren können AWS Ein Konto erstellen und einen Benutzer mit Administratorzugriff erstellen, finden Sie unter SageMaker Voraussetzungen für Amazon.
So richten Sie Ihre Studio-Testumgebung ein und beginnen mit der Ausführung Spark Jobs:
- Schritt 1: Erstellen Sie eine SageMaker Domain für den Start von EMR Amazon-Clustern in Studio
- Schritt 2: Starten Sie einen neuen EMR Amazon-Cluster über die Studio-Benutzeroberfläche
- Schritt 3: Connect ein JupyterLab Notebook mit dem EMR Amazon-Cluster
- Schritt 4: Reinigen Sie Ihre AWS CloudFormation Stack
Schritt 1: Erstellen Sie eine SageMaker Domain für den Start von EMR Amazon-Clustern in Studio
In den folgenden Schritten wenden Sie eine an AWS CloudFormation stapeln, um automatisch eine neue SageMaker Domain zu erstellen. Der Stack erstellt auch ein Benutzerprofil und konfiguriert die benötigte Umgebung und die erforderlichen Berechtigungen. Die SageMaker Domain ist so konfiguriert, dass Sie EMR Amazon-Cluster direkt von Studio aus starten können. In diesem Beispiel werden die EMR Amazon-Cluster in demselben erstellt AWS
Konto wie SageMaker ohne Authentifizierung. Sie können weitere finden AWS CloudFormation Stacks, die verschiedene Authentifizierungsmethoden wie Kerberos unterstützen, befinden sich im Repository getting_started.
Anmerkung
SageMaker erlaubt 5 Studio-Domänen pro AWS Konto und AWS-Region standardmäßig. Stellen Sie sicher, dass Ihr Konto nicht mehr als 4 Domains in Ihrer Region hat, bevor Sie Ihren Stack erstellen.
Gehen Sie wie folgt vor, um eine SageMaker Domain für den Start von EMR Amazon-Clustern von Studio aus einzurichten.
-
Laden Sie die Rohdatei davon herunter AWS CloudFormation Vorlage
aus dem sagemaker-studio-emr
GitHub Repository. -
Gehe zum AWS CloudFormation Konsole: https://console.aws.amazon.com/cloudformation
-
Wählen Sie Stack erstellen und wählen Sie im Drop-down-Menü die Option Mit neuen Ressourcen (Standard) aus.
-
In Schritt 1:
-
Wählen Sie im Abschnitt Vorlage vorbereiten die Option Bestehende Vorlage auswählen aus.
-
Wählen Sie im Abschnitt Specify template (Vorlage angeben) die Option Upload a template file (Vorlagendatei hochladen) aus.
-
Laden Sie die heruntergeladene Datei hoch AWS CloudFormation Vorlage und wählen Sie Weiter.
-
-
Geben Sie in Schritt 2 einen Stack-Namen ein und wählen Sie SageMakerDomainNamedann Weiter.
-
Behalten Sie in Schritt 3 alle Standardwerte bei und wählen Sie Weiter.
-
Markieren Sie in Schritt 4 das Kästchen zur Bestätigung der Ressourcenerstellung und wählen Sie Stapel erstellen aus. Dadurch wird eine Studio-Domain in Ihrem Konto und Ihrer Region erstellt.
Schritt 2: Starten Sie einen neuen EMR Amazon-Cluster über die Studio-Benutzeroberfläche
In den folgenden Schritten erstellen Sie über die Studio-Benutzeroberfläche einen neuen EMR Amazon-Cluster.
-
Gehen Sie zur SageMaker Konsole unter https://console.aws.amazon.com/sagemaker/
und wählen Sie im linken Menü Domains aus. -
Klicken Sie auf Ihren Domainnamen G enerativeAIDomain, um die Seite mit den Domain-Details zu öffnen.
-
Starten Sie Studio vom Benutzerprofil aus
genai-user
. -
Gehen Sie im linken Navigationsbereich zu Daten und dann zu Amazon EMR Clusters.
-
Wählen Sie auf der EMR Amazon-Cluster-Seite Create aus. Wählen Sie die Vorlage SageMaker Studio Domain No Auth aus, EMR die von AWS CloudFormation stapeln und dann Weiter wählen.
-
Geben Sie einen Namen für den neuen EMR Amazon-Cluster ein. Aktualisieren Sie optional andere Parameter wie den Instance-Typ der Core- und Master-Knoten, das Leerlauf-Timeout oder die Anzahl der Kernknoten.
-
Wählen Sie Create resource aus, um den neuen EMR Amazon-Cluster zu starten.
Nachdem Sie den EMR Amazon-Cluster erstellt haben, folgen Sie dem Status auf der EMRCluster-Seite. Wenn sich der Status auf ändert
Running/Waiting
, ist Ihr EMR Amazon-Cluster bereit, in Studio verwendet zu werden.
Schritt 3: Connect ein JupyterLab Notebook mit dem EMR Amazon-Cluster
In den folgenden Schritten verbinden Sie ein Notebook mit Ihrem laufenden EMR Amazon-Cluster. JupyterLab In diesem Beispiel importieren Sie ein Notizbuch, mit dem Sie mithilfe der verteilten Verarbeitungs- und OpenSearch Vektordatenbank von Amazon EMR Spark ein Retrieval Augmented Generation (RAG) -System erstellen können.
-
Starten JupyterLab
Starten Sie die JupyterLab Anwendung in Studio.
-
Erstellen Sie einen privaten Bereich
Wenn Sie noch keinen Bereich für Ihre JupyterLab Anwendung erstellt haben, wählen Sie JupyterLab Bereich erstellen. Geben Sie einen Namen für den Bereich ein und behalten Sie den Status Privat für den Bereich bei. Behalten Sie für alle anderen Einstellungen die Standardwerte bei und wählen Sie dann Bereich erstellen.
Andernfalls führen Sie Ihren JupyterLab Space aus, um eine JupyterLab Anwendung zu starten.
-
Stellen Sie Ihre Modelle bereit LLM und betten Sie sie ein, um daraus Rückschlüsse zu ziehen
-
Wählen Sie im oberen Menü „Datei“, „Neu“ und dann „Terminal“.
-
Führen Sie im Terminal den folgenden Befehl aus.
wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-00-setup/Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb mkdir AWSGuides cd AWSGuides wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/AmazonSageMakerDeveloperGuide.pdf wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/EC2DeveloperGuide.pdf wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/S3DeveloperGuide.pdf
Dadurch wird das
Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb
Notizbuch in Ihr lokales Verzeichnis abgerufen und drei PDF Dateien in einen lokalenAWSGuides
Ordner heruntergeladen. -
Öffnen Sie
lab-00-setup/Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb
, behalten Sie denPython 3 (ipykernel)
Kernel und führen Sie jede Zelle aus.Warnung
Stellen Sie im Abschnitt Llama 2-Lizenzvereinbarung sicher, dass Sie den Llama2 akzeptieren, EULA bevor Sie fortfahren.
Das Notebook verwendet zwei Modelle,
Llama 2
undall-MiniLM-L6-v2 Models
eines für Inferenzzwecke.ml.g5.2xlarge
Die Bereitstellung der Modelle und die Erstellung der Endpunkte können einige Zeit in Anspruch nehmen.
-
-
Öffnen Sie Ihr Haupt-Notizbuch
Öffnen Sie Ihr Terminal und führen Sie den folgenden Befehl aus. JupyterLab
cd .. wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
Sie sollten das zusätzliche
Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
Notizbuch im linken Bereich von sehen JupyterLab. -
Wähle einen
PySpark
KernelÖffnen Sie Ihr
Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
Notizbuch und stellen Sie sicher, dass Sie denSparkMagic PySpark
Kernel verwenden. Sie können den Kernel oben rechts auf Ihrem Notebook wechseln. Wählen Sie den aktuellen Kernelnamen, um ein Kernelauswahl-Modal zu öffnen, und wählen Sie dannSparkMagic PySpark
. -
Connect Sie Ihr Notebook mit dem Cluster
-
Wählen Sie oben rechts in Ihrem Notizbuch Cluster aus. Diese Aktion öffnet ein modales Fenster, in dem alle laufenden Cluster aufgeführt sind, für deren Zugriff Sie berechtigt sind.
-
Wählen Sie Ihren Cluster und dann Connect aus. Ein neues modales Fenster zur Auswahl des Anmeldeinformationstyps wird geöffnet.
-
Wählen Sie Keine Anmeldeinformationen und dann Connect aus.
-
Eine Notebook-Zelle wird automatisch gefüllt und läuft. Die Notebook-Zelle lädt die
sagemaker_studio_analytics_extension.magics
Erweiterung, die Funktionen für die Verbindung mit dem EMR Amazon-Cluster bereitstellt. Anschließend verwendet es den%sm_analytics
magischen Befehl, um die Verbindung zu Ihrem EMR Amazon-Cluster und der Spark-Anwendung herzustellen.Anmerkung
Stellen Sie sicher, dass für die Verbindungszeichenfolge zu Ihrem EMR Amazon-Cluster der Authentifizierungstyp auf eingestellt ist
None
. Dies wird durch den Wert--auth-type None
im folgenden Beispiel veranschaulicht. Sie können das Feld bei Bedarf ändern.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --verify-certificate False --cluster-id
your-cluster-id
--auth-typeNone
--language python -
Sobald Sie die Verbindung erfolgreich hergestellt haben, sollte Ihre Ausgabenachricht in der Verbindungszelle Ihre
SparkSession
Details enthalten, einschließlich Ihrer Cluster-ID,YARN
Anwendungs-ID und eines Links zu Spark Benutzeroberfläche zur Überwachung Ihres Spark Jobs.
-
Sie sind bereit, das Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
Notizbuch zu benutzen. In diesem Beispiel-Notizbuch werden verteilte PySpark Workloads für den Aufbau eines RAG Systems mithilfe von LangChain und OpenSearch ausgeführt.
Schritt 4: Reinigen Sie Ihre AWS CloudFormation Stack
Wenn Sie fertig sind, stellen Sie sicher, dass Sie Ihre beiden Endpoints beenden und Ihre AWS CloudFormation stapeln, um weitere Ladevorgänge zu verhindern. Durch das Löschen des Stacks werden alle Ressourcen bereinigt, die vom Stack bereitgestellt wurden.
Um deine zu löschen AWS CloudFormation stapeln Sie, wenn Sie damit fertig sind
-
Gehe zum AWS CloudFormation Konsole: https://console.aws.amazon.com/cloudformation
-
Wählen Sie den Stack aus, den Sie löschen möchten. Sie können nach dem Namen suchen oder ihn in der Liste der Stapel finden.
-
Klicken Sie auf die Schaltfläche Löschen, um das Löschen des Stacks abzuschließen, und klicken Sie dann erneut auf Löschen, um zu bestätigen, dass dadurch alle vom Stapel erstellten Ressourcen gelöscht werden.
Warten Sie, bis das Löschen des Stacks abgeschlossen ist. Dies kann einige Minuten dauern. AWS CloudFormation bereinigt automatisch alle in der Stack-Vorlage definierten Ressourcen.
-
Stellen Sie sicher, dass alle vom Stack erstellten Ressourcen gelöscht wurden. Suchen Sie beispielsweise nach übrig gebliebenen EMR Amazon-Clustern.
Um die API Endpunkte für ein Modell zu entfernen
-
Gehe zur SageMaker Konsole: https://console.aws.amazon.com/sagemaker/
. -
Wählen Sie im linken Navigationsbereich Inference und dann Endpoints aus.
-
Wählen Sie den Endpunkt aus
hf-allminil6v2-embedding-ep
und wählen Sie dann in der Dropdownliste Aktionen die Option Löschen aus. Wiederholen Sie den Schritt für den Endpunktmeta-llama2-7b-chat-tg-ep
.