Einschränkungen und Überlegungen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einschränkungen und Überlegungen

Lesen Sie sich die folgenden Einschränkungen durch, um sicherzustellen, dass Ihre Notebook-Aufträge erfolgreich abgeschlossen werden. Studio verwendet Papermill zur Ausführung von Notebooks. Möglicherweise müssen Sie die Jupyter Notebooks aktualisieren, um sie an die Anforderungen von Papermill anzupassen. Es gibt auch Einschränkungen in Bezug auf den Inhalt von LCC-Skripten und wichtige Informationen zur VPC-Konfiguration, die es zu verstehen gilt.

JupyterLab Version

JupyterLab Versionen 3.0 und höher werden unterstützt.

Installation von Paketen, die einen Kernel-Neustart erfordern

Papermill unterstützt nicht den Aufruf von pip install zur Installation von Paketen, die einen Neustart des Kernels erfordern. Verwenden Sie es in diesem Fall pip install in einem Initialisierungsskript. Bei einer Paketinstallation, für die kein Kernel-Neustart erforderlich ist, können Sie trotzdem pip install in das Notebook aufnehmen.

Bei Jupyter registrierte Kernel- und Sprachnamen

Papermill registriert einen Übersetzer für bestimmte Kernel und Sprachen. Wenn Sie Ihre eigene Instance (BYOI) mitbringen, verwenden Sie einen Standard-Kernelnamen, wie im folgenden Codeausschnitt dargestellt:

papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)

Parameter und Grenzwerte für Umgebungsvariablen

Parameter und Grenzwerte für Umgebungsvariablen. Wenn Sie Ihren Notebook-Auftrag erstellen, erhält er die von Ihnen angegebenen Parameter und Umgebungsvariablen. Sie können bis zu 100 Parameter übergeben. Jeder Parametername kann bis zu 256 Zeichen lang sein, und der zugehörige Wert kann bis zu 2500 Zeichen lang sein. Wenn Sie Umgebungsvariablen übergeben, können Sie bis zu 28 Variablen übergeben. Der Variablenname und der zugehörige Wert können bis zu 512 Zeichen lang sein. Wenn Sie mehr als 28 Umgebungsvariablen benötigen, verwenden Sie zusätzliche Umgebungsvariablen in einem Initialisierungsskript, bei dem die Anzahl der Umgebungsvariablen, die Sie verwenden können, unbegrenzt ist.

Jobs und Jobdefinitionen anzeigen

Jobs und Jobdefinitionen anzeigen Wenn Sie Ihren Notebook-Job in der Studio-Benutzeroberfläche im JupyterLab Notizbuch planen, können Sie Ihre Notebook-Jobs und Ihre Notebook-Jobdefinitionen in der Studio-Benutzeroberfläche anzeigen. Wenn Sie Ihren Notebook-Job mit dem SageMaker Python SDK geplant haben, können Sie nur Ihre Jobs anzeigen — der SageMaker Python SDK-Notebook-Job-Schritt erstellt keine Jobdefinitionen. Um Ihre Jobs anzuzeigen, müssen Sie Ihrer Notebook-Job-Step-Instanz auch zusätzliche Tags hinzufügen. Details hierzu finden Sie unter Sehen Sie sich Ihre Notebook-Jobs im Studio-UI-Dashboard an.

Image

Sie müssen Bildeinschränkungen verwalten, je nachdem, ob Sie Notebook-Jobs in Studio oder den SageMaker Python SDK-Notebook-Job-Schritt in einer Pipeline ausführen.

Bildeinschränkungen für SageMaker Notebook-Jobs (Studio)

Image- und Kernel-Unterstützung. Der Treiber, der Ihren Notebook-Auftrag startet, geht von folgenden Voraussetzungen aus:

  • Eine grundlegende Python-Laufzeitumgebung ist in den Studio- oder bring-your-own (BYO-) Images installiert und ist die Standardeinstellung in der Shell.

  • Die grundlegende Python-Laufzeitumgebung umfasst den Jupyter-Client mit ordnungsgemäß konfigurierten Kernelspezifikationen.

  • Die grundlegende Python-Laufzeitumgebung enthält die pip Funktion, sodass der Notebook-Auftrag Systemabhängigkeiten installieren kann.

  • Bei Images mit mehreren Umgebungen sollte Ihr Initialisierungsskript zur richtigen kernelspezifischen Umgebung wechseln, bevor Sie notebookspezifische Pakete installieren. Sie sollten nach der Konfiguration der Kernel-Python-Laufzeitumgebung zur Standard-Python-Laufzeitumgebung zurückkehren, falls sie sich von der Kernel-Laufzeitumgebung unterscheidet.

Der Treiber, der Ihren Notebook-Auftrag startet, ist ein Bash-Skript, und Bash v4 muss unter /bin/bash verfügbar sein.

Root-Rechte auf bring-your-own-images (BYOI). Sie benötigen Root-Rechte für Ihre eigenen Studio-Images, entweder als Root-Benutzer oder über sudo Access. Wenn Sie kein Root-Benutzer sind, aber über sudo auf Root-Rechte zugreifen, verwenden Sie 1000/100 als UID/GID.

Bildeinschränkungen für SageMaker Python SDK-Notebook-Jobs

Der Notebook-Job-Schritt unterstützt die folgenden Bilder:

Bei der Schaffung von Arbeitsplätzen verwendete VPC-Subnetze

Wenn Sie eine VPC verwenden, verwendet Studio Ihre privaten Subnetze, um Ihren Auftrag zu erstellen. Geben Sie ein bis fünf private Subnetze (und 1–15 Sicherheitsgruppen) an.

Wenn Sie eine VPC mit privaten Subnetzen verwenden, müssen Sie eine der folgenden Optionen wählen, um sicherzustellen, dass der Notebook-Auftrag eine Verbindung zu abhängigen Diensten oder Ressourcen herstellen kann:

  • Wenn der Job Zugriff auf einen AWS Dienst benötigt, der VPC-Schnittstellen-Endpunkte unterstützt, erstellen Sie einen Endpunkt, um eine Verbindung mit dem Dienst herzustellen. Eine Liste der Dienste, die Schnittstellen-Endpunkte unterstützen, finden Sie unter AWS Services that integration with. AWS PrivateLink Informationen zum Erstellen eines Schnittstellen-VPC-Endpunkts finden Sie unter Zugreifen auf einen AWS Dienst mithilfe eines Schnittstellen-VPC-Endpunkts. Es muss mindestens ein Amazon-S3-VPC-Endpunkt-Gateway bereitgestellt werden.

  • Wenn ein Notebook-Job Zugriff auf einen AWS Dienst benötigt, der keine VPC-Schnittstellen-Endpunkte unterstützt, oder auf eine Ressource außerhalb von AWS, erstellen Sie ein NAT-Gateway und konfigurieren Sie Ihre Sicherheitsgruppen so, dass ausgehende Verbindungen zugelassen werden. Informationen zum Einrichten eines NAT-Gateways für Ihre VPC finden Sie unter VPC mit öffentlichen und privaten Subnetzen (NAT) im Amazon Virtual Private Cloud Benutzerhandbuch.

Service Limits

Da der Notebook-Job-Scheduler auf SageMaker Pipelines, SageMaker Training und Amazon EventBridge Services basiert, unterliegen Ihre Notebook-Jobs ihren dienstspezifischen Kontingenten. Wenn Sie diese Kontingente überschreiten, werden Ihnen möglicherweise Fehlermeldungen im Zusammenhang mit diesen Diensten angezeigt. Beispielsweise gibt es Grenzwerte für die Anzahl der Pipelines, die Sie gleichzeitig ausführen können, und für die Anzahl der Regeln, die Sie für einen einzelnen Event-Bus einrichten können. Weitere Informationen zu SageMaker Kontingenten finden Sie unter Amazon SageMaker Endpoints and Quotas. Weitere Informationen zu EventBridge Kontingenten finden Sie unter EventBridge Amazon-Kontingente.