Fehlerbehebung - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Fehlerbehebung

Wenn bei der Verwendung von Amazon SageMaker Data Wrangler ein Problem auftritt, empfehlen wir Ihnen Folgendes:

  • Wenn eine Fehlermeldung angezeigt wird, lesen Sie die Meldung und beheben Sie das Problem, wenn möglich.

  • Stellen Sie sicher, dass die IAM-Rolle Ihres Studio Classic-Benutzers über die erforderlichen Berechtigungen zum Ausführen der Aktion verfügt. Weitere Informationen finden Sie unter Sicherheit und Berechtigungen.

  • Wenn das Problem auftritt, wenn Sie versuchen, von einem anderen AWS Service wie Amazon Redshift oder Athena zu importieren, stellen Sie sicher, dass Sie die erforderlichen Berechtigungen und Ressourcen für den Datenimport konfiguriert haben. Weitere Informationen finden Sie unter Import.

  • Wenn Sie immer noch Probleme haben, wählen Sie oben rechts auf Ihrem Bildschirm Hilfe aus, um das Data Wrangler-Team zu kontaktieren. Weitere Informationen finden Sie in den folgenden Abbildungen.

Als letzten Ausweg können Sie versuchen, den Kernel, auf dem Data Wrangler läuft, neu zu starten.

  1. Speichern und beenden Sie die .flow-Datei, für die Sie den Kernel neu starten möchten.

  2. Wählen Sie das Symbol Running Terminals and Kernels aus, wie in der folgenden Abbildung gezeigt.

  3. Wählen Sie das Stop Symbol rechts neben der .flow-Datei, für die Sie den Kernel beenden möchten, wie in der folgenden Abbildung gezeigt.

  4. Aktualisieren Sie Ihren Browser.

  5. Öffnen Sie erneut die .flow-Datei, an der Sie gearbeitet haben.

Beheben von Problemen mit Amazon EMR

Verwenden Sie die folgenden Informationen bei Fehlern, die bei der Verwendung von Amazon EMR auftreten können.

  • Verbindungsfehler — Wenn die Verbindung mit der folgenden Meldung The IP address of the EMR cluster isn't private error message fehlschlägt, wurde Ihr Amazon EMR-Cluster möglicherweise nicht in einem privaten Subnetz gestartet. Als bewährte Methode für Sicherheit unterstützt Data Wrangler nur Verbindungen zu privaten Amazon EMR-Clustern. Wählen Sie ein privates EC2-Subnetz, in dem Sie einen EMR-Cluster starten.

  • Verbindung hängt und Timeout — Das Problem ist höchstwahrscheinlich auf ein Problem mit der Netzwerkkonnektivität zurückzuführen. Nachdem Sie eine Verbindung zum Cluster hergestellt haben, wird der Bildschirm nicht aktualisiert. Nach etwa 2 Minuten wird möglicherweise der folgende Fehler JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen. angezeigt.

    Die Fehler können zwei Hauptursachen haben:

    • Amazon EMR und Amazon SageMaker Studio Classic befinden sich in verschiedenen VPCs. Wir empfehlen, sowohl Amazon EMR als auch Studio Classic in derselben VPC zu starten. Sie können auch VPC Peering verwenden. Weitere Informationen finden Sie unter Was ist VPC Peering?

    • Der Amazon-EMR-Master-Sicherheitsgruppe fehlt die eingehende Datenverkehrsregel für die Sicherheitsgruppe von Amazon SageMaker Studio Classic auf dem für Presto verwendeten Port. Um das Problem zu beheben, lassen Sie eingehenden Verkehr auf Port 8889 zu.

  • Die Verbindung schlägt fehl, weil der Verbindungstyp falsch konfiguriert ist. Möglicherweise wird die folgende Fehlermeldung angezeigt: Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.

    Überprüfen Sie die Authentifizierungsmethode. Die Authentifizierungsmethode, die Sie in Data Wrangler angegeben haben, sollte mit der Authentifizierungsmethode übereinstimmen, die Sie auf dem Cluster verwenden.

  • Sie haben keine HDFS-Berechtigungen für die LDAP-Authentifizierung – Verwenden Sie die folgenden Anleitungen, um das Problem HDFS-Berechtigungen mithilfe von Linux-Anmeldeinformationen einrichten zu beheben. Sie können sich mit den folgenden Befehlen beim Cluster anmelden:

    hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
  • Fehler beim fehlenden Verbindungsschlüssel bei der LDAP-Authentifizierung — Möglicherweise wird die folgende Fehlermeldung angezeigt: Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD.

    Für die LDAP-Authentifizierung müssen Sie sowohl einen Benutzernamen als auch ein Passwort angeben. Der im Secrets Manager gespeicherten JDBC-URL fehlt die Eigenschaft PWD.

  • Wenn Sie Probleme mit der LDAP-Konfiguration beheben: Wir empfehlen, sicherzustellen, dass der LDAP-Authentifikator (LDAP-Server) korrekt konfiguriert ist, um eine Verbindung zum Amazon EMR-Cluster herzustellen. Verwenden Sie den ldapwhoami Befehl bei der Behebung des Konfigurationsproblems. Sie können z.B. den folgenden Befehl ausführen:

    • Für LDAPS — ldapwhoami -x -H ldaps://ldap-server

    • Für LDAP — ldapwhoami -x -H ldap://ldap-server

    Beide Befehle sollten zurückgegeben werden Anonymous, wenn Sie den Authentifikator erfolgreich konfiguriert haben.

Fehlerbehebung mit Salesforce

Lebenszyklus-Konfigurationsfehler

Wenn Ihr Benutzer Studio Classic zum ersten Mal öffnet, erhält er möglicherweise die Fehlermeldung, dass bei seiner Lebenszykluskonfiguration etwas nicht stimmt. Verwenden Sie Amazon CloudWatch , um auf die Protokolle zuzugreifen, die von Ihrem Lebenszyklus-Konfigurationsskript geschrieben wurden. Weitere Informationen zur Lebenszyklus-Konfiguration finden Sie unter Konfigurationen für den Debug-Lebenszyklus.

Wenn Sie den Fehler nicht debuggen können, können Sie die Konfigurationsdatei manuell erstellen. Sie müssen die Datei jedes Mal erstellen, wenn Sie den Jupyter-Server löschen oder neu starten. Gehen Sie wie folgt vor, um die Datei manuell zu erstellen.

So erstellen Sie eine Konfigurationsdatei
  1. Navigieren Sie zu Studio Classic.

  2. Wählen Sie Datei, dann Neu und dann Terminal.

  3. Geben Sie einen Namen für den Benutzer ein und klicken Sie dann auf .sfgenie_identity_provider_oauth_config.

  4. Öffnen Sie die Datei in einem Text-Editor.

  5. Fügen Sie der Datei ein JSON-Objekt mit dem Amazon Resource Name (ARN) des Secrets-Manager-Geheimnisses. Sie können die folgende Vorlage verwenden, um das Objekt zu erstellen.

    { "secret_arn": "example-secret-ARN" }
  6. Speichern Sie Ihre Änderungen in der -Datei.

Zugriff auf Salesforce Data Cloud aus dem Data Wrangler Flow nicht möglich

Nachdem Ihr Benutzer Salesforce Data Cloud aus Ihrem Data Wrangler-Flow ausgewählt hat, wird möglicherweise eine Fehlermeldung angezeigt, die darauf hinweist, dass die Voraussetzungen für die Einrichtung der Verbindung nicht erfüllt wurden. Dies kann durch folgende Fehler verursacht werden:

  • Das Salesforce-Geheimnis in Secrets Manager wurde nicht erstellt.

  • Das Salesforce-Geheimnis in Secrets Manager wurde erstellt, aber es fehlt das Salesforce-Tag.

  • Das Salesforce-Geheimnis in Secrets Manager wurde falsch AWS-Region erstellt. Beispielsweise kann Ihr Benutzer nicht auf die Salesforce Data Cloud zugreifen, ca-central-1 weil Sie das Secret in us-east-1 erstellt haben. Sie können das Secret entweder replizieren in ca-central-1 oder ein neues Secret mit denselben Anmeldeinformationen in ca-central-1 erstellen. Informationen zum Replizieren von Geheimnissen finden Sie unter Replizieren eines AWS Secrets Manager Geheimnisses auf andere AWS-Regionen.

  • Die Richtlinie, die Ihre Benutzer für den Zugriff auf Amazon SageMaker Studio Classic verwenden, enthält keine Berechtigungen für AWS Secrets Manager

  • Der Secrets Manager Manager-ARN des JSON-Objekts, das Sie in Ihrer Lebenszykluskonfiguration angegeben haben, enthält einen Tippfehler.

  • Das Secrets Manager Manager-Geheimnis, das Ihre Salesforce OAuth-Konfiguration enthält, enthält einen Tippfehler

Leere Seite wird angezeigt redirect_uri_mismatch

Nachdem Ihre Benutzer Speichern und Connect ausgewählt haben, werden sie möglicherweise auf eine Seite weitergeleitet, die redirect_uri_mismatch anzeigt. Die Rückruf-URI, die Sie in Ihren Salesforce Connected-App-Einstellungen registriert haben, fehlt entweder oder ist falsch.

Verwenden Sie die folgende URL, um zu überprüfen, ob Ihre Studio Classic-URL in den Connected App-Einstellungen Ihrer Salesforce-Organisation korrekt registriert ist: https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/. Weitere Informationen zur Verwendung der Einstellungen für verbundene Anwendungen finden Sie unter der folgenden URL: https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/.

Anmerkung

Die Weitergabe des URI innerhalb der Salesforce-Systeme dauert ungefähr zehn Minuten.

Geteilte Räume

Gemeinsam genutzte Bereiche funktionieren derzeit nicht mit der Salesforce Data Cloud-Integration. Sie können entweder die gemeinsam genutzten Bereiche in der Amazon- SageMaker Domäne löschen, die Sie verwenden möchten, oder Sie können eine andere Domäne verwenden, für die keine gemeinsam genutzten Bereiche eingerichtet sind.

OAuth-Weiterleitungsfehler

Ihre Benutzer sollten in der Lage sein, ihre Daten aus der Salesforce Data Cloud zu importieren, nachdem sie Connect ausgewählt haben. Wenn sie auf einen Fehler stoßen, empfehlen wir, Folgendes zu tun:

  • Sagen Sie ihnen, dass sie geduldig sind – Wenn sie zu Amazon SageMaker Studio Classic zurückgeleitet werden, kann es bis zu einer Minute dauern, bis der Authentifizierungsprozess abgeschlossen ist. Während der Weiterleitung empfehlen wir, ihnen mitzuteilen, dass sie die Interaktion mit dem Browser vermeiden sollen. Sie sollten beispielsweise nicht den Browser-Tab schließen, zu einem anderen Tab wechseln oder mit dem Data Wrangler-Flow interagieren. Durch die Interaktion mit dem Browser wird möglicherweise der Autorisierungscode entfernt, der für die Verbindung mit der Daten-Wolke erforderlich ist.

  • Lassen Sie Ihre Benutzer erneut eine Verbindung zur Daten-Wolke herstellen — Es gibt vorübergehende Probleme, die dazu führen können, dass eine Verbindung zur Salesforce Data Cloud fehlschlägt. Lassen Sie Ihre Benutzer einen neuen Data Wrangler-Flow erstellen und versuchen Sie erneut, eine Verbindung zur Salesforce Data Cloud herzustellen.

  • Stellen Sie sicher, dass Ihre Benutzer alle anderen Registerkarten mit Amazon SageMaker Studio Classic schließen – Wenn Studio Classic auf mehreren Registerkarten geöffnet ist, kann die Salesforce-Data-Cloud-Verbindung fehlschlagen. Stellen Sie sicher, dass Ihre Benutzer nur eine Studio Classic-Registerkarte geöffnet haben.

  • Mehrere Benutzer greifen gleichzeitig auf Studio Classic zu – Es sollte jeweils nur ein Benutzer auf eine Amazon SageMaker -Domain zugreifen. Wenn mehrere Benutzer auf dieselbe Domain zugreifen, schlägt die Verbindung, die ein Benutzer mit der Salesforce Data Wolke herzustellen versucht, möglicherweise fehl.

Durch das Aktualisieren von Data Wrangler und Studio Classic kann auch der Fehler behoben werden. Weitere Informationen zum Aktualisieren von Data Wrangler finden Sie unter Data Wrangler aktualisieren. Informationen zum Aktualisieren von Studio Classic finden Sie unter Studio SageMaker Classic herunterfahren und aktualisieren.

Wenn keiner der vorherigen Schritte zur Fehlerbehebung funktioniert, finden Sie möglicherweise eine Fehlermeldung von Salesforce mit einer entsprechenden Beschreibung, die in der Studio Classic-URL eingebettet ist. Im Folgenden finden Sie ein Beispiel für eine Nachricht, die Sie finden könnten: error=invalid_client_id&error_description=client%20identifier%20invalid.

Sie können sich die Fehlermeldung in der URL ansehen und versuchen, die damit verbundenen Probleme zu beheben. Wenn die Fehlermeldung oder Beschreibung unklar ist, empfehlen wir, die Salesforce-Wissensdatenbank zu durchsuchen. Wenn die Suche in der Wissensdatenbank nicht funktioniert, können Sie sich an den Salesforce-Helpdesk wenden, um weitere Unterstützung zu erhalten.

Das Laden von Data Wrangler dauert sehr lange

Wenn Ihre Benutzer von der Salesforce Data Wolke zurück zu Data Wrangler weitergeleitet werden, kann es zu langen Ladezeiten kommen.

Wenn der Benutzer Data Wrangler zum ersten Mal verwendet oder den Kernel gelöscht hat, kann es etwa 5 Minuten dauern, bis die neue Amazon EC2-Instance für die Verwendung von Data Wrangler bereitgestellt ist.

Wenn der Benutzer Data Wrangler nicht zum ersten Mal verwendet und er den Kernel nicht gelöscht hat, können Sie ihn bitten, die Seite zu aktualisieren oder so viele Browser-Tabs wie möglich zu schließen.

Wenn keine der vorherigen Interventionen funktioniert, lassen Sie sie eine neue Verbindung zur Salesforce Data Cloud einrichten.

Der Benutzer kann seine Daten mit einem Invalid batch Id Fehler nicht exportieren

Wenn Ihr Benutzer die Transformationen, die er an seinen Salesforce-Daten vorgenommen hat, exportiert, schlägt der SageMaker Verarbeitungsauftrag, den Data Wrangler im Backend verwendet, möglicherweise fehl. Die Salesforce Data Cloud ist möglicherweise vorübergehend nicht verfügbar oder es liegt ein Caching-Problem vor.

Um das Problem zu beheben, empfehlen wir, dass Ihre Benutzer zu dem Schritt zurückkehren, in dem sie die Daten importieren, und die Reihenfolge der Spalten ändern, die sie abfragen. Sie können beispielsweise die folgende Abfrage ändern:

SELECT col_A, col_B FROM table

Auf die folgende Anfrage:

SELECT col_B, col_A FROM table

Nachdem sie die Reihenfolge der Spalten geändert und sichergestellt haben, dass die nachfolgenden Transformationen, die sie vorgenommen haben, weiterhin gültig sind, können sie erneut mit dem Export ihrer Daten beginnen.

Benutzer können einen sehr großen Datensatz nicht exportieren

Wenn Ihre Benutzer einen sehr großen Datensatz aus der Salesforce Data Cloud importiert haben, können sie die von ihnen vorgenommenen Transformationen möglicherweise nicht exportieren. Ein großer Datensatz hat möglicherweise zu viele Zeilen oder er kann das Ergebnis einer komplexen Abfrage sein.

Wir empfehlen Ihnen, Ihre Benutzer folgende Maßnahmen ergreifen zu lassen:

  • Vereinfachung ihrer SQL-Abfrage

  • Laden von Stichproben ihrer Daten

Im Folgenden sind einige Strategien aufgeführt, mit denen sie ihre Abfragen vereinfachen können:

  • Geben Sie Spaltennamen an, anstatt den * Operator zu verwenden

  • Suchen Sie nach einer Teilmenge der Daten, die sie importieren möchten, anstatt eine größere Teilmenge zu verwenden

  • Minimierung von Verknüpfungen zwischen sehr großen Datensätzen

Sie können Stichproben verwenden, um die Anzahl der Zeilen in ihrem Datensatz zu reduzieren. Informationen zu Stichprobenmethoden finden Ihre Benutzer unter Sampling.

Benutzer können aufgrund eines ungültigen Aktualisierungstokens keine Daten exportieren

Data Wrangler verwendet einen JDBC-Treiber für die Integration in die Salesforce Data Cloud. Die Methode zur Authentifizierung ist OAuth. Für OAuth sind das Aktualisierungstoken und das Zugriffstoken zwei verschiedene Datenelemente, die verwendet werden, um den Zugriff auf Ressourcen in Ihrer Salesforce Data Cloud zu autorisieren.

Mit dem Zugriffstoken oder Core-Token können Sie direkt über Data Wrangler auf Ihre Salesforce-Daten zugreifen und Abfragen ausführen. Es ist kurzlebig und so konzipiert, dass es schnell abläuft. Um den Zugriff auf Ihre Salesforce-Daten aufrechtzuerhalten, verwendet Data Wrangler das Aktualisierungstoken, um ein neues Zugriffstoken von Salesforce abzurufen.

Möglicherweise haben Sie festgelegt, dass die Aktualisierung zu schnell abläuft, um ein neues Zugriffstoken für Ihre Benutzer zu erhalten. Möglicherweise müssen Sie Ihre Aktualisierungstoken-Richtlinie erneut überprüfen, um sicherzustellen, dass sie Abfragen berücksichtigt, deren Ausführung für Ihre Benutzer viel Zeit in Anspruch nimmt. Informationen zum Konfigurieren der App zum Melden von Ereignissen finden Sie unter https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/.

Abfragen schlagen fehl oder Tabellen werden nicht geladen

Bei Salesforce treten Serviceausfälle auf. Selbst wenn Sie alles richtig konfiguriert haben, können Ihre Benutzer ihre Daten möglicherweise für einen bestimmten Zeitraum nicht importieren.

Serviceausfälle können aus Wartungsgründen auftreten. Wir empfehlen, am nächsten Tag nachzuschauen, ob das Problem behoben wurde.

Wenn Sie länger als einen Tag Probleme haben, empfehlen wir Ihnen, sich an den Helpdesk von Salesforce zu wenden, um weitere Unterstützung zu erhalten. Informationen zur Kontaktaufnahme mit Salesforce finden Sie unter Wie möchten Sie Salesforce kontaktieren?

OAUTH_APP_BLOCKED während der Studio Classic-Umleitung

Wenn Ihr Benutzer zurück zu Amazon SageMaker Studio Classic weitergeleitet wird, bemerken er möglicherweise den Abfrageparameter error=OAUTH_APP_BLOCKED innerhalb der URL. Möglicherweise tritt bei ihnen ein vorübergehendes Problem auf, das sich innerhalb eines Tages von selbst beheben sollte.

Möglicherweise haben Sie ihnen auch den Zugriff auf die Connected App gesperrt. Weitere Informationen zum Lösen irgendwelcher der folgenden Probleme finden Sie unter https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/.

OAUTH_APP_DENIED während der Studio Classic-Umleitung

Wenn Ihr Benutzer zurück zu Amazon SageMaker Studio Classic weitergeleitet wird, bemerken er möglicherweise den Abfrageparameter error=OAUTH_APP_ACCESS_DENIED innerhalb der URL. Sie haben ihren Profiltypen keine Zugriffsberechtigungen für den Zugriff auf die mit Data Wrangler Connected App verknüpften Dateien erteilt.

Um ihr Zugriffsproblem zu lösen, navigieren Sie zu https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ManageUsers/home/ und überprüfen Sie, ob dem Benutzer das richtige Profil zugewiesen ist.