Fehlerbehebung - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Fehlerbehebung

Wenn bei der Verwendung von Amazon SageMaker Data Wrangler ein Problem auftritt, empfehlen wir Ihnen, wie folgt vorzugehen:

  • Wenn eine Fehlermeldung angezeigt wird, lesen Sie die Meldung und beheben Sie das Problem, wenn möglich.

  • Stellen Sie sicher, dass die IAM Rolle Ihres Studio Classic-Benutzers über die erforderlichen Berechtigungen verfügt, um die Aktion auszuführen. Weitere Informationen finden Sie unter Sicherheit und Berechtigungen.

  • Wenn das Problem auftritt, wenn Sie versuchen, von einem anderen AWS Service wie Amazon Redshift oder Athena zu importieren, stellen Sie sicher, dass Sie die erforderlichen Berechtigungen und Ressourcen für den Datenimport konfiguriert haben. Weitere Informationen finden Sie unter Import.

  • Wenn Sie immer noch Probleme haben, wählen Sie oben rechts auf Ihrem Bildschirm Hilfe aus, um das Data Wrangler-Team zu kontaktieren. Weitere Informationen finden Sie in den folgenden Abbildungen.

    Der Speicherort des Data Wrangler-Hilfeformulars in der Data Wrangler-Konsole.
    Das Data Wrangler-Hilfeformular in der Data Wrangler-Konsole.

Als letzten Ausweg können Sie versuchen, den Kernel, auf dem Data Wrangler läuft, neu zu starten.

  1. Speichern und beenden Sie die .flow-Datei, für die Sie den Kernel neu starten möchten.

  2. Wählen Sie das Symbol Running Terminals and Kernels aus, wie in der folgenden Abbildung gezeigt.

    Die Position des Symbols Running Terminals and Kernels in der Konsole.
  3. Wählen Sie das Stop Symbol rechts neben der .flow-Datei, für die Sie den Kernel beenden möchten, wie in der folgenden Abbildung gezeigt.

    Die Position des Stopp-Symbols in der Konsole.
  4. Aktualisieren Sie Ihren Browser.

  5. Öffnen Sie erneut die .flow-Datei, an der Sie gearbeitet haben.

Behebung von Problemen mit Amazon EMR

Verwenden Sie die folgenden Informationen, um Fehler zu beheben, die bei der Nutzung von Amazon auftreten könnenEMR.

  • Verbindungsfehler — Wenn die Verbindung mit der folgenden Meldung fehlschlägtThe IP address of the EMR cluster isn't private error message, wurde Ihr EMR Amazon-Cluster möglicherweise nicht in einem privaten Subnetz gestartet. Als bewährte Sicherheitsmethode unterstützt Data Wrangler nur Verbindungen zu privaten EMR Amazon-Clustern. Wählen Sie ein privates EC2 Subnetz aus, in dem Sie einen Cluster starten. EMR

  • Verbindung hängt und Timeout – Das Problem ist höchstwahrscheinlich auf ein Problem mit der Netzwerkkonnektivität zurückzuführen. Nachdem Sie eine Verbindung zum Cluster hergestellt haben, wird der Bildschirm nicht aktualisiert. Nach etwa 2 Minuten wird möglicherweise der folgende Fehler JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen. angezeigt.

    Die Fehler können zwei Hauptursachen haben:

    • Amazon EMR und Amazon SageMaker Studio Classic sind unterschiedlichVPCs. Wir empfehlen, EMR sowohl Amazon als auch Studio Classic gleichzeitig zu startenVPC. Sie können auch VPC Peering verwenden. Weitere Informationen finden Sie unter Was ist VPC Peering? .

    • Der EMR Amazon-Master-Sicherheitsgruppe fehlt die Regel für eingehenden Datenverkehr für die Sicherheitsgruppe von Amazon SageMaker Studio Classic auf dem für Presto verwendeten Port. Um das Problem zu beheben, lassen Sie eingehenden Verkehr auf Port 8889 zu.

  • Die Verbindung schlägt fehl, weil der Verbindungstyp falsch konfiguriert ist. Möglicherweise wird die folgende Fehlermeldung angezeigt: Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.

    Überprüfen Sie die Authentifizierungsmethode. Die Authentifizierungsmethode, die Sie in Data Wrangler angegeben haben, sollte mit der Authentifizierungsmethode übereinstimmen, die Sie auf dem Cluster verwenden.

  • Sie haben keine HDFS Berechtigungen für die LDAP Authentifizierung — Verwenden Sie die folgenden Anleitungen, um das Problem „HDFSBerechtigungen mithilfe von Linux-Anmeldeinformationen einrichten“ zu lösen. Sie können sich mit den folgenden Befehlen beim Cluster anmelden:

    hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
  • LDAPFehler beim Fehlen des Verbindungsschlüssels bei der Authentifizierung — Möglicherweise wird die folgende Fehlermeldung angezeigt:Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD.

    Für die LDAP Authentifizierung müssen Sie sowohl einen Benutzernamen als auch ein Passwort angeben. Der im Secrets Manager JDBC URL gespeicherten Eigenschaft fehltPWD.

  • Wenn Sie Probleme mit der LDAP Konfiguration beheben: Wir empfehlen, sicherzustellen, dass der LDAP Authenticator (LDAPServer) korrekt konfiguriert ist, um eine Verbindung zum EMR Amazon-Cluster herzustellen. Verwenden Sie den ldapwhoami Befehl bei der Behebung des Konfigurationsproblems. Sie können z. B. den folgenden Befehl ausführen:

    • Für LDAPS — ldapwhoami -x -H ldaps://ldap-server

    • Für LDAP — ldapwhoami -x -H ldap://ldap-server

    Beide Befehle sollten zurückgegeben werden Anonymous, wenn Sie den Authentifikator erfolgreich konfiguriert haben.

Fehlerbehebung mit Salesforce

Lebenszyklus-Konfigurationsfehler

Wenn Ihr Benutzer Studio Classic zum ersten Mal öffnet, wird ihm möglicherweise eine Fehlermeldung angezeigt, dass mit seiner Lebenszykluskonfiguration etwas nicht stimmt. Verwenden Sie Amazon CloudWatch , um auf die Protokolle zuzugreifen, die von Ihrem Lifecycle-Konfigurationsskript geschrieben wurden. Weitere Informationen zur Lebenszyklus-Konfiguration finden Sie unter Konfigurationen für den Debug-Lebenszyklus.

Wenn Sie den Fehler nicht debuggen können, können Sie die Konfigurationsdatei manuell erstellen. Sie müssen die Datei jedes Mal erstellen, wenn Sie den Jupyter-Server löschen oder neu starten. Gehen Sie wie folgt vor, um die Datei manuell zu erstellen.

So erstellen Sie eine Konfigurationsdatei
  1. Navigieren Sie zu Studio Classic.

  2. Wählen Sie Datei, dann Neu und dann Terminal.

  3. Geben Sie einen Namen für den Benutzer ein und klicken Sie dann auf .sfgenie_identity_provider_oauth_config.

  4. Öffnen Sie die Datei in einem Text-Editor.

  5. Fügen Sie der Datei ein JSON Objekt hinzu, das den Amazon-Ressourcennamen (ARN) des Secrets Manager Manager-Geheimnisses enthält. Sie können die folgende Vorlage verwenden, um das Objekt zu erstellen.

    { "secret_arn": "example-secret-ARN" }
  6. Speichern Sie Ihre Änderungen in der -Datei.

Zugriff auf Salesforce Data Cloud aus dem Data Wrangler Flow nicht möglich

Nachdem Ihr Benutzer Salesforce Data Cloud aus Ihrem Data Wrangler-Flow ausgewählt hat, wird möglicherweise eine Fehlermeldung angezeigt, die darauf hinweist, dass die Voraussetzungen für die Einrichtung der Verbindung nicht erfüllt wurden. Dies kann durch folgende Fehler verursacht werden:

  • Das Salesforce-Geheimnis in Secrets Manager wurde nicht erstellt.

  • Das Salesforce-Geheimnis in Secrets Manager wurde erstellt, aber es fehlt das Salesforce-Tag.

  • Das Salesforce-Geheimnis in Secrets Manager wurde falsch erstellt AWS-Region. Beispielsweise kann Ihr Benutzer nicht auf die Salesforce Data Cloud zugreifen, ca-central-1 weil Sie das Secret in us-east-1 erstellt haben. Sie können das Secret entweder replizieren in ca-central-1 oder ein neues Secret mit denselben Anmeldeinformationen in ca-central-1 erstellen. Informationen zum Replizieren von Geheimnissen finden Sie unter Ein AWS Secrets Manager Geheimnis auf andere replizieren. AWS-Regionen

  • In der Richtlinie, die Ihre Benutzer für den Zugriff auf Amazon SageMaker Studio Classic verwenden, fehlen Berechtigungen für AWS Secrets Manager

  • Im Secrets Manager ARN des JSON Objekts, das Sie in Ihrer Lebenszykluskonfiguration angegeben haben, ist ein Tippfehler aufgetreten.

  • Das Secrets Manager Manager-Geheimnis, das Ihre OAuth Salesforce-Konfiguration enthält, enthält einen Tippfehler

Leere Seite wird angezeigt redirect_uri_mismatch

Nachdem Ihre Benutzer Speichern und Connect ausgewählt haben, werden sie möglicherweise auf eine Seite weitergeleitet, die redirect_uri_mismatch anzeigt. Der RückrufURI, den Sie in Ihren Salesforce Connected-App-Einstellungen registriert haben, fehlt entweder oder ist falsch.

Gehen Sie wie folgt vor, URL um zu überprüfen, ob Ihr Studio Classic URL in den Connected App-Einstellungen Ihrer Salesforce-Organisation korrekt registriert ist:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/. Weitere Informationen zur Verwendung der Einstellungen für verbundene Anwendungen finden Sie unter den folgenden LinksURL:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/.

Anmerkung

Die Verbreitung URI innerhalb der Salesforce-Systeme dauert ungefähr zehn Minuten.

Geteilte Räume

Gemeinsam genutzte Bereiche funktionieren derzeit nicht mit der Salesforce Data Cloud-Integration. Sie können entweder die Shared Spaces in der SageMaker Amazon-Domain löschen, die Sie verwenden möchten, oder Sie können eine andere Domain verwenden, für die keine Shared Spaces eingerichtet sind.

OAuthFehler bei der Weiterleitung

Ihre Benutzer sollten in der Lage sein, ihre Daten aus der Salesforce Data Cloud zu importieren, nachdem sie Connect ausgewählt haben. Wenn sie auf einen Fehler stoßen, empfehlen wir, Folgendes zu tun:

  • Sagen Sie ihnen, sie sollen geduldig sein — Wenn sie zurück zu Amazon SageMaker Studio Classic weitergeleitet werden, kann es bis zu einer Minute dauern, bis der Authentifizierungsprozess abgeschlossen ist. Während der Weiterleitung empfehlen wir, ihnen mitzuteilen, dass sie die Interaktion mit dem Browser vermeiden sollen. Sie sollten beispielsweise nicht den Browser-Tab schließen, zu einem anderen Tab wechseln oder mit dem Data Wrangler-Flow interagieren. Durch die Interaktion mit dem Browser wird möglicherweise der Autorisierungscode entfernt, der für die Verbindung mit der Daten-Wolke erforderlich ist.

  • Lassen Sie Ihre Benutzer erneut eine Verbindung zur Daten-Wolke herstellen – Es gibt vorübergehende Probleme, die dazu führen können, dass eine Verbindung zur Salesforce Data Cloud fehlschlägt. Lassen Sie Ihre Benutzer einen neuen Data Wrangler-Flow erstellen und versuchen Sie erneut, eine Verbindung zur Salesforce Data Cloud herzustellen.

  • Stellen Sie sicher, dass Ihre Benutzer alle anderen Tabs mit Amazon SageMaker Studio Classic schließen. Wenn Studio Classic in mehreren Tabs geöffnet ist, kann die Salesforce Data Cloud-Verbindung fehlschlagen. Stellen Sie sicher, dass Ihre Benutzer nur einen Studio Classic-Tab geöffnet haben.

  • Mehrere Benutzer greifen gleichzeitig auf Studio Classic zu — Es sollte jeweils nur ein Benutzer auf eine SageMaker Amazon-Domain zugreifen. Wenn mehrere Benutzer auf dieselbe Domain zugreifen, schlägt die Verbindung, die ein Benutzer mit der Salesforce Data Cloud herzustellen versucht, möglicherweise fehl.

Durch die Aktualisierung von Data Wrangler und Studio Classic könnte der Fehler ebenfalls behoben werden. Weitere Informationen zum Aktualisieren von Data Wrangler finden Sie unter Data Wrangler aktualisieren. Informationen zur Aktualisierung von Studio Classic finden Sie unter. Fahren Sie SageMaker Studio Classic herunter und aktualisieren Sie es

Wenn keiner der vorherigen Schritte zur Fehlerbehebung funktioniert, finden Sie möglicherweise eine Fehlermeldung von Salesforce mit einer entsprechenden Beschreibung, die in Studio Classic eingebettet istURL. Im Folgenden finden Sie ein Beispiel für eine Nachricht, die Sie finden könnten: error=invalid_client_id&error_description=client%20identifier%20invalid.

Sie können sich die Fehlermeldung in ansehen URL und versuchen, die darin enthaltenen Probleme zu beheben. Wenn die Fehlermeldung oder Beschreibung unklar ist, empfehlen wir, die Salesforce-Wissensdatenbank zu durchsuchen. Wenn die Suche in der Wissensdatenbank nicht funktioniert, können Sie sich an den Salesforce-Helpdesk wenden, um weitere Unterstützung zu erhalten.

Das Laden von Data Wrangler dauert sehr lange

Wenn Ihre Benutzer von der Salesforce Data Wolke zurück zu Data Wrangler weitergeleitet werden, kann es zu langen Ladezeiten kommen.

Wenn der Benutzer Data Wrangler zum ersten Mal verwendet oder den Kernel gelöscht hat, kann es etwa 5 Minuten dauern, bis die neue EC2 Amazon-Instance für die Verwendung von Data Wrangler bereitgestellt ist.

Wenn der Benutzer Data Wrangler nicht zum ersten Mal verwendet und er den Kernel nicht gelöscht hat, können Sie ihn bitten, die Seite zu aktualisieren oder so viele Browser-Tabs wie möglich zu schließen.

Wenn keine der vorherigen Interventionen funktioniert, lassen Sie sie eine neue Verbindung zur Salesforce Data Cloud einrichten.

Der Benutzer kann seine Daten mit einem Invalid batch Id Fehler nicht exportieren

Wenn Ihr Benutzer die Transformationen exportiert, die er an seinen Salesforce-Daten vorgenommen hat, schlägt der SageMaker Verarbeitungsjob, den Data Wrangler im Backend verwendet, möglicherweise fehl. Die Salesforce Data Cloud ist möglicherweise vorübergehend nicht verfügbar oder es liegt ein Caching-Problem vor.

Um das Problem zu beheben, empfehlen wir, dass Ihre Benutzer zu dem Schritt zurückkehren, in dem sie die Daten importieren, und die Reihenfolge der Spalten ändern, die sie abfragen. Sie können beispielsweise die folgende Abfrage ändern:

SELECT col_A, col_B FROM table

Auf die folgende Anfrage:

SELECT col_B, col_A FROM table

Nachdem sie die Reihenfolge der Spalten geändert und sichergestellt haben, dass die nachfolgenden Transformationen, die sie vorgenommen haben, weiterhin gültig sind, können sie erneut mit dem Export ihrer Daten beginnen.

Benutzer können einen sehr großen Datensatz nicht exportieren

Wenn Ihre Benutzer einen sehr großen Datensatz aus der Salesforce Data Cloud importiert haben, können sie die von ihnen vorgenommenen Transformationen möglicherweise nicht exportieren. Ein großer Datensatz hat möglicherweise zu viele Zeilen oder er kann das Ergebnis einer komplexen Abfrage sein.

Wir empfehlen Ihnen, Ihre Benutzer folgende Maßnahmen ergreifen zu lassen:

  • Vereinfachung ihrer Abfrage SQL

  • Laden von Stichproben ihrer Daten

Im Folgenden sind einige Strategien aufgeführt, mit denen sie ihre Abfragen vereinfachen können:

  • Geben Sie Spaltennamen an, anstatt den * Operator zu verwenden

  • Suchen Sie nach einer Teilmenge der Daten, die sie importieren möchten, anstatt eine größere Teilmenge zu verwenden

  • Minimierung von Verknüpfungen zwischen sehr großen Datensätzen

Sie können Stichproben verwenden, um die Anzahl der Zeilen in ihrem Datensatz zu reduzieren. Informationen zu Stichprobenmethoden finden Ihre Benutzer unter Sampling.

Benutzer können aufgrund eines ungültigen Aktualisierungstokens keine Daten exportieren

Data Wrangler verwendet einen JDBC Treiber für die Integration in die Salesforce Data Cloud. Die Methode zur Authentifizierung ist. OAuth Denn OAuth das Aktualisierungstoken und das Zugriffstoken sind zwei verschiedene Datenelemente, die verwendet werden, um den Zugriff auf Ressourcen in Ihrer Salesforce Data Cloud zu autorisieren.

Mit dem Zugriffstoken oder Core-Token können Sie direkt über Data Wrangler auf Ihre Salesforce-Daten zugreifen und Abfragen ausführen. Es ist kurzlebig und so konzipiert, dass es schnell abläuft. Um den Zugriff auf Ihre Salesforce-Daten aufrechtzuerhalten, verwendet Data Wrangler das Aktualisierungstoken, um ein neues Zugriffstoken von Salesforce abzurufen.

Möglicherweise haben Sie festgelegt, dass die Aktualisierung zu schnell abläuft, um ein neues Zugriffstoken für Ihre Benutzer zu erhalten. Möglicherweise müssen Sie Ihre Aktualisierungstoken-Richtlinie erneut überprüfen, um sicherzustellen, dass sie Abfragen berücksichtigt, deren Ausführung für Ihre Benutzer viel Zeit in Anspruch nimmt. Informationen zum Konfigurieren der App zum Melden von Ereignissen finden Sie unter https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/.

Abfragen schlagen fehl oder Tabellen werden nicht geladen

Bei Salesforce treten Serviceausfälle auf. Selbst wenn Sie alles richtig konfiguriert haben, können Ihre Benutzer ihre Daten möglicherweise für einen bestimmten Zeitraum nicht importieren.

Serviceausfälle können aus Wartungsgründen auftreten. Wir empfehlen, am nächsten Tag nachzuschauen, ob das Problem behoben wurde.

Wenn Sie länger als einen Tag Probleme haben, empfehlen wir Ihnen, sich an den Helpdesk von Salesforce zu wenden, um weitere Unterstützung zu erhalten. Informationen zur Kontaktaufnahme mit Salesforce finden Sie unter Wie möchten Sie Salesforce kontaktieren?

OAUTH_APP_BLOCKEDwährend der Studio Classic-Umleitung

Wenn Ihr Benutzer zurück zu Amazon SageMaker Studio Classic weitergeleitet wird, bemerkt er möglicherweise den Abfrageparameter error=OAUTH_APP_BLOCKED in derURL. Möglicherweise tritt bei ihnen ein vorübergehendes Problem auf, das sich innerhalb eines Tages von selbst beheben sollte.

Möglicherweise haben Sie ihnen auch den Zugriff auf die Connected App gesperrt. Weitere Informationen zum Lösen irgendwelcher der folgenden Probleme finden Sie unter https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/.

OAUTH_APP_DENIEDwährend der Studio Classic-Weiterleitung

Wenn Ihr Benutzer zurück zu Amazon SageMaker Studio Classic weitergeleitet wird, bemerkt er möglicherweise den Abfrageparameter error=OAUTH_APP_ACCESS_DENIED in derURL. Sie haben ihren Profiltypen keine Zugriffsberechtigungen für den Zugriff auf die mit Data Wrangler Connected App verknüpften Dateien erteilt.

Um ihr Zugriffsproblem zu lösen, navigieren Sie zu https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ManageUsers/home/ und überprüfen Sie, ob dem Benutzer das richtige Profil zugewiesen ist.