Vermeiden Sie unterschiedliche Instance-Größen Vermeiden Sie Massenladeneustarts Wenn Sie viele Prädikate haben Vermeiden Sie lang laufende Transaktionen Optimieren von Abfragen Load Balancing Verwenden einer temporären Instance Größenanpassung einer Instance „Task Interrupted“-Fehler

Grundlegende Anleitungen für den Amazon-Neptune-Betrieb

Im Folgenden finden Sie einige grundlegenden Anleitungen für den Betrieb, die bei der Arbeit mit Neptune befolgt werden sollten.

Machen Sie sich mit Neptune-DB-Instances vertraut, damit Sie sie entsprechend Ihren Leistungs- und Anwendungsanforderungen dimensionieren können. Siehe Amazon-Neptune-DB-Cluster und -Instances.
Sie müssen die Nutzung von CPU und Arbeitsspeicher überwachen. Auf diese Weise können Sie leichter erkennen, wann auf eine DB-Instance-Klasse mit mehr CPU- oder Speicherkapazität migriert werden sollte, um die erforderliche Abfrageleistung zu erzielen. Sie können Amazon so einrichten CloudWatch , dass Sie benachrichtigt werden, wenn sich die Nutzungsmuster ändern oder wenn Sie sich der Kapazität Ihrer Bereitstellung nähern. Auf diese Weise können Sie leichter die Leistung und Verfügbarkeit des Systems wahren. Weitere Informationen hierzu finden Sie unter Überwachen von Instances und Überwachen von Neptune.

Da Neptune über einen eigenen Speichermanager verfügt, ist es normal, eine relativ geringe Speichernutzung zu sehen, auch wenn die CPU-Auslastung hoch ist. Das Auftreten out-of-memory von Ausnahmen bei der Ausführung von Abfragen ist der beste Indikator dafür, dass Sie den freien Speicherplatz erhöhen müssen.
Aktivieren Sie automatische Sicherungen und richten Sie das Sicherungsfenster so ein, dass diese zu einem günstigen Zeitpunkt durchgeführt werden.
Testen Sie den Failover für Ihre DB-Instance, um zu verstehen, wie lange der Vorgang für Ihren Anwendungsfall dauert. Auch können Sie leichter sicherstellen, dass die Anwendung, mit der auf Ihre DB-Instance zugegriffen wird, nach einem Failover automatisch eine Verbindung mit der neuen DB-Instance herstellen kann.
Führen Sie Ihren Client und den Neptune-Cluster nach Möglichkeit in derselben Region und VPC aus, da regionsübergreifende Verbindungen mit VPC-Peering zu Verzögerungen bei den Query-Antworten führen können. Bei Query-Antworten im einstelligen Millisekundenbereich müssen sich Client und Neptune-Cluster in derselben Region und VPC befinden.
Wenn Sie eine Lesereplikat-Instance erstellen, sollte sie mindestens so groß sein wie die primäre Writer-Instance. Dies hilft, die Replikationsverzögerung in Grenzen zu halten und vermeidet einen Neustart des Replicas. Siehe Vermeiden Sie verschiedene DB-Instance-Klassen in einem Cluster.
Bevor Sie auf eine neue Hauptversion der Engine aktualisieren, sollten Sie Ihre Anwendung darauf testen, bevor Sie das Upgrade durchführen. Sie können dies tun, indem Sie Ihren DB-Cluster klonen, so dass auf dem Klon-Cluster die neue Engine-Version ausgeführt wird, und anschließend Ihre Anwendung auf dem Klon testen.
Um Failovers zu erleichtern, sollten alle Instances idealerweise gleich groß sein.

Themen

Bewährte Methoden für die Sicherheit in Amazon Neptune
Vermeiden Sie verschiedene DB-Instance-Klassen in einem Cluster
Vermeiden Sie wiederholte Neustarts während eines Massenladevorgangs
Aktivieren Sie den OSGP-Index, wenn Sie eine große Anzahl von Prädikaten haben
Vermeiden Sie lang laufende Transaktionen, wenn möglich
Bewährte Methoden zur Verwendung von Neptune-Metriken
Bewährte Methoden für das Optimieren von Neptune-Abfragen
Load Balancing über Lesereplikate hinweg
Schnelleres Laden mithilfe einer vorübergehend größeren Instance
Ändern Sie die Größe Ihrer Writer-Instance, indem Sie ein Failover auf ein Lesereplikat durchführen
Wiederholen des Uploads nach „Data Prefetch Task Interrupted“-Fehler

Vermeiden Sie verschiedene DB-Instance-Klassen in einem Cluster

Wenn Ihr DB-Cluster Instances verschiedener Klassen enthält, können im Laufe der Zeit Probleme auftreten. Das häufigste Problem besteht darin, dass eine kleine Reader-Instance aufgrund von Replikationsverzögerungen in einen Zyklus wiederholter Neustarts geraten kann. Wenn ein Reader-Knoten eine schwächere DB-Instance-Klassenkonfiguration als die einer Writer-DB-Instance hat, kann das Volumen der Änderungen so groß sein, dass der Reader damit nicht Schritt halten kann.

Wichtig

Um wiederholte Neustarts aufgrund von Verzögerungen bei der Replikation zu vermeiden, konfigurieren Sie Ihren DB-Cluster so, dass alle Instances dieselbe Instance-Klasse (Größe) haben.

Sie können die Verzögerung zwischen der Writer-Instance (der primären) und den Readern in Ihrem DB-Cluster anhand der ClusterReplicaLag Metrik in Amazon sehen CloudWatch. Mit der VolumeWriteIOPs-Metrik können Sie auch Spitzen von Schreibaktivitäten in Ihrem Cluster erkennen, die zu Verzögerungen bei der Replikation führen können.

Vermeiden Sie wiederholte Neustarts während eines Massenladevorgangs

Wenn es aufgrund von Replikationsverzögerungen während eines Massenladevorgangs zu einem Zyklus wiederholter Lesereplikat-Neustarts kommt, können Ihre Replikate wahrscheinlich nicht mit dem Writer im DB-Cluster Schritt halten.

Sie können die Reader so skalieren, dass sie größer als der Writer sind. Sie können sie auch während des Massenladens vorübergehend entfernen und nach dem Abschluss des Vorgangs erneut erstellen.

Aktivieren Sie den OSGP-Index, wenn Sie eine große Anzahl von Prädikaten haben

Wenn Ihr Datenmodell eine große Anzahl unterschiedlicher Prädikate enthält, führt dies möglicherweise zu einer reduzierten Leistung und höheren Betriebskosten.

In diesem Fall können Sie die Leistung verbessern, indem Sie den OSGP-Index aktivieren. Siehe Der OSGP-Index.

Vermeiden Sie lang laufende Transaktionen, wenn möglich

Lang andauernde (Nur-Lese- oder Lese-Schreib-) Transaktionen können zu unerwarteten Problemen der folgenden Art führen:

Eine lang andauernde Transaktion auf einer Reader- oder Writer-Instance mit gleichzeitigen Schreibvorgängen kann zu einer großen Anhäufung verschiedener Datenversionen führen. Dies kann zu höheren Latenzen bei Leseabfragen führen, die einen großen Teil ihrer Ergebnisse herausfiltern.

In einigen Fällen können die im Laufe von Stunden angesammelten Versionen dazu führen, dass neue Schreibvorgänge gedrosselt werden.

Eine lang andauernde Lese- und Schreibtransaktion mit vielen Schreibvorgängen kann ebenfalls zu Problemen führen, wenn die Instance neu gestartet wird. Wenn eine Instance aufgrund eines Wartungsereignisses oder eines Absturzes neu gestartet wird, werden alle nicht festgeschriebenen Schreibvorgänge zurückgesetzt. Solche Undo-Operationen werden normalerweise im Hintergrund ausgeführt und verhindern nicht, dass die Instance wieder hochgefahren wird. Aber alle neuen Schreibvorgänge, die mit den Vorgängen, die zurückgesetzt werden, in Konflikt geraten, schlagen dann fehl.

Wenn beispielsweise dieselbe Abfrage erneut versucht wird, nachdem die Verbindung beim vorherigen Durchlauf getrennt wurde, schlägt dies möglicherweise fehl, wenn die Instance neu gestartet wird.

Die Zeit, die für das Rückgängigmachen von Vorgängen benötigt wird, ist proportional zum Umfang der Änderungen.

Bewährte Methoden für das Optimieren von Neptune-Abfragen

Eine der besten Möglichkeiten zur Verbesserung der Neptune-Leistung besteht darin, die am häufigsten verwendeten und ressourcenintensivsten Abfragen so anzupassen, dass ihre Ausführung weniger aufwändig wird.

Informationen über das Anpassen von Gremlin-Abfragen finden Sie unter Gremlin-Abfragehinweise und Optimieren von Gremline-Abfragen. Informationen über das Anpassen von SPARQL-Abfragen finden Sie unter SPARQL-Abfragehinweise.

Load Balancing über Lesereplikate hinweg

Das Round-Robin-Routing für den Reader-Endpunkt funktioniert durch Ändern des Hosts, auf den der DNS-Eintrag verweist. Der Client muss eine neue Verbindung herstellen und den DNS-Eintrag auflösen, um eine Verbindung zu einer neuen Read Replica herzustellen, da WebSocket Verbindungen oft über lange Zeiträume bestehen bleiben.

Um verschiedene Read Replicas für aufeinanderfolgende Anforderungen abzurufen, stellen Sie sicher, dass der Client den DNS-Eintrag bei jeder Verbindung auflöst. Dies erfordert möglicherweise das Schließen der Verbindung und das erneute Verbinden mit dem Leser-Endpunkt.

Sie können einen Lastausgleich auch über Read Replicas hinweg durchführen, indem Sie explizit Verbindungen zu Instance-Endpunkten herstellen.

Schnelleres Laden mithilfe einer vorübergehend größeren Instance

Ihre Ladeleistung steigt mit größeren Instances. Wenn Sie keinen großen Instance-Typ verwenden, aber dennoch die Ladegeschwindigkeiten erhöhen möchten, können Sie eine größere Instance zum Laden verwenden und diese dann löschen.

Anmerkung

Die folgende Vorgehensweise gilt für einen neuen Cluster. Wenn Sie einen vorhandenen Cluster haben, können Sie eine neue größere Instance hinzufügen und diese dann zu einer primären DB-Instance machen.

So laden Sie Daten mit einer größeren Instance-Größe:

Erstellen Sie einen Cluster mit einer einzelnen r5.12xlarge-Instance. Diese Instance ist die primäre DB-Instance.
Erstellen Sie mindestens ein Lesereplikat derselben Größe (r5.12xlarge).

Sie können die Lesereplikate in einer kleineren Größe erstellen. Wenn sie jedoch nicht groß genug sind, um mit den Schreibvorgängen der primären Instance Schritt zu halten, müssen sie möglicherweise häufig neu gestartet werden. Die daraus resultierenden Ausfallzeiten reduzieren die Leistung erheblich.
Fügen Sie im Bulk-Loader-Befehl “parallelism” : “OVERSUBSCRIBE” hinzu, um Neptune anzuweisen, alle verfügbaren CPU-Ressourcen für das Laden zu verwenden (siehe Neptune-Loader-Anforderungsparameter). Der Ladevorgang wird dann so schnell wie I/O möglich fortgesetzt, was in der Regel 60-70% der CPU-Ressourcen erfordert.
Laden Sie Ihre Daten mit dem Neptune-Loader. Der Ladevorgang wird auf der primären DB-Instance durchgeführt.
Stellen Sie nach Abschluss des Ladens der Daten sicher, dass Sie alle Instances im Cluster auf denselben Instance-Typ herunterskalieren, um zusätzliche Gebühren und wiederholte Neustartprobleme zu vermeiden (siehe Vermeiden Sie unterschiedliche Instance-Größen).

Ändern Sie die Größe Ihrer Writer-Instance, indem Sie ein Failover auf ein Lesereplikat durchführen

Die beste Methode, die Größe einer Instance in Ihrem DB-Cluster, einschließlich der Writer-Instance, zu ändern, besteht darin, eine Lesereplikat-Instance so zu erstellen oder zu ändern, dass sie die gewünschte Größe hat, und dann bewusst auf dieses Lesereplikat umzuschalten. Bei der Ausfallzeit Ihrer Anwendung handelt es sich lediglich um die Zeit, die für die Änderung der IP-Adresse des Writers erforderlich ist. Diese sollte etwa 3 bis 5 Sekunden betragen.

Die Neptune-Verwaltungs-API, die Sie verwenden, um ein absichtliches Failover der aktuellen Writer-Instance auf eine Lesereplikat-Instance durchzuführen, ist Failover DBCluster. Wenn Sie den Gremlin-Java-Client verwenden, müssen Sie nach dem Failover möglicherweise ein neues Client-Objekt erstellen, um die neue IP-Adresse zu übernehmen, wie hier beschrieben.

Stellen Sie sicher, dass Sie alle Ihre Instances auf dieselbe Größe umstellen, um einen Zyklus wiederholter Neustarts zu vermeiden, wie unten beschrieben.

Wiederholen des Uploads nach „Data Prefetch Task Interrupted“-Fehler

Wenn Sie mit dem Massen-Loader Daten in Neptune laden, kann dies gelegentlich zum Status LOAD_FAILED führen. In der Antwort auf die Anforderung detaillierter Informationen werden die Meldungen PARSING_ERROR und Data prefetch task interrupted angezeigt.


"errorLogs" : [
  {
    "errorCode" : "PARSING_ERROR",
    "errorMessage" : "Data prefetch task interrupted: Data prefetch task for 11467 failed",
    "fileName" : "s3://amzn-s3-demo-bucket/some-source-file",
    "recordNum" : 0
  }
]

Wenn dieser Fehler auftritt, wiederholen Sie einfach die Massen-Upload-Anforderung.

Der Fehler tritt auf, wenn es eine temporäre Unterbrechung gab, die in der Regel nicht durch Ihre Anforderung oder Ihre Daten verursacht wurde, und er kann in der Regel behoben werden, indem die Massen-Upload-Anforderung erneut ausgeführt wird.

Wenn Sie Standardeinstellungen verwenden, nämlich "mode":"AUTO" und "failOnError":"TRUE", überspringt der Loader Dateien, die er bereits erfolgreich geladen hat und fährt mit dem Laden von Dateien fort, die noch nicht geladen wurden, als die Unterbrechung stattfand.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Bewährte Methoden

Sicherheit