Verwenden von Neptune-Workbench-Magics in Ihren Notebooks - Amazon Neptune

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von Neptune-Workbench-Magics in Ihren Notebooks

Die Neptune-Workbench stellt in den Notebooks mehrere so genannte Magics-Befehle bereit, die viel Zeit und Aufwand sparen. Sie können in zwei Kategorien eingeteilt werden: Zeilen-Magics und Zellen-Magics.

Zeilen-Magics sind Befehle, denen ein einzelnes Prozentzeichen (%) vorangestellt ist. Sie akzeptieren nur Zeileneingaben, keine Eingaben vom Rest der Zelle. Die Neptune-Workbench stellt die folgenden Zeilen-Magics bereit:

Zellen-Magics sind Befehle, denen zwei (%%) vorangestellt sind. Sie verwenden den Zelleninhalt als Eingabe, können jedoch auch Zeileninhalte als Eingabe verwenden. Die Neptune-Workbench stellt die folgenden Zellen-Magics bereit:

Es gibt auch zwei Magics, eine Zeilen-Magics und eine Zellen-Magics für Neptune Machine Learning.

Anmerkung

Beim Arbeiten mit Neptune-Magics können Sie in der Regel über den Parameter --help oder -h einen Hilfetext abrufen. Der Text einer Zellen-Magics darf nicht leer sein. Wenn Sie Hilfe abrufen, müssen Sie daher einen Text eingeben, auch wenn es nur ein einzelnes Zeichen ist. Beispielsweise:

%%gremlin --help x

Variable Injektion in Zellen- oder Zeilen-Magics

In einem Notebook definierte Variablen können in jeder Zellen- oder Zeilen-Magics im Notebook im folgenden Format referenziert werden: ${VAR_NAME}.

Angenommen, Sie definieren die folgenden Variablen:

c = 'code' my_edge_labels = '{"route":"dist"}'

Dann ist diese Gremlin-Abfrage in einer Zellen-Magics:

%%gremlin -de $my_edge_labels g.V().has('${c}','SAF').out('route').values('${c}')

Dies entspricht:

%%gremlin -de {"route":"dist"} g.V().has('code','SAF').out('route').values('code')

Abfrageargumente, die mit allen Abfragesprachen funktionieren

Die folgenden Abfrageargumente funktionieren mit %%gremlin-, %%opencypher- und %%sparql-Magics in der Neptune-Workbench:

Allgemeine Abfrageargumente
  • --store-to (oder -s)   –   Gibt den Namen der Variablen an, in der die Abfrageergebnisse gespeichert werden sollen.

  • --silent   –   Wenn vorhanden, wird nach Abschluss der Abfrage keine Ausgabe angezeigt.

  • --group-by (oder -g)   –   Gibt die Eigenschaft an, die zum Gruppieren von Knoten verwendet wird (z. B. code oder T.region). Die Farbe der Eckpunkte ist von der Gruppe abhängig, der sie zugewiesen sind.

  • --ignore-groups   –   Wenn vorhanden, werden alle Gruppierungsoptionen ignoriert.

  • --display-property (oder -d)   –   Gibt die Eigenschaft an, deren Wert für jeden Eckpunkt angezeigt werden soll.

    Der Standardwert für jede Abfragesprache ist wie folgt:

    • Für Gremlin:   T.label.

    • Für openCypher:   ~labels.

    • Für SPARQL:   type.

  • --edge-display-property (or -t)   –   Gibt die Eigenschaft an, deren Wert für jede Kante angezeigt werden soll.

    Der Standardwert für jede Abfragesprache ist wie folgt:

    • Für Gremlin:   T.label.

    • Für openCypher:   ~labels.

    • Für SPARQL:   type.

  • --tooltip-property (oder -de)   –   Gibt die Eigenschaft an, deren Wert als QuickInfo für jeden Knoten angezeigt werden soll.

    Der Standardwert für jede Abfragesprache ist wie folgt:

    • Für Gremlin:   T.label.

    • Für openCypher:   ~labels.

    • Für SPARQL:   type.

  • --edge-tooltip-property (oder -te)   –   Gibt eine Eigenschaft an, deren Wert als QuickInfo für jede Kante angezeigt werden soll.

    Der Standardwert für jede Abfragesprache ist wie folgt:

    • Für Gremlin:   T.label.

    • Für openCypher:   ~labels.

    • Für SPARQL:   type.

  • --label-max-length (oder -l)   –   Gibt die maximale Zeichenlänge einer Eckpunktbezeichnung an. Der Standardwert ist 10.

  • --edge-label-max-length (oder -le)   –   Gibt die maximale Zeichenlänge einer Kantenbezeichnung an. Der Standardwert ist 10.

    Nur im Fall von openCypher ist dies stattdessen --rel-label-max-length oder -rel.

  • --simulation-duration (oder -sd)   –   Gibt die maximale Dauer der Visualisierungsphysik-Simulation an. Der Standardwert ist 1 500 ms.

  • --stop-physics (oder -sp)   –   Deaktiviert die Visualisierungsphysik nach Stabilisierung der ursprünglichen Simulation.

Eigenschaftswerte für diese Argumente können aus einem einzelnen Eigenschaftsschlüssel oder aus einer JSON-Zeichenfolge bestehen, die für jeden Bezeichnungstyp eine andere Eigenschaft angeben kann. Eine JSON-Zeichenfolge kann nur durch Variableneinfügung angegeben werden.

Die Zeilen-Magics %seed

Die Zeilen-Magics %seed ist eine bequeme Methode, wie Sie Ihrem Neptune-Endpunkt Daten hinzufügen können, um Gremlin-, openCypher- oder SPARQL-Abfragen zu untersuchen und mit ihnen zu experimentieren. Sie stellt ein Formular bereit, in dem Sie das Datenmodell auswählen können, das Sie untersuchen möchten (Eigenschaftsdiagramm oder RDF). Anschließend können Sie aus verschiedenen Beispieldatensätzen auswählen, die Neptune bereitstellt.

Die Zeilen-Magics %load

Die Zeilen-Magics %load generiert ein Formular, mit dem Sie eine Massenladeanforderung an Neptune senden können (siehe Neptune-Loader-Befehl). Die Quelle muss ein Amazon-S3-Pfad in derselben Region wie der Neptune-Cluster sein.

Die Zeilen-Magics %load_ids

Die Zeilen-Magics %load_ids ruft die Lade-IDs ab, die an den Host-Endpunkt des Notebooks gesendet wurden (siehe Neptune-Loader-Get-Status-Anforderungsparameter). Die Anforderung hat folgendes Format:

GET https://your-neptune-endpoint:port/loader

Die Zeilen-Magics %load_status

Die Zeilen-Magics %load_status ruft den Ladestatus eines bestimmten Ladeauftrags ab, der an den Host-Endpunkt des Notebooks gesendet wurde, angegeben durch die Zeileneingabe (siehe Neptune-Loader-Get-Status-Anforderungsparameter). Die Anforderung hat folgendes Format:

GET https://your-neptune-endpoint:port/loader?loadId=loadId

Die Zeilen-Magics sieht wie folgt aus:

%load_status load id

Die Zeilen-Magics %cancel_load

Die Zeilen-Magics %cancel_load bricht einen bestimmten Ladeauftrag ab (siehe Neptune-Loader – Auftrag abbrechen). Die Anforderung hat folgendes Format:

DELETE https://your-neptune-endpoint:port/loader?loadId=loadId

Die Zeilen-Magics sieht wie folgt aus:

%cancel_load load id

Die Zeilen-Magics %status

Ruft Statusinformationen vom Host-Endpunkt des Notebooks ab (%graph_notebook_configzeigt den Host-Endpunkt an).

Die Zeilen-Magics %gremlin_status

Ruft Informationen zum Status einer Gremlin-Abfrage ab.

Die Zeilen-Magics %opencypher_status (auch %oc_status)

Ruft den Abfragestatus für eine opencypher-Abfrage ab. Die Zeilen-Magics verwendet die folgenden optionalen Argumente:

  • --queryId oder -q   –   Gibt die ID einer bestimmten ausgeführten Abfrage an, deren Status angezeigt werden soll.

  • --cancel_query oder -c   –   Bricht eine ausgeführte Abfrage ab. Nimmt keinen Wert an.

  • --silent or -s   –   Wenn --silent beim Abbrechen einer Abfrage auf truefestgelegt ist, wird die ausgeführte Abfrage mit dem HTTP-Antwortcode 200 abgebrochen. Andernfalls wäre der HTTP-Antwortcode 500.

  • --store-to   –   Gibt den Namen der Variablen an, in der die Abfrageergebnisse gespeichert werden sollen.

Die Zeilen-Magics %sparql_status

Ruft Informationen zum Status einer SPARQL-Abfrage ab.

Die Zeilen-Magics %stream_viewer

Die Zeilen-Magics %stream_viewer zeigt eine Schnittstelle an, die eine interaktive Untersuchung der Einträge ermöglicht, die in Neptune-Streams protokolliert sind, wenn für den Neptune-Cluster Streams aktiviert sind. Der Befehl akzeptiert die folgenden optionalen Argumente:

  • language   –   Die Abfragesprache der Stream-Daten: gremlin oder sparql. Wenn Sie dieses Argument nicht angeben, ist der Standardwert gremlin.

  • --limit   –   Gibt die maximale Anzahl von Stream-Einträgen an, die pro Seite angezeigt werden sollen. Wenn Sie dieses Argument nicht angeben, ist der Standardwert 10.

Anmerkung

Die Zeilen-Magics %stream_viewer wird nur in den Engine-Versionen 1.0.5.1 und früher vollständig unterstützt.

Die Zeilen-Magics %graph_notebook_config

Diese Zeilen-Magics zeigt das JSON-Objekt an, das die Konfiguration enthält, die das Notebook für die Kommunikation mit Neptune verwendet. Die Konfiguration enthält Folgendes:

  • host: Der Endpunkt, mit dem die Verbindung hergestellt und an den Befehle ausgegeben werden sollen.

  • port: Der Port, der für die Ausgabe von Befehlen an Neptune verwendet wird. Der Standardwert ist 8182.

  • auth_mode: Der Authentifizierungsmodus, der verwendet werden soll, wenn Befehle an Neptune ausgegeben werden. Dieser muss IAM sein, wenn eine Verbindung mit einem Cluster hergestellt wird, für den die IAM-Authentifizierung aktiviert ist, andernfalls DEFAULT.

  • load_from_s3_arn: Gibt den Amazon-S3-ARN an, den die Magics %load verwenden soll. Wenn dieser Wert leer ist, muss der ARN im Befehl %load angegeben werden.

  • ssl: Ein boolescher Wert, der angibt, ob die Verbindung mit Neptune über TLS hergestellt werden soll oder nicht. Der Standardwert ist true.

  • aws_region: Die Region, in der dieses Notebook bereitgestellt wird. Diese Informationen werden für die IAM-Authentifizierung und für %load-Anforderungen verwendet.

Sie können die Konfiguration ändern, indem Sie die Ausgabe für %graph_notebook_config in eine neue Zelle kopieren und dort Änderungen ausführen. Wenn Sie dann die Zellen-Magics %%graph_notebook_config für die neue Zelle ausführen, wird die Konfiguration entsprechend geändert.

Die Zeilen-Magics %graph_notebook_host

Legt den Host des Notebooks als Zeileneingabe fest.

Die Zeilen-Magics %graph_notebook_version

Die Zeilen-Magics %graph_notebook_version gibt die Versionsnummer des Neptune-Workbench-Notebooks zurück. In Version 1.27 wurde beispielsweise die Diagrammvisualisierung eingeführt.

Die Zeilen-Magics %graph_notebook_vis_options

Die Zeilen-Magics %graph_notebook_vis_options zeigt die aktuellen Visualisierungseinstellungen an, die das Notebook verwendet. Diese Optionen werden in der Dokumentation für vis.js beschrieben.

Sie können diese Einstellungen ändern, indem Sie die Ausgabe in eine neue Zelle kopieren, die gewünschten Änderungen ausführen und dann die Zellen-Magics %%graph_notebook_vis_options für die Zelle anwenden.

Um die Visualisierungseinstellungen auf die Standardwerte zurückzusetzen, können Sie die Zeilen-Magics %graph_notebook_vis_options mit dem Parameter reset ausführen. Hierdurch werden alle Visualisierungseinstellungen zurückgesetzt:

%graph_notebook_vis_options reset

Die Zeilen-Magics %statistics

Die Zeilen-Magics %statistics wird verwendet, um DFE-Engine-Statistiken abzurufen oder zu verwalten (siehe Verwalten von Statistiken, die die Neptune-DFE-Engine verwenden soll). Diese Magics kann auch verwendet werden, um eine Diagrammübersicht abzurufen.

Sie akzeptiert die folgenden Parameter:

  • --language   –   Die Abfragesprache des Statistikendpunkts: propertygraph (oder pg) oder rdf.

    Wenn nicht angegeben, ist der Standardwert propertygraph.

  • --mode (oder -m)   –   Gibt den Typ der Anforderung oder Aktion an, die gesendet werden soll: status, disableAutoCompute, enableAutoCompute, refresh, delete, detailed oder basic).

    Wenn nicht angegeben, ist der Standardwert status. Wenn jedoch --summary angegeben ist, ist der Standardwert basic.

  • --summary   –   Ruft die Diagrammübersicht vom Statistikübersichtendpunkt der ausgewählten Sprache ab.

  • --silent   –   Wenn vorhanden, wird nach Abschluss der Abfrage keine Ausgabe angezeigt.

  • --store-to   –   Wird verwendet, um eine Variable anzugeben, in der die Abfrageergebnisse gespeichert werden sollen.

Die Zeilen-Magics %summary

Die Zeilen-Magics %summary wird verwendet, um Informationen zur Diagrammübersicht abzurufen. Sie ist ab Neptune-Engine-Version 1.2.1.0 verfügbar.

Sie akzeptiert die folgenden Parameter:

  • --language   –   Die Abfragesprache des Statistikendpunkts: propertygraph (oder pg) oder rdf.

    Wenn nicht angegeben, ist der Standardwert propertygraph.

  • --detailed   –   Schaltet die Anzeige von Strukturfeldern in der Ausgabe ein oder aus.

    Wenn nicht angegeben, ist der Übersichtsanzeigemodus basic der Standardwert.

  • --silent   –   Wenn vorhanden, wird nach Abschluss der Abfrage keine Ausgabe angezeigt.

  • --store-to   –   Wird verwendet, um eine Variable anzugeben, in der die Abfrageergebnisse gespeichert werden sollen.

Die Zellen-Magics %%graph_notebook_config

Die Zellen-Magics %%graph_notebook_config verwendet ein JSON-Objekt mit Informationen zur Konfiguration, um die Einstellungen zu ändern, die das Notebook für die Kommunikation mit Neptune verwendet, wenn möglich. Die Konfiguration hat das Format, das von der Zeilen-Magics %graph_notebook_config zurückgegeben wird.

Beispielsweise:

%%graph_notebook_config { "host": "my-new-cluster-endpoint.amazon.com", "port": 8182, "auth_mode": "DEFAULT", "load_from_s3_arn": "", "ssl": true, "aws_region": "us-east-1" }

Die Zellen-Magics %%sparql

Die Zellen-Magics %%sparql gibt eine SPARQL-Abfrage an den Neptune-Endpunkt aus. Sie akzeptiert die folgenden optionalen Zeileneingaben:

  • -h oder --help   –   Gibt Hilfetext zu diesen Parametern zurück.

  • --path   –   Stellt dem SPARQL-Endpunkt einen Pfad voran. Wenn Sie zum Beispiel --path "abc/def" angeben, wäre host:port/abc/def der aufgerufene Endpunkt.

  • --expand-all   –   Dies ist ein Abfragevisualisierungshinweis, der den Visualizer anweist, alle Ergebnisse für ?s ?p ?o unabhängig vom Bindungstyp in das Diagramm aufzunehmen.

    Standardmäßig enthält eine SPARQL-Visualisierung nur Tripelmuster, bei denen o? entweder uri oder bnode (ein leerer Knoten) ist. Alle anderen ?o-Bindungstypen, wie Literalzeichenfolgen oder Ganzzahlen, werden als Eigenschaften des ?s-Knotens behandelt und können im Bereich Details auf der Registerkarte Diagramm angezeigt werden.

    Wenn Sie Literalwerte als Eckpunkte in die Visualisierung einfügen möchten, verwenden Sie stattdessen den Abfragehinweis --expand-all.

    Sie dürfen diesen Visualisierungshinweis nicht mit explain-Parametern kombinieren, da explain-Abfragen nicht visualisiert werden.

  • --explain-type   –   Wird verwendet, um den explain-Modus anzugeben, der verwendet werden soll (dynamic, static oder details).

  • --explain-format   –   Wird verwendet, um das Antwortformat für eine explain-Abfrage anzugeben (text/csv oder text/html).

  • --store-to   –   Wird verwendet, um die Variable anzugeben, in der die Abfrageergebnisse gespeichert werden sollen.

Beispiel für eine explain-Abfrage:

%%sparql explain SELECT * WHERE {?s ?p ?o} LIMIT 10

Beispiel für eine Visualisierungsabfrage mit dem Visualisierungshinweisparameter --expand-all (siehe SPARQL-Visualisierung):

%%sparql --expand-all SELECT * WHERE {?s ?p ?o} LIMIT 10

Die Zellen-Magics %%gremlin

Die %%gremlin Zellmagie sendet eine Gremlin-Abfrage an den Neptun-Endpunkt unter Verwendung von. WebSocket Sie akzeptiert eine optionale Zeileneingabe, um in den Modus Gremlin explain /> oder Gremlin-profile-API zu wechseln, und die getrennte optionale Eingabe eines Visualisierungshinweises, um das Verhalten der Visualisierungsausgabe zu ändern (siehe Gremlin-Visualisierung).

Beispiel für eine explain-Abfrage:

%%gremlin explain g.V().limit(10)

Beispiel für eine profile-Abfrage:

%%gremlin profile g.V().limit(10)

Beispiel für eine Visualisierungsabfrage mit einem Visualisierungshinweisparameter:

%%gremlin -p v,outv g.V().out().limit(10)
Optionale Parameter für %%gremlin profile-Abfragen
  • --chop   –   Gibt die maximale Länge der Profilergebnis-Zeichenfolge an. Wenn Sie dieses Argument nicht angeben, ist der Standardwert 250.

  • --serializer   –   Gibt den Serializer an, der für die Ergebnisse verwendet werden soll. Zulässige Werte sind alle gültigen Enumerationswerte des MIME-Typs oder des TinkerPop Treibers „Serializers“. Wenn Sie dieses Argument nicht angeben, ist der Standardwert application.json.

  • --no-results   –   Zeigt nur die Ergebniszahl an. Wenn dieser Parameter nicht verwendet wird, werden standardmäßig alle Abfrageergebnisse im Profilbericht angezeigt.

  • --indexOps   –   Zeigt einen detaillierten Bericht zu allen Indexoperationen an.

Die Zellen-Magics %%opencypher (auch %%oc)

Die Zellen-Magics %%opencypher (auch als %%oc abgekürzt) gibt eine openCypher-Abfrage an den Neptune-Endpunkt aus. Sie akzeptiert die folgenden optionalen Zeileneingabenargumente:

  • mode   –   Der Abfragemodus: query oder bolt. Wenn Sie dieses Argument nicht angeben, ist der Standardwert query.

  • --group-by oder -g   –   Gibt die Eigenschaft an, die zum Gruppieren von Knoten verwendet wird. z. B. code, ~id. Wenn Sie dieses Argument nicht angeben, ist der Standardwert ~labels.

  • --ignore-groups   –   Wenn vorhanden, werden alle Gruppierungsoptionen ignoriert.

  • --display-propery oder -d   –   Gibt die Eigenschaft an, deren Wert für jeden Eckpunkt angezeigt werden soll. Wenn Sie dieses Argument nicht angeben, ist der Standardwert ~labels.

  • --edge-display-propery oder -de   –   Gibt die Eigenschaft an, deren Wert für jede Kante angezeigt werden soll. Wenn Sie dieses Argument nicht angeben, ist der Standardwert ~labels.

  • --label-max-length oder -l   –   Gibt die maximale Anzahl der Zeichen einer Eckpunktbezeichnung an, die angezeigt werden können. Wenn Sie dieses Argument nicht angeben, ist der Standardwert 10.

  • --store-to oder -s)   –   Gibt den Namen der Variablen an, in der die Abfrageergebnisse gespeichert werden sollen.

  • --plan-cache oder -pc: Gibt den zu verwendenden Plan-Cache-Modus an. Der Standardwert ist. auto (*plan-cache ist nur für Neptune Analytics verfügbar)

  • --query-timeout oder -qt: Gibt das maximale Abfrage-Timeout in Millisekunden an. Der Standardwert ist 1800000.

  • --query-parameters oder qp: Parameterdefinitionen, die auf die Abfrage angewendet werden sollen. Diese Option kann entweder einen einzelnen Variablennamen oder eine Zeichenfolgendarstellung der Zuordnung annehmen.

    Beispiel für die Verwendung von --query-parameters
    1. Definieren Sie eine Zuordnung von OpenCypher-Parametern in einer Notebook-Zelle.

      params = '''{ "name":"john", "age": 20, }'''
    2. Übergeben Sie die Parameter an --query-parameters in einer anderen Zelle mit %%oc.

      %%oc --query-parameters params MATCH (n {name: $name, age: $age}) RETURN n
  • --explain-type — Wird verwendet, um den zu verwendenden Erklärmodus anzugeben (einer der folgenden Modi: dynamisch, statisch oder detailliert).

Die Zellen-Magics %%graph_notebook_vis_options

Mit der Zellen-Magics %%graph_notebook_vis_options können Sie Visualisierungsoptionen für das Notebook festlegen. Sie können die von der Zeilen-Magics %graph-notebook-vis-options zurückgegebenen Einstellungen kopieren, in eine neue Zelle kopieren, Änderungen ausführen und die Zellen-Magics %%graph_notebook_vis_options verwenden, um die neuen Werte festzulegen.

Diese Optionen werden in der Dokumentation für vis.js beschrieben.

Um die Visualisierungseinstellungen auf die Standardwerte zurückzusetzen, können Sie die Zeilen-Magics %graph_notebook_vis_options mit dem Parameter reset ausführen. Hierdurch werden alle Visualisierungseinstellungen zurückgesetzt:

%graph_notebook_vis_options reset

Die Zeilen-Magics %neptune_ml

Sie können die Zeilen-Magics %neptune_ml verwenden, um verschiedene Neptune-ML-Operationen zu initiieren und zu verwalten.

Anmerkung

Sie können auch die Zellen-Magics %%neptune_ml verwenden, um einige Neptune-ML-Operationen zu initiieren und zu verwalten.

  • %neptune_ml export start   –   Startet einen neuen Exportauftrag.

    Parameter
    • --export-url exporter-endpoint   –   (optional) Der Amazon-API-Gateway-Endpunkt, auf dem der Exporter aufgerufen werden kann.

    • --export-iam   –   (optional) Flag, das anzeigt, dass Anforderungen an die Export-URL mit SigV4 signiert werden müssen.

    • --export-no-ssl   –   (optional) Flag, das anzeigt, dass SSL nicht verwendet werden sollte, wenn eine Verbindung zum Exporter hergestellt wird.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis der Export abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen den Exportstatusprüfungen fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Exportauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

    • --store-tolocation-to-store-result— (optional) Die Variable, in der das Exportergebnis gespeichert werden soll. Wenn --wait angegeben ist, wird der endgültige Status dort gespeichert.

  • %neptune_ml export status   –   Ruft den Status eines Exportauftrags ab.

    Parameter
    • --job-id export job ID   –   Die ID des Exportauftrags, für den der Status abgerufen werden soll.

    • --export-url exporter-endpoint   –   (optional) Der Amazon-API-Gateway-Endpunkt, auf dem der Exporter aufgerufen werden kann.

    • --export-iam   –   (optional) Flag, das anzeigt, dass Anforderungen an die Export-URL mit SigV4 signiert werden müssen.

    • --export-no-ssl   –   (optional) Flag, das anzeigt, dass SSL nicht verwendet werden sollte, wenn eine Verbindung zum Exporter hergestellt wird.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis der Export abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen den Exportstatusprüfungen fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Exportauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

    • --store-tolocation-to-store-result— (optional) Die Variable, in der das Exportergebnis gespeichert werden soll. Wenn --wait angegeben ist, wird der endgültige Status dort gespeichert.

  • %neptune_ml dataprocessing start   –   Startet den Neptune-ML-Datenverarbeitungsschritt.

    Parameter
    • --job-id ID for this job   –   (optional) Die ID, die diesem Auftrag zugewiesen werden soll.

    • --s3-input-uri S3 URI   –   (optional) Der S3-URI, unter dem sich die Eingabe für diesen Datenverarbeitungsauftrag befindet.

    • --config-file-name file name   –   (optional) Der Name der Konfigurationsdatei für diesen Datenverarbeitungsauftrag.

    • --store-tolocation-to-store-result— (optional) Die Variable, in der das Datenverarbeitungsergebnis gespeichert werden soll.

    • --instance-type (instance type)   –   (optional) Die Größe der Instance, die für diesen Datenverarbeitungsauftrag verwendet werden soll.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis die Datenverarbeitung abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen den Datenverarbeitungsstatusprüfungen fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Datenverarbeitungsauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

  • %neptune_ml dataprocessing status   –   Ruft den Status eines Datenverarbeitungsauftrags ab.

    Parameter
    • --job-id ID of the job   –   Die ID des Auftrags, für den der Status abgerufen werden soll.

    • --store-to instance type   –   (optional) Die Variable, in der das Ergebnis des Modelltrainings gespeichert werden soll.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis das Modelltraining abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen den Statusprüfungen des Modells fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Datenverarbeitungsauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

  • %neptune_ml training start   –   Startet den Neptune-ML-Modelltrainingsprozess.

    Parameter
    • --job-id ID for this job   –   (optional) Die ID, die diesem Auftrag zugewiesen werden soll.

    • --data-processing-id dataprocessing job ID   –   (optional) Die ID des Datenverarbeitungsauftrags, der die Artefakte erstellt hat, die für das Training verwendet werden sollen.

    • --s3-output-uri S3 URI   –   (optional) Der S3-URI, unter dem die Ausgabe dieses Modelltrainingsauftrags gespeichert werden soll.

    • --instance-type (instance type)   –   (optional) Die Größe der Instance, die für diesen Modelltrainingsauftrag verwendet werden soll.

    • --store-tolocation-to-store-result— (optional) Die Variable, in der das Ergebnis des Modelltrainings gespeichert werden soll.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis das Modelltraining abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen den Statusprüfungen des Modelltrainings fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Modelltrainingsauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

  • %neptune_ml training status   –   Ruft den Status eines Neptune-ML-Modelltrainingsauftrags ab.

    Parameter
    • --job-id ID of the job   –   Die ID des Auftrags, für den der Status abgerufen werden soll.

    • --store-to instance type   –   (optional) Die Variable, in der das Statusergebnis gespeichert werden soll.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis das Modelltraining abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen den Statusprüfungen des Modelltrainings fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Datenverarbeitungsauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

  • %neptune_ml endpoint create   –   Erstellt einen Abfrageendpunkt für ein Neptune-ML-Modell.

    Parameter
    • --job-id ID for this job   –   (optional) Die ID, die diesem Auftrag zugewiesen werden soll.

    • --model-job-id model-training job ID   –   (optional) Die ID des Modelltrainingsauftrags, für den ein Abfrageendpunkt erstellt werden soll.

    • --instance-type (instance type)   –   (optional) Die Größe der Instance, die für den Abfrageendpunkt verwendet werden soll.

    • --store-tolocation-to-store-result— (optional) Die Variable, in der das Ergebnis der Endpunkterstellung gespeichert werden soll.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis die Endpunkterstellung abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen Statusprüfungen fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Endpunkterstellungsauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

  • %neptune_ml endpoint status   –   Ruft den Status eines Neptune-ML-Abfrageendpunkts ab.

    Parameter
    • --job-id endpoint creation ID   –   (optional) Die ID des Endpunkterstellungsauftrags, für den der Status gemeldet werden soll.

    • --store-tolocation-to-store-result— (optional) Die Variable, in der das Statusergebnis gespeichert werden soll.

    • --wait   –   (optional) Flag, das anzeigt, dass die Operation warten soll, bis die Endpunkterstellung abgeschlossen ist.

    • --wait-intervalinterval-to-wait— (optional) Legt die Zeit in Sekunden zwischen Statusprüfungen fest (Standard: 60).

    • --wait-timeout timeout-seconds   –   (optional) Legt die Wartezeit (in Sekunden) auf den Abschluss des Endpunkterstellungsauftrags fest, bevor der neueste Status zurückgegeben wird (Standard: 3 600).

Die Zellen-Magics %%neptune_ml

Die Zellen-Magics %%neptune_ml ignoriert Zeileneingaben wie --job-id oder --export-url. Stattdessen können Sie diese und andere Eingaben im Zelltext eingeben.

Sie können diese Eingaben auch in einer anderen Zelle speichern, die einer Jupyter-Variablen zugewiesen ist, und sie dann mithilfe dieser Variablen in den Zelltext einfügen. So können Sie diese Eingaben immer wieder verwenden, ohne sie jedes Mal erneut eingeben zu müssen.

Dies funktioniert nur, wenn die einfügende Variable der einzige Inhalt der Zelle ist. Sie können in derselben Zelle nicht mehrere Variablen oder eine Kombination aus Text und einer Variablen verwenden.

Die Zellen-Magics %%neptune_ml export start kann beispielsweise ein JSON-Dokument im Zelltext verwenden, das alle Parameter enthält, die in Parameter, die zur Steuerung des Neptun-Exportprozesses verwendet werden beschrieben werden.

Im Notebook Neptune-ML-01-Introduction-to-Node-Classification-Gremlin sehen Sie unter Konfigurieren von Features im Abschnitt Exportieren der Daten- und Modellkonfiguration, wie die folgende Zelle Exportparameter in einem Dokument enthält, das einer Jupyter-Variablen namens export-params zugewiesen ist:

export_params = { "command": "export-pg", "params": { "endpoint": neptune_ml.get_host(), "profile": "neptune_ml", "useIamAuth": neptune_ml.get_iam(), "cloneCluster": False }, "outputS3Path": f'{s3_bucket_uri}/neptune-export', "additionalParams": { "neptune_ml": { "targets": [ { "node": "movie", "property": "genre" } ], "features": [ { "node": "movie", "property": "title", "type": "word2vec" }, { "node": "user", "property": "age", "type": "bucket_numerical", "range" : [1, 100], "num_buckets": 10 } ] } }, "jobSize": "medium"}

Wenn Sie diese Zelle ausführen, speichert Jupyter das Parameterdokument unter diesem Namen. Anschließend können Sie mit ${export_params} das JSON-Dokument wie folgt in den Text einer %%neptune_ml export start cell einfügen:

%%neptune_ml export start --export-url {neptune_ml.get_export_service_host()} --export-iam --wait --store-to export_results ${export_params}

Verfügbare Formulare für die Zellen-Magics %%neptune_ml

Die Zellen-Magics %%neptune_ml kann in den folgenden Formularen verwendet werden:

  • %%neptune_ml export start   –   Startet einen Neptune-ML-Exportvorgang.

  • %%neptune_ml dataprocessing start   –   Startet einen Neptune-ML-Datenverarbeitungsauftrag.

  • %%neptune_ml training start   –   Startet einen Neptune-ML-Modelltrainingsauftrag.

  • %%neptune_ml endpoint create   –   Erstellt einen Neptune-ML-Abfrageendpunkt für ein Modell.