Neptune ML Datenverarbeitungs-API - Amazon Neptune

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Neptune ML Datenverarbeitungs-API

Datenverarbeitungsaktionen:

Allgemeine Strukturen für ML:

StartMLDataProcessingJob (Aktion)

        Der AWS CLI-Name für diese API lautet: start-ml-data-processing-job.

Erzeugt einen neuen Neptune ML-Datenverarbeitungsauftrag für die Verarbeitung der aus Neptune für das Training exportierten Graphdaten. Siehe den dataprocessing-Befehl.

Wenn diese Operation in einem Neptune-Cluster mit aktivierter IAM-Authentifizierung aufgerufen wird, muss mit dem IAM-Benutzer oder der Rolle, die die Anforderung gestellt hat, eine Richtlinie verknüpft sein, die die IAM-Aktion neptune-db:StartMLModelDataProcessingJob in diesem Cluster zulässt.

Anforderung

  • configFileName  (in der CLI: --config-file-name) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Eine Datenspezifikationsdatei, die beschreibt, wie die exportierten Graphdaten für das Training geladen werden. Die Datei wird automatisch vom Neptune-Export-Toolkit generiert. Der Standardwert ist training-data-configuration.json.

  • id  (in der CLI: --id) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Eine eindeutige Kennung für den neuen Auftrag. Die Standardeinstellung ist eine automatisch generierte UUID.

  • inputDataS3Location  (in der CLI: --input-data-s3-location) – Erforderlich: eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die URI des Amazon-S3-Speicherorts, an den SageMaker die zur Ausführung des Datenverarbeitungsauftrags erforderlichen Daten herunterlädt.

  • modelType  (in der CLI: --model-type) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Einer der beiden Modelltypen, die Neptune ML derzeit unterstützt: heterogene Graphmodelle (heterogeneous) und Wissensgraph (kge). Die Standardeinstellung ist None (Kein). Wenn nicht angegeben, wählt Neptune ML den Modelltyp automatisch auf der Grundlage der Daten aus.

  • neptuneIamRoleArn  (in der CLI: --neptune-iam-role-arn) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Amazon-Ressourcenname (ARN) einer IAM-Rolle, die SageMaker für die Ausführung von Aufgaben in Ihrem Namen übernehmen kann. Dies muss in Ihrer DB-Cluster-Parametergruppe aufgeführt sein, sonst tritt ein Fehler auf.

  • previousDataProcessingJobId  (in der CLI: --previous-data-processing-job-id) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die Auftrags-ID eines abgeschlossenen Datenverarbeitungsauftrags, der auf einer früheren Version der Daten ausgeführt wurde.

  • processedDataS3Location  (in der CLI: --processed-data-s3-location) – Erforderlich: eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die URI des Amazon-S3-Speicherorts, an dem SageMaker die Ergebnisse eines Datenverarbeitungsauftrags speichern soll.

  • processingInstanceType  (in der CLI: --processing-instance-type) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Typ der ML-Instance, die während der Datenverarbeitung verwendet wird. Sein Speicher sollte groß genug sein, um den verarbeiteten Datensatz aufzunehmen. Die Standardeinstellung ist der kleinste ml.r5-Typ, dessen Arbeitsspeicher zehnmal größer als die Größe der exportierten Graphdaten auf der Festplatte ist.

  • processingInstanceVolumeSizeInGB  (in der CLI: --processing-instance-volume-size-in-gb) – Ganzzahl vom Typ integer (32-Bit-Ganzzahl mit Vorzeichen).

    Die Größe des Festplattenvolumens der verarbeitenden Instance. Sowohl Eingabedaten als auch verarbeitete Daten werden auf der Festplatte gespeichert, daher muss die Volumengröße groß genug sein, um beide Datensätze aufzunehmen. Der Standardwert ist 0. Wenn nicht angegeben oder 0, wählt Neptune ML die Volumengröße automatisch auf der Grundlage der Datengröße.

  • processingTimeOutInSeconds  (in der CLI: --processing-time-out-in-seconds) – Ganzzahl vom Typ integer (32-Bit-Ganzzahl mit Vorzeichen).

    Timeout in Sekunden für den Datenverarbeitungsauftrag. Der Standardwert ist 86.400 (1 Tag).

  • s3OutputEncryptionKMSKey  (in der CLI: --s-3-output-encryption-kms-key) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Amazon Key Management Service (Amazon KMS)-Schlüssel, den SageMaker verwendet, um die Ausgabe des Verarbeitungsauftrags zu verschlüsseln. Die Standardeinstellung ist None (Kein).

  • sagemakerIamRoleArn  (in der CLI: --sagemaker-iam-role-arn) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der ARN einer IAM-Rolle für die SageMaker-Ausführung. Dieser muss in Ihrer DB-Cluster-Parametergruppe aufgeführt sein, andernfalls tritt ein Fehler auf.

  • securityGroupIds  (in der CLI: --security-group-ids) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die VPC-Sicherheitsgruppen-IDs. Die Standardeinstellung ist None (Kein).

  • subnets  (in der CLI: --subnets) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die IDs der Subnetze in der Neptune VPC. Die Standardeinstellung ist None (Kein).

  • volumeEncryptionKMSKey  (in der CLI: --volume-encryption-kms-key) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Amazon Key Management Service (Amazon KMS)-Schlüssel, den SageMaker verwendet, um Daten auf dem Speichervolumen zu verschlüsseln, das an die ML-Computing-Instances angefügt ist, die den Trainingsauftrag ausführen. Die Standardeinstellung ist None (Kein).

Antwort

  • arn – eine Zeichenfolge vom Typ: string (UTF-8-kodierte Zeichenfolge).

    Der ARN des Datenverarbeitungsauftrags.

  • creationTimeInMillis – eine Long vom Typ: long (64-Bit-Ganzzahl mit Vorzeichen).

    Die Zeit, die für die Erstellung des neuen Verarbeitungsauftrags benötigt wurde, in Millisekunden.

  • id – eine Zeichenfolge vom Typ: string (UTF-8-kodierte Zeichenfolge).

    Die eindeutige ID des neuen Datenverarbeitungsauftrags.

ListMLDataProcessingJobs (Aktion)

        Der AWS CLI-Name für diese API lautet: list-ml-data-processing-jobs.

Gibt eine Liste von Neptune ML-Datenverarbeitungsaufträgen aus. Siehe Auflisten aktiver Datenverarbeitungsaufträge mit dem Neptune ML-Datenverarbeitungsbefehl.

Wenn diese Operation in einem Neptune-Cluster mit aktivierter IAM-Authentifizierung aufgerufen wird, muss mit dem IAM-Benutzer oder der Rolle, die die Anforderung gestellt hat, eine Richtlinie verknüpft sein, die die IAM-Aktion neptune-db:ListMLDataProcessingJobs in diesem Cluster zulässt.

Anforderung

  • maxItems (in der CLI:--max-items) – ein ListMLDataProcessingJobsInputMaxItemsInteger vom Typ: integer (eine 32-Bit-Ganzzahl mit Vorzeichen), nicht weniger als 1 oder mehr als 1024 ?st?s.

    Die maximale Anzahl der Elemente, die ausgegeben werden sollen (von 1 bis 1024; der Standardwert ist 10).

  • neptuneIamRoleArn  (in der CLI: --neptune-iam-role-arn) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der ARN einer IAM-Rolle, die Neptune Zugriff auf SageMaker- und Amazon-S3-Ressourcen gewährt. Dieser muss in Ihrer DB-Cluster-Parametergruppe aufgeführt sein, andernfalls tritt ein Fehler auf.

Antwort

  • ids – eine Zeichenfolge vom Typ: string (UTF-8-kodierte Zeichenfolge).

    Eine Seite, auf der die IDs von Datenverarbeitungsaufträgen aufgeführt sind.

GetMLDataProcessingJob (Aktion)

        Der AWS CLI-Name für diese API lautet: get-ml-data-processing-job.

Ruft Informationen zu einem angegebenen Datenverarbeitungsauftrag ab. Siehe den dataprocessing-Befehl.

Wenn diese Operation in einem Neptune-Cluster mit aktivierter IAM-Authentifizierung aufgerufen wird, muss mit dem IAM-Benutzer oder der Rolle, die die Anforderung gestellt hat, eine Richtlinie verknüpft sein, die die IAM-Aktion neptune-db:GetMLDataProcessingJobStatus in diesem Cluster zulässt.

Anforderung

  • id  (in der CLI: --id) – Erforderlich: eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die eindeutige Kennung des abzurufenden Datenverarbeitungsauftrags.

  • neptuneIamRoleArn  (in der CLI: --neptune-iam-role-arn) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der ARN einer IAM-Rolle, die Neptune Zugriff auf SageMaker- und Amazon-S3-Ressourcen gewährt. Dieser muss in Ihrer DB-Cluster-Parametergruppe aufgeführt sein, andernfalls tritt ein Fehler auf.

Antwort

  • id – eine Zeichenfolge vom Typ: string (UTF-8-kodierte Zeichenfolge).

    Die eindeutige Kennung dieses Datenverarbeitungsauftrags.

  • processingJob – Ein MLResourceDefinition-Objekt.

    Definition des Datenverarbeitungsauftrags.

  • status – eine Zeichenfolge vom Typ: string (UTF-8-kodierte Zeichenfolge).

    Status des Datenverarbeitungsauftrags.

CancelMLDataProcessingJob (Aktion)

        Der AWS CLI-Name für diese API lautet: cancel-ml-data-processing-job.

Bricht einen Neptune ML-Datenverarbeitungsauftrag ab. Siehe den dataprocessing-Befehl.

Wenn diese Operation in einem Neptune-Cluster mit aktivierter IAM-Authentifizierung aufgerufen wird, muss mit dem IAM-Benutzer oder der Rolle, die die Anforderung gestellt hat, eine Richtlinie verknüpft sein, die die IAM-Aktion neptune-db:CancelMLDataProcessingJob in diesem Cluster zulässt.

Anforderung

  • clean  (in der CLI: --clean) – boolescher Wert vom Typ boolean (boolescher Wert (wahr oder falsch)).

    Falls auf TRUE gesetzt, gibt dieses Flag an, dass alle Neptune ML S3-Artefakte gelöscht werden sollen, wenn der Auftrag gestoppt wird. Der Standardwert ist FALSE.

  • id  (in der CLI: --id) –Erforderlich: eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die eindeutige Kennung des Datenverarbeitungsauftrags.

  • neptuneIamRoleArn  (in der CLI: --neptune-iam-role-arn) – eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der ARN einer IAM-Rolle, die Neptune Zugriff auf SageMaker- und Amazon-S3-Ressourcen gewährt. Dieser muss in Ihrer DB-Cluster-Parametergruppe aufgeführt sein, andernfalls tritt ein Fehler auf.

Antwort

  • status – eine Zeichenfolge vom Typ: string (UTF-8-kodierte Zeichenfolge).

    Der Status der Abbruchsanforderung.

Allgemeine Strukturen von ML:

MlResourceDefinition (Struktur)

Definiert eine Neptune-ML-Ressource.

Felder
  • arn – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der ARN der Ressource.

  • cloudwatchLogUrl – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die CloudWatch-Protokoll-URL für die Ressource.

  • failureReason – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Die Ursache des Fehlers im Falle eines Fehlers.

  • name – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Name der Ressource.

  • outputLocation – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Ausgabeort.

  • status – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der Status der Ressource.

mlConfigDefinition (Struktur)

Enthält eine Neptune ML-Konfiguration.

Felder
  • arn – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Der ARN der Konfiguration.

  • name – Dies ist eine Zeichenfolge vom Typ string (UTF-8-kodierte Zeichenfolge).

    Name der Konfiguration.