Asynchrone Analyse für die Themenmodellierung - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Asynchrone Analyse für die Themenmodellierung

Um die Themen in einem Dokumentsatz zu bestimmen, verwenden Sie die , StartTopicsDetectionJob um einen asynchronen Auftrag zu starten. Sie können Themen in Dokumenten überwachen, die auf Englisch oder Spanisch geschrieben sind.

Bevor Sie beginnen

Bevor Sie beginnen, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Eingabe- und Ausgabe-Buckets – Geben Sie die Amazon S3-Buckets an, die Sie für Eingabe und Ausgabe verwenden möchten. Die Buckets müssen sich in derselben -Region befinden wie die API, die Sie aufrufen.

  • IAM-Servicerolle – Sie benötigen eine IAM-Servicerolle mit der Berechtigung, auf Ihre Eingabe- und Ausgabe-Buckets zuzugreifen. Weitere Informationen finden Sie unter Rollenbasierte Berechtigungen, die für asynchrone Operationen erforderlich sind.

Verwendung der AWS Command Line Interface

Das folgende Beispiel zeigt die Verwendung der -StartTopicsDetectionJobOperation mit der AWS CLI

Das Beispiel ist für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

Für den cli-input-json Parameter geben Sie den Pfad zu einer JSON-Datei an, die die Anforderungsdaten enthält, wie im folgenden Beispiel gezeigt.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

Wenn die Anforderung zum Starten des Themenerkennungsauftrags erfolgreich war, erhalten Sie die folgende Antwort:

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

Verwenden Sie die -ListTopicsDetectionJobsOperation, um eine Liste der von Ihnen übermittelten Aufgaben zur Themenerkennung anzuzeigen. Die Liste enthält Informationen über die von Ihnen verwendeten Eingabe- und Ausgabespeicherorte sowie den Status der einzelnen Erkennungsaufträge. Das Beispiel ist für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).

aws comprehend list-topics-detection-jobs \-- region

Als Antwort erhalten Sie JSON ähnlich dem folgenden:

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

Sie können die -DescribeTopicsDetectionJobOperation verwenden, um den Status eines vorhandenen Auftrags abzurufen. Das Beispiel ist für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).

aws comprehend describe-topics-detection-job --job-id job ID

Als Antwort erhalten Sie das folgende JSON:

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

Verwenden des -SDK für Python oder AWS SDK for .NET

SDK-Beispiele zum Starten eines Themenmodellierungsauftrags finden Sie unter Verwenden Sie StartTopicsDetectionJob mit einem AWS SDKoder CLI.