Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Schritt 3: Formatieren der Entitätsanalyseausgabe als Amazon Kendra Kendra-Metadaten
Um die von Amazon Comprehend extrahierten Entitäten in das für einen Amazon Kendra Kendra-Index erforderliche Metadatenformat zu konvertieren, führen Sie ein Python-3-Skript aus. Die Ergebnisse der Konvertierung werden in dem metadata
Ordner in Ihrem Amazon S3 S3-Bucket gespeichert.
Weitere Informationen zum Format und zur Struktur Amazon Kendra Kendra-Metadaten finden Sie unter S3-Dokumentmetadaten.
Themen
Herunterladen und Extrahieren der Amazon Comprehend Comprehend-Ausgabe
Um die Ausgabe der Amazon Comprehend Comprehend-Entitätsanalyse zu formatieren, müssen Sie zuerst das Amazon output.tar.gz
Comprehend-Entitätsanalysearchiv herunterladen und die Entitätsanalysedatei extrahieren.
-
Navigieren Sie im Navigationsbereich der Amazon Comprehend Comprehend-Konsole zu Analysis-Jobs.
-
Wählen Sie Ihren Analysejob für Entitäten aus.
data-entities-analysis
-
Wählen Sie unter Ausgabe den Link aus, der neben Speicherort der Ausgabedaten angezeigt wird. Dadurch werden Sie zum
output.tar.gz
Archiv in Ihrem S3-Bucket weitergeleitet. -
Wählen Sie auf der Registerkarte „Übersicht“ die Option Herunterladen aus.
Tipp
Die Ausgabe aller Amazon Comprehend Comprehend-Analyseaufträge hat denselben Namen. Wenn Sie Ihr Archiv umbenennen, können Sie es leichter nachverfolgen.
-
Dekomprimieren und extrahieren Sie die heruntergeladene Amazon Comprehend Comprehend-Datei auf Ihr Gerät.
-
Verwenden Sie den folgenden Befehl, um auf den Namen des automatisch generierten Amazon Comprehend Comprehend-Ordners in Ihrem S3-Bucket zuzugreifen, der die Ergebnisse des Entitätsanalysejobs enthält: describe-entities-detection-job
-
Kopieren und speichern Sie den
S3Uri
Wert aus demOutputDataConfig
Objekt in der Stellenbeschreibung Ihrer Entität wiecomprehend-S3uri
in einem Texteditor.Anmerkung
Der
S3Uri
Wert hat ein ähnliches Format wies3://amzn-s3-demo-bucket/.../output/output.tar.gz
. -
Verwenden Sie den Befehl copy
, um das Ausgabearchiv der Entitäten herunterzuladen: -
Um die Ausgabe der Entitäten zu extrahieren, führen Sie den folgenden Befehl in einem Terminalfenster aus:
Am Ende dieses Schritts sollten Sie auf Ihrem Gerät eine Datei output
mit einer Liste der von Amazon Comprehend identifizierten Entitäten haben.
Die Ausgabe in den S3-Bucket hochladen
Nachdem Sie die Amazon Comprehend Comprehend-Entitätsanalysedatei heruntergeladen und extrahiert haben, laden Sie die extrahierte output
Datei in Ihren Amazon S3 S3-Bucket hoch.
Öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/
. -
Klicken Sie in Buckets auf den Namen Ihres Buckets und wählen Sie dann Upload.
-
Wählen Sie unter Dateien und Ordner die Option Dateien hinzufügen aus.
-
Navigieren Sie im Dialogfeld zu Ihrer extrahierten
output
Datei auf Ihrem Gerät, wählen Sie sie aus und wählen Sie Öffnen. -
Behalten Sie die Standardeinstellungen für „Ziel“, „Berechtigungen“ und „Eigenschaften“ bei.
-
Klicken Sie auf Hochladen.
-
Verwenden Sie den Befehl copy
, um die extrahierte output
Datei in Ihren Bucket hochzuladen: -
Konvertierung der Ausgabe in das Amazon Kendra Kendra-Metadatenformat
Um die Amazon Comprehend-Ausgabe in Amazon Kendra-Metadaten zu konvertieren, führen Sie ein Python-3-Skript aus. Wenn Sie die Konsole verwenden, verwenden Sie AWS CloudShell für diesen Schritt.
-
Laden Sie die komprimierte Datei converter.py.zip auf Ihr Gerät herunter.
-
Extrahieren Sie die Python-3-Datei
converter.py
. -
Melden Sie sich bei der AWS Management Console
an und stellen Sie sicher, dass Ihre AWS Region auf dieselbe Region wie Ihr S3-Bucket und Ihr Amazon Comprehend Comprehend-Analysejob eingestellt ist. -
Wählen Sie das AWS CloudShell Symbol oder geben Sie AWS CloudShellin das Suchfeld in der oberen Navigationsleiste ein, um eine Umgebung aufzurufen.
Anmerkung
Beim ersten AWS CloudShell Start in einem neuen Browserfenster wird ein Begrüßungsfenster mit einer Liste der wichtigsten Funktionen angezeigt. Die Shell ist bereit für die Interaktion, nachdem Sie dieses Fenster geschlossen haben und die Befehlszeile angezeigt wird.
-
Nachdem das Terminal vorbereitet ist, wählen Sie im Navigationsbereich Aktionen und dann im Menü Datei hochladen aus.
-
Wählen Sie in dem sich öffnenden Dialogfeld Datei auswählen und wählen Sie dann die heruntergeladene Python 3-Datei
converter.py
von Ihrem Gerät aus. Klicken Sie auf Hochladen. -
Geben Sie in der AWS CloudShell Umgebung den folgenden Befehl ein:
python3 converter.py
-
Wenn Sie von der Shell-Schnittstelle aufgefordert werden, den Namen Ihres S3-Buckets einzugeben, geben Sie den Namen Ihres S3-Buckets ein und drücken Sie die Eingabetaste.
-
Wenn Sie von der Shell-Schnittstelle aufgefordert werden, den vollständigen Dateipfad zu Ihrer Comprehend-Ausgabedatei einzugeben, geben Sie die Eingabetaste ein und drücken Sie die Eingabetaste.
output
-
Wenn Sie von der Shell-Schnittstelle aufgefordert werden, den vollständigen Dateipfad zu Ihrem Metadatenordner einzugeben, geben Sie die Eingabetaste ein und drücken Sie die Eingabetaste.
metadata/
Wichtig
Damit die Metadaten korrekt formatiert werden, müssen die Eingabewerte in den Schritten 8 bis 10 exakt sein.
-
Um die Python-3-Datei herunterzuladen
converter.py
, führen Sie den folgenden Befehl in einem Terminalfenster aus: -
Um die Python-3-Datei zu extrahieren, führen Sie den folgenden Befehl im Terminalfenster aus:
-
Stellen Sie sicher, dass Boto3 auf Ihrem Gerät installiert ist, indem Sie den folgenden Befehl ausführen.
Anmerkung
Wenn Sie Boto3 nicht installiert haben, führen Sie es aus
pip3 install boto3
, um es zu installieren. -
Führen Sie den folgenden Befehl aus, um das Python 3-Skript zum Konvertieren der
output
Datei auszuführen. -
Wenn Sie AWS CLI dazu aufgefordert werden
Enter the name of your S3 bucket
, geben Sie den Namen Ihres S3-Buckets ein und drücken Sie die Eingabetaste. -
Wenn Sie AWS CLI dazu aufgefordert werden
Enter the full filepath to your Comprehend output file
, geben Sie die Eingabetaste einoutput
und drücken Sie die Eingabetaste. -
Wenn Sie AWS CLI dazu aufgefordert werden
Enter the full filepath to your metadata folder
, geben Sie die Eingabetaste einmetadata/
und drücken Sie die Eingabetaste.
Wichtig
Damit die Metadaten korrekt formatiert werden, müssen die Eingabewerte in den Schritten 5 bis 7 exakt sein.
Am Ende dieses Schritts werden die formatierten Metadaten in dem metadata
Ordner in Ihrem S3-Bucket abgelegt.
Ihren Amazon S3 S3-Bucket aufräumen
Da der Amazon Kendra Kendra-Index alle in einem Bucket gespeicherten Dateien synchronisiert, empfehlen wir Ihnen, Ihren Amazon S3 S3-Bucket zu bereinigen, um redundante Suchergebnisse zu vermeiden.
Öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/
. -
Wählen Sie in Buckets Ihren Bucket aus und wählen Sie dann den Amazon Comprehend Entity Analysis-Ausgabeordner, die Amazon Comprehend Entity Analysis-Datei und die extrahierte Amazon
.temp
Comprehend-Datei aus.output
-
Wählen Sie auf der Registerkarte „Übersicht“ die Option Löschen aus.
-
Wählen Sie unter Objekte löschen die Option Objekte dauerhaft löschen? und geben Sie
permanently delete
in das Texteingabefeld ein. -
Wählen Sie Delete objects (Objekte löschen).
-
Um alle Dateien und Ordner in Ihrem S3-Bucket mit Ausnahme der
metadata
Ordnerdata
und zu löschen, verwenden Sie den Befehl removeim AWS CLI: -
Am Ende dieses Schritts haben Sie die Analyseausgabe der Amazon Comprehend Comprehend-Entitäten in Amazon Kendra Kendra-Metadaten konvertiert. Sie sind jetzt bereit, einen Amazon Kendra Kendra-Index zu erstellen.