Amazon S3 Metadaten des Dokuments - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon S3 Metadaten des Dokuments

Mithilfe einer Metadatendatei können Sie Dokumenten in einem Amazon S3 Bucket Metadaten, zusätzliche Informationen zu einem Dokument, hinzufügen. Jede Metadatendatei ist einem indizierten Dokument zugeordnet.

Ihre Metadatendateien müssen in demselben Bucket wie Ihre indizierten Dateien gespeichert werden. Sie können einen Speicherort innerhalb des Buckets für Ihre Metadatendateien angeben, indem Sie die Konsole oder das S3Prefix Feld des DocumentsMetadataConfiguration Parameters verwenden, wenn Sie eine Amazon S3 Datenquelle erstellen. Wenn Sie kein Amazon S3 Präfix angeben, müssen Ihre Metadatendateien am selben Ort wie Ihre indizierten Dokumente gespeichert werden.

Wenn Sie ein Amazon S3 Präfix für Ihre Metadatendateien angeben, befinden sie sich in einer Verzeichnisstruktur parallel zu Ihren indizierten Dokumenten. Amazon Kendra sucht nur im angegebenen Verzeichnis nach Ihren Metadaten. Wenn die Metadaten nicht gelesen werden, überprüfen Sie, ob der Speicherort des Verzeichnisses mit dem Speicherort Ihrer Metadaten übereinstimmt.

Die folgenden Beispiele zeigen, wie der Speicherort des indizierten Dokuments dem Speicherort der Metadatendatei zugeordnet wird. Beachten Sie, dass der Amazon S3 Schlüssel des Dokuments an das Amazon S3 Präfix der Metadaten und dann das Suffix mit angehängt wird, um den Pfad der Metadatendatei .metadata.json zu bilden. Amazon S3 Der kombinierte Amazon S3 Schlüssel mit dem Amazon S3 Präfix und .metadata.json Suffix der Metadaten darf insgesamt nicht mehr als 1024 Zeichen lang sein. Es wird empfohlen, dass Sie Ihren Amazon S3 Schlüssel unter 1000 Zeichen halten, um zusätzliche Zeichen bei der Kombination Ihres Schlüssels mit dem Präfix und dem Suffix zu berücksichtigen.

Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json

Die Metadaten Ihres Dokuments sind in einer JSON-Datei definiert. Bei der Datei muss es sich um eine UTF-8-Textdatei ohne BOM-Markierung handeln. Der Dateiname der JSON-Datei muss lauten. <document>.<extension>.metadata.json In diesem Beispiel ist „Dokument“ der Name des Dokuments, für das sich die Metadaten beziehen, und „Erweiterung“ ist die Dateierweiterung für das Dokument. Die Dokument-ID muss eindeutig sein<document>.<extension>.metadata.json.

Der Inhalt der JSON-Datei folgt dieser Vorlage. Alle Attribute/Felder sind optional, sodass es nicht erforderlich ist, alle Attribute einzubeziehen. Sie müssen für jedes Attribut, das Sie einbeziehen möchten, einen Wert angeben. Der Wert darf nicht leer sein. Wenn Sie den nicht angeben_source_uri, verweisen die von Amazon Kendra in den Suchergebnissen zurückgegebenen Links auf den Amazon S3 Bucket, der das Dokument enthält. DocumentIdist dem Feld zugeordnet s3_document_id und ist der absolute Pfad zum Dokument in S3.

{ "DocumentId": "S3 document ID, the S3 path to doc", "Attributes": { "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed, "custom attribute key": "custom attribute value", additional custom attributes }, "AccessControlList": [ { "Name": "user name", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "For example HTML | PDF. For supported content types, see Types of documents." }

Die Felder _created_at und _last_updated_at Metadaten sind nach ISO 8601 kodierte Datumsangaben. Beispielsweise ist 2012-03-25T 12:30:10 + 01:00 das ISO-8601-Datums-/Uhrzeitformat für den 25. März 2012 um 12:30 Uhr (plus 10 Sekunden) in der mitteleuropäischen Zeitzone.

Sie können dem Attributes Feld über ein Dokument zusätzliche Informationen hinzufügen, die Sie zum Filtern von Abfragen oder zum Gruppieren von Abfrageantworten verwenden. Weitere Informationen finden Sie unter Erstellen von benutzerdefinierten Dokumentfeldern.

Sie können das AccessControlList Feld verwenden, um die Antwort aus einer Abfrage zu filtern. Auf diese Weise haben nur bestimmte Benutzer und Gruppen Zugriff auf Dokumente. Weitere Informationen finden Sie unter Nach Benutzerkontext filtern.