Amazon S3 metadata dokumen - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Amazon S3 metadata dokumen

Anda dapat menambahkan metadata, informasi tambahan tentang dokumen, ke dokumen dalam Amazon S3 bucket menggunakan file metadata. Setiap file metadata terkait dengan dokumen yang diindeks.

File metadata harus disimpan dalam bucket yang sama dengan file yang diindeks. Anda dapat menentukan lokasi dalam bucket untuk file metadata menggunakan konsol atau S3Prefix bidang DocumentsMetadataConfiguration parameter saat membuat sumber Amazon S3 data. Jika Anda tidak menentukan Amazon S3 awalan, file metadata Anda harus disimpan di lokasi yang sama dengan dokumen yang diindeks.

Jika Anda menentukan Amazon S3 awalan untuk file metadata Anda, mereka berada dalam struktur direktori paralel dengan dokumen yang diindeks. Amazon Kendra terlihat hanya di direktori yang ditentukan untuk metadata Anda. Jika metadata tidak terbaca, periksa apakah lokasi direktori sesuai dengan lokasi metadata.

Contoh berikut menunjukkan bagaimana lokasi dokumen yang diindeks dipetakan ke lokasi file metadata. Perhatikan bahwa Amazon S3 kunci dokumen ditambahkan ke Amazon S3 awalan metadata dan kemudian diakhiran .metadata.json untuk membentuk jalur file metadata. Amazon S3 Amazon S3 Kunci gabungan, dengan Amazon S3 awalan dan .metadata.json akhiran metadata harus tidak lebih dari total 1024 karakter. Disarankan agar Anda menyimpan Amazon S3 kunci Anda di bawah 1000 karakter untuk memperhitungkan karakter tambahan saat menggabungkan kunci Anda dengan awalan dan akhiran.

Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json

Metadata dokumen ditentukan dalam file JSON. File harus berupa file teks UTF-8 tanpa penanda BOM. Nama file dari file JSON harus<document>.<extension>.metadata.json. Dalam contoh ini, “dokumen” adalah nama dokumen yang digunakan metadata dan “ekstensi” adalah ekstensi file untuk dokumen tersebut. ID dokumen harus unik di<document>.<extension>.metadata.json.

Isi dari file JSON mengikuti templat berikut ini. Semua atribut/bidang bersifat opsional, jadi tidak perlu menyertakan semua atribut. Anda harus memberikan nilai untuk setiap atribut yang ingin Anda sertakan; nilainya tidak boleh kosong. Jika Anda tidak menentukan_source_uri, maka tautan yang dikembalikan oleh Amazon Kendra dalam hasil pencarian mengarah ke Amazon S3 bucket yang berisi dokumen. DocumentIddipetakan ke bidang s3_document_id dan merupakan jalur absolut ke dokumen di S3.

{ "DocumentId": "S3 document ID, the S3 path to doc", "Attributes": { "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed, "custom attribute key": "custom attribute value", additional custom attributes }, "AccessControlList": [ { "Name": "user name", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "For example HTML | PDF. For supported content types, see Types of documents." }

Bidang metadata _created_at dan _last_updated_at adalah tanggal yang dikodekan dengan ISO 8601. Misalnya, 2012-03-25T 12:30:10 +01:00 adalah format tanggal-waktu ISO 8601 untuk 25 Maret 2012, pukul 12:30 (ditambah 10 detik) di zona waktu Eropa Tengah.

Anda dapat menambahkan informasi ke bidang Attributes tentang dokumen yang digunakan untuk memfilter kueri atau respons kueri grup. Untuk informasi selengkapnya, lihat Membuat bidang dokumen kustom.

Anda dapat menggunakan AccessControlList bidang untuk memfilter respons dari kueri. Dengan cara ini, hanya pengguna dan grup tertentu yang memiliki akses ke dokumen. Untuk informasi selengkapnya, lihat Penyaringan pada konteks pengguna.