Langkah 1: Menambahkan dokumen ke Amazon S3 - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Langkah 1: Menambahkan dokumen ke Amazon S3

Sebelum menjalankan tugas analisis entitas Amazon Comprehend pada kumpulan data, Anda membuat bucket Amazon S3 untuk meng-host data, metadata, dan keluaran analisis entitas Amazon Comprehend.

Mengunduh kumpulan data sampel

Sebelum Amazon Comprehend dapat menjalankan tugas analisis entitas pada data Anda, Anda harus mengunduh dan mengekstrak kumpulan data dan mengunggahnya ke bucket S3.

  1. Unduh folder tutorial-dataset.zip di perangkat Anda.

  2. Ekstrak tutorial-dataset folder untuk mengakses data folder.

  1. Untuk mengunduhtutorial-dataset, jalankan perintah berikut pada jendela terminal:

    Linux
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Di mana:

    • path/ adalah jalur file lokal ke lokasi tempat Anda ingin menyimpan folder zip.

    macOS
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Di mana:

    • path/ adalah jalur file lokal ke lokasi tempat Anda ingin menyimpan folder zip.

    Windows
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Di mana:

    • path/ adalah jalur file lokal ke lokasi tempat Anda ingin menyimpan folder zip.

  2. Untuk mengekstrak data dari folder zip, jalankan perintah berikut di jendela terminal:

    Linux
    unzip path/tutorial-dataset.zip -d path/

    Di mana:

    • path/ adalah jalur file lokal ke folder zip Anda yang disimpan.

    macOS
    unzip path/tutorial-dataset.zip -d path/

    Di mana:

    • path/ adalah jalur file lokal ke folder zip Anda yang disimpan.

    Windows
    tar -xf path/tutorial-dataset.zip -C path/

    Di mana:

    • path/ adalah jalur file lokal ke folder zip Anda yang disimpan.

Pada akhir langkah ini, Anda harus memiliki file yang diekstraksi dalam folder didekompresi yang disebut. tutorial-dataset Folder ini berisi README file dengan atribusi open source Apache 2.0 dan folder bernama data berisi dataset untuk tutorial ini. Dataset terdiri dari 100 file dengan .story ekstensi.

Membuat sebuah bucket Amazon S3

Setelah mengunduh dan mengekstrak folder data sampel, Anda menyimpannya di bucket Amazon S3.

penting

Nama bucket Amazon S3 harus unik di semua. AWS

  1. Masuk ke AWS Management Console dan buka konsol Amazon S3 di. https://console.aws.amazon.com/s3/

  2. Di Bucket, pilih Buat ember.

  3. Untuk Nama bucket, masukkan nama yang unik.

  4. Untuk Wilayah, pilih AWS wilayah tempat Anda ingin membuat bucket.

    catatan

    Anda harus memilih wilayah yang mendukung Amazon Comprehend dan Amazon Kendra. Anda tidak dapat mengubah wilayah ember setelah Anda membuatnya.

  5. Simpan pengaturan default untuk pengaturan Blokir Akses Publik untuk bucket, Bucket Versioning, dan Tag ini.

  6. Untuk enkripsi Default, pilih Nonaktifkan.

  7. Simpan pengaturan default untuk Pengaturan lanjutan.

  8. Tinjau konfigurasi bucket Anda, lalu pilih Buat bucket.

  1. Untuk membuat bucket S3, gunakan perintah create-bucket di: AWS CLI

    Linux
    aws s3api create-bucket \ --bucket amzn-s3-demo-bucket \ --region aws-region \ --create-bucket-configuration LocationConstraint=aws-region

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda,

    • aws-region adalah wilayah tempat Anda ingin membuat ember Anda.

    macOS
    aws s3api create-bucket \ --bucket amzn-s3-demo-bucket \ --region aws-region \ --create-bucket-configuration LocationConstraint=aws-region

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda,

    • aws-region adalah wilayah tempat Anda ingin membuat ember Anda.

    Windows
    aws s3api create-bucket ^ --bucket amzn-s3-demo-bucket ^ --region aws-region ^ --create-bucket-configuration LocationConstraint=aws-region

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda,

    • aws-region adalah wilayah tempat Anda ingin membuat ember Anda.

    catatan

    Anda harus memilih wilayah yang mendukung Amazon Comprehend dan Amazon Kendra. Anda tidak dapat mengubah wilayah ember setelah Anda membuatnya.

  2. Untuk memastikan bucket berhasil dibuat, gunakan perintah list:

    Linux
    aws s3 ls
    macOS
    aws s3 ls
    Windows
    aws s3 ls

Membuat folder data dan metadata di bucket S3 Anda

Setelah membuat bucket S3, Anda membuat folder data dan metadata di dalamnya.

  1. Buka konsol Amazon S3 di. https://console.aws.amazon.com/s3/

  2. Di Bucket, klik nama ember Anda dari daftar ember.

  3. Dari tab Objek, pilih Buat folder.

  4. Untuk nama folder baru, masukkandata.

  5. Untuk pengaturan enkripsi, pilih Nonaktifkan.

  6. Pilih Buat folder.

  7. Ulangi langkah 3 hingga 6 untuk membuat folder lain untuk menyimpan metadata Amazon Kendra dan beri nama folder yang dibuat pada langkah 4. metadata

  1. Untuk membuat data folder di bucket S3 Anda, gunakan perintah put-object di: AWS CLI

    Linux
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key data/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    macOS
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key data/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    Windows
    aws s3api put-object ^ --bucket amzn-s3-demo-bucket ^ --key data/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

  2. Untuk membuat metadata folder di bucket S3 Anda, gunakan perintah put-object di: AWS CLI

    Linux
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key metadata/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    macOS
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key metadata/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    Windows
    aws s3api put-object ^ --bucket amzn-s3-demo-bucket ^ --key metadata/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

  3. Untuk memastikan bahwa folder Anda berhasil dibuat, periksa isi bucket Anda menggunakan perintah list:

    Linux
    aws s3 ls s3://amzn-s3-demo-bucket/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    macOS
    aws s3 ls s3://amzn-s3-demo-bucket/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    Windows
    aws s3 ls s3://amzn-s3-demo-bucket/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket Anda.

Mengunggah data masukan

Setelah membuat folder data dan metadata, Anda mengunggah kumpulan data sampel ke dalam folder. data

  1. Buka konsol Amazon S3 di. https://console.aws.amazon.com/s3/

  2. Di Bucket, klik nama ember Anda dari daftar ember dan kemudian klik. data

  3. Pilih Unggah dan kemudian pilih Tambahkan file.

  4. Di kotak dialog, navigasikan ke data folder di dalam tutorial-dataset folder di perangkat lokal Anda, pilih semua file, lalu pilih Buka.

  5. Simpan pengaturan default untuk Tujuan, Izin, dan Properti.

  6. Pilih Unggah.

  1. Untuk mengunggah data sampel ke dalam data folder, gunakan perintah salin di AWS CLI:

    Linux
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Di mana:

    • path/ adalah jalur file ke tutorial-dataset folder di perangkat Anda,

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    macOS
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Di mana:

    • path/ adalah jalur file ke tutorial-dataset folder di perangkat Anda,

    • amzn-s3-demo-bucket adalah nama bucket Anda.

    Windows
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Di mana:

    • path/ adalah jalur file ke tutorial-dataset folder di perangkat Anda,

    • amzn-s3-demo-bucket adalah nama bucket Anda.

  2. Untuk memastikan bahwa file dataset Anda berhasil diunggah ke data folder Anda, gunakan perintah list di: AWS CLI

    Linux
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket S3 Anda.

    macOS
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket S3 Anda.

    Windows
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Di mana:

    • amzn-s3-demo-bucket adalah nama bucket S3 Anda.

Di akhir langkah ini, Anda memiliki bucket S3 dengan kumpulan data Anda disimpan di dalam data folder, dan metadata folder kosong, yang akan menyimpan metadata Amazon Kendra Anda.