Mencari Data DynamoDB dengan Amazon CloudSearch - Amazon CloudSearch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mencari Data DynamoDB dengan Amazon CloudSearch

Anda dapat menentukan tabel DynamoDB sebagai sumber saat mengonfigurasi opsi pengindeksan atau mengunggah data ke domain pencarian melalui konsol. Ini memungkinkan Anda untuk dengan cepat mengatur domain pencarian untuk bereksperimen dengan mencari data yang disimpan dalam tabel database DynamoDB.

Agar domain penelusuran tetap sinkron dengan perubahan pada tabel, Anda dapat mengirim pembaruan ke tabel dan domain pencarian Anda, atau Anda dapat memuat seluruh tabel secara berkala ke dalam domain pencarian baru.

Mengkonfigurasi CloudSearch Domain Amazon untuk Mencari Data DynamoDB

Cara termudah untuk mengonfigurasi domain pencarian untuk mencari data DynamoDB adalah dengan menggunakan konsol Amazon. CloudSearch Wizard konfigurasi konsol menganalisis data tabel Anda dan menyarankan opsi pengindeksan berdasarkan atribut dalam tabel. Anda dapat memodifikasi konfigurasi yang disarankan untuk mengontrol atribut tabel mana yang diindeks.

catatan

Untuk mengunggah data dari DynamoDB, Anda harus memiliki izin untuk mengakses layanan dan sumber daya yang ingin Anda unggah. Untuk informasi selengkapnya, lihat Menggunakan IAM untuk Mengontrol Akses ke Sumber Daya DynamoDB.

Bila Anda secara otomatis mengonfigurasi domain pencarian dari tabel DynamoDB, maksimal 200 atribut unik dapat dipetakan ke bidang indeks. (Anda tidak dapat mengonfigurasi lebih dari 200 bidang untuk domain pencarian, jadi Anda hanya dapat mengunggah data dari tabel DynamoDB dengan 200 atau lebih sedikit atribut.) Saat Amazon CloudSearch mendeteksi atribut yang memiliki sejumlah kecil nilai berbeda, bidang tersebut diaktifkan faset dalam konfigurasi yang disarankan.

penting

Bila Anda menggunakan tabel DynamoDB untuk mengkonfigurasi domain, data tidak secara otomatis diunggah ke domain untuk pengindeksan. Anda harus mengunggah data untuk pengindeksan sebagai langkah terpisah setelah Anda mengonfigurasi domain.

Mengonfigurasi Domain untuk Mencari DynamoDB menggunakan Konsol Amazon CloudSearch

Anda dapat menggunakan CloudSearch konsol Amazon untuk menganalisis data dari tabel DynamoDB untuk mengonfigurasi domain pencarian. Maksimal 5 MB dibaca dari tabel terlepas dari ukuran tabel. Secara default, Amazon CloudSearch membaca dari awal tabel. Anda dapat menentukan tombol mulai untuk mulai membaca dari item tertentu.

Untuk mengkonfigurasi domain pencarian menggunakan tabel DynamoDB
  1. Buka CloudSearch konsol Amazon di https://console.aws.amazon.com/cloudsearch/home.

  2. Dari panel navigasi kiri, pilih Domain.

  3. Pilih nama domain untuk membuka panel detailnya.

  4. Buka tab Opsi pengindeksan dan pilih Wisaya konfigurasi.

  5. Pilih Amazon DynamoDB.

  6. Pilih tabel DynamoDB yang ingin Anda analisis.

    • Untuk membatasi unit kapasitas baca yang dapat dikonsumsi saat membaca dari tabel, masukkan persentase maksimum unit kapasitas baca yang ingin Anda gunakan.

    • Untuk mulai membaca dari item tertentu, tentukan kunci Mulai hash. Jika tabel menggunakan kunci primer tipe hash dan rentang, tentukan atribut hash dan atribut range untuk item tersebut.

  7. Pilih Berikutnya.

  8. Tinjau konfigurasi yang disarankan. Anda dapat mengedit bidang ini dan menambahkan bidang tambahan.

  9. Setelah selesai, pilih Konfirmasi.

  10. Jika Anda belum mengunggah data ke domain Anda, kosongkan kotak centang Jalankan pengindeksan sekarang untuk keluar tanpa pengindeksan. Jika Anda selesai membuat perubahan konfigurasi dan siap untuk mengindeks data Anda dengan konfigurasi baru, pastikan Run indexing now dipilih. Saat Anda siap menerapkan perubahan, pilih Selesai.

Mengunggah Data ke Amazon CloudSearch dari DynamoDB

Anda dapat mengunggah data DynamoDB ke domain pencarian melalui konsol CloudSearch Amazon atau dengan alat baris perintah CloudSearch Amazon. Saat Anda mengunggah data dari tabel DynamoDB, CloudSearch Amazon mengonversinya menjadi kumpulan dokumen sehingga dapat diindeks. Anda memilih menentukan bidang indeks untuk setiap atribut dalam konfigurasi domain Anda. Untuk informasi selengkapnya, lihat Mengkonfigurasi CloudSearch Domain Amazon untuk Mencari Data DynamoDB.

Anda dapat mengunggah data dari lebih dari satu tabel DynamoDB ke domain Amazon yang sama. CloudSearch Namun, perlu diingat bahwa Anda dapat mengunggah maksimal 200 atribut dari semua tabel yang digabungkan. Jika item dengan kunci yang sama muncul di lebih dari satu tabel yang diunggah, item yang diterapkan terakhir akan menimpa semua versi sebelumnya.

Saat mengonversi data tabel ke kumpulan dokumen, Amazon CloudSearch menghasilkan dokumen untuk setiap item yang dibacanya dari tabel, dan mewakili setiap atribut item sebagai bidang dokumen. ID unik untuk setiap dokumen dibaca dari atribut docid item (jika ada) atau diberi nilai alfanumerik berdasarkan kunci utama.

Saat Amazon CloudSearch menghasilkan dokumen untuk item tabel:

  • Set string dan set angka direpresentasikan sebagai bidang multi-nilai. Jika kumpulan DynamoDB berisi lebih dari 100 nilai, hanya 100 nilai pertama yang ditambahkan ke bidang multi-nilai.

  • Atribut biner DynamoDB diabaikan.

  • Nama atribut dimodifikasi agar sesuai dengan konvensi CloudSearch penamaan Amazon untuk nama bidang:

    • Semua huruf besar dikonversi menjadi huruf kecil.

    • Jika nama atribut DynamoDB tidak dimulai dengan huruf, nama bidang diawali dengan. f_

    • Karakter apa pun selain a-z, 0-9, dan _ (garis bawah) diganti dengan garis bawah. Jika transformasi ini menghasilkan nama bidang duplikat, nomor ditambahkan untuk membuat nama bidang unik. Misalnya, nama atributhåt,h-t, hát akan dipetakan keh_t,h_t1, dan h_t2 masing-masing.

    • Jika nama atribut DynamoDB melebihi 64 karakter, 56 karakter pertama dari nama atribut digabungkan dengan hash MD5 8 karakter dari nama atribut lengkap untuk membentuk nama bidang.

    • Jika nama atribut adalahbody, itu dipetakan ke nama f_body bidang.

    • Jika nama atribut _score itu dipetakan ke nama f_ _score bidang.

  • Atribut angka dipetakan ke bidang CloudSearch int Amazon dan nilainya diubah menjadi bilangan bulat 32-bit yang tidak ditandatangani:

    • Jika atribut angka berisi nilai desimal, hanya bagian integral dari nilai yang disimpan. Semuanya di sebelah kanan titik desimal dijatuhkan.

    • Jika nilainya lebih besar dari yang dapat disimpan sebagai bilangan bulat yang tidak ditandatangani, nilainya terpotong.

    • Bilangan bulat negatif diperlakukan sebagai bilangan bulat positif yang tidak ditandatangani.

Mengunggah Data DynamoDB ke Domain melalui Konsol Amazon CloudSearch

Anda dapat menggunakan CloudSearch konsol Amazon untuk mengunggah hingga 5 MB data dari tabel DynamoDB ke domain pencarian.

Untuk mengunggah data DynamoDB menggunakan konsol
  1. Buka CloudSearch konsol Amazon di https://console.aws.amazon.com/cloudsearch/home.

  2. Dari panel navigasi kiri, pilih Domain.

  3. Pilih nama domain untuk membuka konfigurasinya.

  4. Pilih Tindakan, Unggah dokumen.

  5. Pilih Amazon DynamoDB.

  6. Dari dropdown, pilih tabel DynamoDB yang berisi data Anda.

    • Untuk membatasi unit kapasitas baca yang dapat dikonsumsi saat membaca dari tabel, masukkan persentase maksimum unit kapasitas baca.

    • Untuk mulai membaca dari item tertentu, tentukan kunci Mulai hash. Jika tabel menggunakan kunci primer tipe hash dan rentang, tentukan atribut hash dan atribut range untuk item tersebut.

  7. Ketika Anda selesai menentukan opsi tabel, pilih Berikutnya.

  8. Tinjau item yang akan diunggah. Anda juga dapat menyimpan kumpulan dokumen yang dihasilkan dengan memilih Unduh kumpulan dokumen yang dihasilkan. Kemudian pilih Unggah dokumen.

Menyinkronkan Domain Pencarian dengan Tabel DynamoDB

Agar domain penelusuran tetap sinkron dengan pembaruan ke tabel DynamoDB, Anda dapat melacak dan menerapkan pembaruan ke domain Anda secara terprogram, atau secara berkala membuat domain baru dan mengunggah seluruh tabel lagi. Jika Anda memiliki sejumlah besar data, yang terbaik adalah melacak dan menerapkan pembaruan secara terprogram.

Pembaruan Sinkronisasi Pemrograman

Untuk menyinkronkan perubahan dan penambahan ke tabel DynamoDB Anda, Anda dapat membuat tabel pembaruan terpisah untuk melacak perubahan pada tabel yang Anda cari dan secara berkala mengunggah konten tabel pembaruan ke domain pencarian yang sesuai.

Untuk menghapus dokumen dari domain pencarian, Anda harus membuat dan mengunggah kumpulan dokumen yang berisi operasi penghapusan untuk setiap dokumen yang dihapus. Salah satu opsi adalah menggunakan tabel DynamoDB terpisah untuk melacak item yang dihapus, memproses tabel secara berkala untuk menghasilkan sekumpulan operasi penghapusan, dan mengunggah batch ke domain pencarian Anda.

Untuk memastikan bahwa Anda tidak kehilangan perubahan apa pun yang dilakukan selama pengunggahan data awal, Anda harus mulai mengumpulkan perubahan pelacakan sebelum pengunggahan data awal. Meskipun Anda mungkin memperbarui beberapa CloudSearch dokumen Amazon dengan data yang identik, Anda memastikan bahwa tidak ada perubahan yang hilang dan domain pencarian Anda berisi up-to-date versi dari setiap dokumen.

Seberapa sering Anda menyinkronkan pembaruan tergantung pada volume perubahan dan toleransi latensi pembaruan Anda. Salah satu pendekatannya adalah mengumpulkan perubahan selama periode waktu yang tetap dan pada akhir periode waktu unggah perubahan dan hapus tabel pelacakan periode tersebut.

Misalnya, untuk menyinkronkan perubahan dan penambahan sekali sehari, pada awal setiap hari Anda dapat membuat tabel bernama Updates_YYY_MM_DD untuk mengumpulkan pembaruan harian. Di penghujung hari, Anda mengunggah tabel Updates_YYY_MM_DD ke domain pencarian Anda. Setelah unggahan selesai, Anda dapat menghapus tabel pembaruan dan membuat yang baru untuk hari berikutnya.

Beralih ke Domain Pencarian Baru

Jika Anda tidak ingin melacak dan menerapkan pembaruan individual ke tabel Anda, Anda dapat memuat seluruh tabel secara berkala ke domain pencarian baru dan kemudian mengalihkan lalu lintas kueri Anda ke domain baru.

Untuk beralih ke domain pencarian baru
  1. Buat domain pencarian baru dan salin konfigurasi dari domain yang ada.

  2. Unggah seluruh tabel DynamoDB ke domain baru. Untuk informasi selengkapnya, lihat Mengunggah Data ke Amazon CloudSearch dari DynamoDB.

  3. Setelah domain baru aktif, perbarui entri DNS yang mengarahkan lalu lintas kueri ke domain pencarian lama untuk menunjuk ke domain baru. Misalnya, jika Anda menggunakan Amazon Route 53, Anda cukup memperbarui recordset dengan endpoint layanan pencarian baru Anda.

  4. Hapus domain lama.