Menyetel Kinerja Permintaan Pencarian di Amazon CloudSearch - Amazon CloudSearch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyetel Kinerja Permintaan Pencarian di Amazon CloudSearch

Permintaan pencarian dapat menjadi sangat intensif sumber daya untuk diproses, yang dapat berdampak pada kinerja dan biaya menjalankan domain pencarian Anda. Secara umum, penelusuran yang mengembalikan volume klik yang besar dan kueri terstruktur yang kompleks lebih intensif sumber daya daripada kueri teks sederhana yang cocok dengan persentase kecil dokumen di domain penelusuran Anda.

Jika Anda mengalami waktu respons yang lambat, sering mengalami kesalahan server internal (biasanya kesalahan 507 atau 509), atau melihat jumlah jam instance yang dikonsumsi domain pencarian Anda meningkat tanpa peningkatan substanal dalam volume data yang Anda cari, Anda dapat menyempurnakan permintaan pencarian Anda untuk membantu mengurangi overhead pemrosesan. Bagian ini mengulas apa yang harus dicari dan langkah-langkah yang dapat Anda ambil untuk menyesuaikan permintaan pencarian Anda.

Menganalisis Latensi Kueri

Sebelum Anda dapat menyetel permintaan Anda, Anda harus menganalisis kinerja pencarian Anda saat ini. Catat permintaan pencarian dan waktu respons Anda sehingga Anda dapat melihat permintaan mana yang paling lama diproses. Penelusuran yang lambat dapat secara tidak proporsional memengaruhi kinerja keseluruhan dengan mengikat sumber daya domain pencarian Anda. Mengoptimalkan permintaan pencarian paling lambat mempercepat semua pencarian Anda.

Mengurangi Jumlah Hits

Latensi kueri berbanding lurus dengan jumlah dokumen yang cocok. Pencarian yang cocok dengan sebagian besar dokumen umumnya paling lambat.

Menghilangkan dua jenis pencarian yang biasanya menghasilkan sejumlah besar dokumen yang cocok dapat secara signifikan meningkatkan kinerja keseluruhan:

  • Kueri yang cocok dengan setiap dokumen di corpus () matchall Anda. Meskipun ini bisa menjadi cara yang mudah untuk membuat daftar semua dokumen di domain Anda, ini adalah kueri intensif sumber daya. Jika Anda memiliki banyak dokumen, tidak hanya dapat menyebabkan permintaan lain habis waktu, kemungkinan akan habis sendiri.

  • Awalan (wildcard) mencari dengan hanya satu atau dua karakter yang ditentukan. Jika Anda menggunakan jenis pencarian ini untuk memberikan hasil instan saat pengguna mengetik, tunggu hingga pengguna memasukkan setidaknya dua karakter sebelum Anda mulai mengirimkan permintaan dan menampilkan kemungkinan kecocokan.

Untuk mengurangi jumlah dokumen yang sesuai dengan permintaan Anda, Anda juga dapat melakukan hal berikut:

  • Hilangkan kata-kata yang tidak relevan dari korpus Anda sehingga tidak digunakan untuk pencocokan. Cara termudah untuk melakukannya adalah dengan menambahkannya ke kamus daftar stopwords untuk skema analisis yang Anda gunakan. Atau, Anda dapat memproses data Anda untuk menghapus kata-kata yang tidak relevan. Menghilangkan kata-kata yang tidak relevan juga memiliki manfaat mengurangi ukuran indeks Anda, yang dapat membantu mengurangi biaya.

  • Secara eksplisit memfilter hasil berdasarkan nilai bidang tertentu menggunakan parameter. fq

Jika Anda masih memiliki permintaan yang cocok dengan banyak dokumen, Anda dapat mengurangi latensi dengan meminimalkan jumlah pemrosesan yang harus dilakukan pada set hasil:

  • Minimalkan informasi aspek yang Anda minta. Menghasilkan jumlah aspek menambah waktu yang diperlukan untuk memproses permintaan dan meningkatkan kemungkinan permintaan lain akan habis waktu. Jika Anda meminta informasi aspek, ingatlah bahwa semakin banyak aspek yang Anda tentukan, semakin lama waktu yang dibutuhkan untuk memproses permintaan.

  • Hindari menggunakan ekspresi Anda sendiri untuk menyortir. Pemrosesan tambahan yang diperlukan untuk mengurutkan hasil meningkatkan kemungkinan permintaan akan habis waktu. Jika Anda harus menyesuaikan bagaimana hasil diurutkan, umumnya lebih cepat menggunakan bidang daripada menggunakan ekspresi.

Perlu diingat bahwa mengembalikan sejumlah besar data dalam hasil pencarian dapat meningkatkan waktu transportasi dan memengaruhi latensi kueri. Minimalkan jumlah bidang pengembalian yang Anda gunakan untuk meningkatkan kinerja dan mengurangi ukuran indeks Anda.

Menyederhanakan Kueri Terstruktur

Semakin banyak klausa yang ada dalam kriteria kueri, semakin lama waktu yang dibutuhkan untuk memproses kueri.

Jika Anda memiliki kueri terstruktur kompleks yang tidak berkinerja baik, Anda perlu menemukan cara untuk mengurangi jumlah klausa. Dalam beberapa kasus, Anda mungkin hanya dapat menetapkan batas atau merumuskan ulang kueri. Di tempat lain, Anda mungkin perlu memodifikasi konfigurasi domain Anda untuk mengakomodasi kueri yang lebih sederhana.