AnalysisOptions - Amazon CloudSearch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AnalysisOptions

Deskripsi

Sinonim, stopwords, dan opsi stemming untuk skema analisis. Termasuk kamus tokenisasi untuk bahasa Jepang.

Daftar Isi

AlgorithmicStemming

Tingkat pembatalan algoritmik untuk melakukan:none,,minimal, light atau. full Tingkat yang tersedia bervariasi tergantung pada bahasa. Untuk informasi selengkapnya, lihat Pengaturan Pemrosesan Teks Khusus Bahasa di Panduan CloudSearch Pengembang Amazon

Jenis: String

Nilai yang Valid: none | minimal | light | full

Diperlukan: Tidak

JapaneseTokenizationDictionary

Array JSON yang berisi kumpulan istilah, token, bacaan, dan bagian pidato untuk Tokenizaiton Jepang. Kamus tokenisasi Jepang memungkinkan Anda untuk mengganti tokenisasi default untuk istilah yang dipilih. Ini hanya berlaku untuk bidang bahasa Jepang.

Tipe: String

Wajib: Tidak

StemmingDictionary

Objek JSON yang berisi kumpulan pasangan string: nilai yang masing-masing memetakan istilah ke batangnya. Misalnya, {"term1": "stem1", "term2": "stem2", "term3": "stem3"}. Kamus stemming diterapkan selain stemming algoritmik apa pun. Ini memungkinkan Anda untuk mengesampingkan hasil pembatalan algoritmik untuk memperbaiki kasus-kasus tertentu dari overstemming atau understemming. Ukuran maksimum kamus stemming adalah 500 KB.

Tipe: String

Wajib: Tidak

Stopwords

Sebuah array JSON istilah untuk mengabaikan selama pengindeksan dan pencarian. Misalnya, ["a", "an", "the", "of"]. Kamus stopwords harus secara eksplisit mencantumkan setiap kata yang ingin Anda abaikan. Wildcard dan ekspresi reguler tidak didukung.

Tipe: String

Wajib: Tidak

Sinonim

Objek JSON yang mendefinisikan grup sinonim dan alias. Grup sinonim adalah array array, di mana setiap sub-array adalah sekelompok istilah di mana setiap istilah dalam grup dianggap sebagai sinonim dari setiap istilah lain dalam grup. Nilai alias adalah objek yang berisi kumpulan pasangan string:value di mana string menentukan istilah dan array nilai menentukan masing-masing alias untuk istilah tersebut. Alias dianggap sebagai sinonim dari istilah yang ditentukan, tetapi istilah tersebut tidak dianggap sebagai sinonim dari alias. Untuk informasi selengkapnya tentang menentukan sinonim, lihat Sinonim di Panduan CloudSearch Pengembang Amazon.

Tipe: String

Wajib: Tidak