本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon CloudSearch 中的文字處理
在編製索引期間,Amazon CloudSearch 會根據為text-array欄位設定的分析方案來處理 text和 欄位,以決定要新增至索引的詞彙。套用分析選項之前,會先將文字字符化與標準化。
在字符化期間,會使用 Unicode Text Segmentation 演算法中定義的分詞規則,在可偵測界限上將欄位中的文字串流分割成個別字符。如需詳細資訊,請參閱 Unicode Text Segmentation
根據分詞規則,以空白字元 (例如空格和定位點) 分隔的字串會被視為單獨字符。在許多情況下,標點符號會被刪除並視為空白字元。例如,字串在連字號 (-) 和 @ 符號 (@) 處執行分割。不過,後面沒有空白字元的句點會被視為字符的一部分。
請注意,字串不會在大小寫界限處執行分割—CamelCase 字串不會進行字符化。
在標準化期間,大寫字元會轉換為小寫字元。重音通常根據欄位的分析方案中所設定的詞幹選項來進行處理。(用於英文的預設分析方案會移除重音。)
完成字符化和標準化後,便會套用分析方案中指定的詞幹選項、停用詞和同義詞。
提交搜尋請求時,您要搜尋的文字會經歷相同的文字處理,因此可對索引中出現的文字加以比對。不過,當您執行字首搜尋時,不會對搜尋詞彙執行文字分析。這表示已啟用相關字詞功能時若搜尋以 s 結尾的字首,通常不會比對該字詞的單數形式。凡結尾為 s 的任何字詞皆會發生這種情況,而不單只限於複數。例如,假使您對電影範例資料的 actor 欄位搜尋 Anders,就會有三部符合條件的電影。若您搜尋 Ander*,則除了同樣三部以外還會多出其他幾部電影。然而,搜尋 Anders* 將找不到任何相符項目。這是因為存放於索引中的字詞為 ander,而 anders 並未出現在索引中。
如果相關字詞功能導致萬用字元搜尋未能傳回所有相關的相符項目,您可以透過將 AlgorithmicStemming 選項設為「無」抑制文字欄位的相關字詞功能,或者將資料對應至 literal 欄位而非 text 欄位。
Amazon CloudSearch 中的特定語言文字處理設定
阿拉伯文 (ar)
演算法詞幹選項:light
預設分析方案:_ar_default_
-
演算法詞幹:
light -
預設停用詞字典:
「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋、「信箋」、「信箋」、」、「信箋」、「信箋」、「信箋」、「信箋」、「信箋」、」、「信箋」、」、「信箋」、」
亞美尼亞文 (hy)
演算法詞幹選項:full
預設分析方案:_hy_default_
-
演算法詞幹:
full -
預設停用詞字典:
第 12 點
巴斯克文 (eu)
演算法詞幹選項:full
預設分析方案:_eu_default_
-
演算法詞幹選項:
full -
預設停用詞字典:
al anitz arabera asko baina bate batzuei batzuek batzue batzue batzuk bera beraiek berauek bere berori beroriek beste bezala da dago dira ditu dute edo egin ereee eurak ez gainera gutxi gutxi guzti haieieiek hainbeste hala hanik hango hari hara hari hark hau hauei hauek huetan hemendikengo hihon hone hone hone hone
保加利亞文 (bg)
演算法詞幹選項:light
預設分析方案:_bg_default_
-
演算法詞幹:
light -
預設停用詞字典:
黑葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉葉
卡達隆尼亞文 (ca)
演算法詞幹選項:full
啟用省略篩選
預設分析方案:_ca_default_
-
演算法詞幹:
full -
預設停用詞字典:
abans ací ah així això al al al al algun alguna algunes alhora allí allò altres amb ambdós ambdues apa aquell aquell aquelles aquells aquesta aquests aquests aquí baix cada cadascú cadascuna cadascunes cadascuns comcontra d'un d'un d'unes d's dalt de dels des despcheds dins dint del deme deme
簡體中文 (zh-Hans)
不支援演算法詞幹
不支援詞幹字典
預設分析方案:_zh-Hans_default_
繁體中文 (zh-Hant)
不支援演算法詞幹
不支援詞幹字典
預設分析方案:_zh-Hant_default_
捷克文 (cz)
演算法詞幹選項:light
預設分析方案:_cs_default_
-
演算法詞幹:
light -
預設停用詞字典:
a s k o i v z dnes cz tímto budeš budem byli jseš můj svým ta tomto tohle tuto jej zda proč máte kam tohoto kdo kteří mi nám tomuto mít mít nic proto kterou byla toho protože asi na�i napi�te re což tím takže sv�ch jeí svmi jste jjto j
丹麥文 (da)
演算法詞幹選項:full
預設分析方案:_da_default_
-
演算法詞幹:
full -
預設停用詞字典:
og i jeg det at en den til er som på de med han af for ikke der var mig sig men et har vi min havde ham hun nu over da fra du ud sin dem os op man hans hvor eller hvad sskal selve alle vil blev kunne ind når være dog noget ville jo deres efter s s skulle denne end dette mit gså under digen hende mine altget sit sine s modor s
荷蘭文 (nl)
演算法詞幹選項:full
預設分析方案:_nl_default_
-
演算法詞幹:
full -
預設停用詞字典:
de en van ik te dat in een hij het zijn is op aan met als voor have er maar om hem dan mjn men dit zo door over ze zich bij ook tot je mij uit daar naar naar heb hoe hoeft hebben deze u want nog zal me zij nu ge geen omdat iets worden toch waren veel meenen moetn zonder han dusesder on jatird eenser
-
預設詞幹字典:
fiets fiets bromfiets bromfiets ei eier kinder
英文 (en)
演算法詞幹選項:minimal|light|full
預設分析方案:_en_default_
-
演算法詞幹:
full -
預設停用詞字典:
a 和 處於原狀,但對於 而言,如果 為 ,則 不是在 上 ,也不是這樣,然後它們的 將
芬蘭文 (fi)
演算法詞幹選項:light|full
預設分析方案:_fi_default_
-
演算法詞幹:
light -
預設停用詞字典:
olla olen olemme olette ovat ole olisi olisit olisimme olisimat olisivat olit olt olin olit olit olitvat ollut olleet en et ei emme ette eivät minä minut minua minussa minuun minulla minulle sinä sinun sinua sinussa sinusta sinuun sinulla sinulta sinulle hän hn hn hntä
法文 (fr)
演算法詞幹選項:minimal|light|full
啟用省略篩選
預設分析方案:_fr_default_
-
演算法詞幹:
minimal -
預設停用詞字典:
au aux avec ce ces dans des du elle en et eux il je la leur lui mais me même mes mes moi monne nos nous on ou par pasTRANS qu que qui sa se ses son sur ta te tes toi tu une vos vos votre c d j l à m n s t y étéeée étées étés és étés és stant suis s estmmes êtes
加里斯亞文 (gl)
演算法詞幹選項:minimal|full
預設分析方案:_gl_default_
-
演算法詞幹:
minimal -
預設停用詞字典:
# galican stopwords aínda alí aquel aquelas aqueles aquilo aquí ao aos así á ben cando che coa comigo connosco contigo convosco coas cos cun cuns cunha cunhas da dalgunhas dalgunhas dalgún dalgúns das de della delas dede dos dunduns dunha dunhas e ela el ela leas eleas enera eeran esas ese e es e e esta esta
德文 (de)
演算法詞幹選項:minimal|light|full
預設分析方案:_de_default_
-
演算法詞幹:
light -
預設停用詞字典:
aber alle allem allen aller ales alals 也是 ander anderem anderen anderes anderm andern anderr anders auch auf aus bei bin bis bist da damit dann der den des dem das derselbe derselben desselben deselben demselben、demselben、sselbe dasselbe dazu deine deinem deinen deiner deines denn derer dessendich dir du diese em dies en dies duch doch dort durch durch
希臘文 (el)
演算法詞幹選項:full
預設分析方案:_el_default_
-
演算法詞幹:
full -
預設停用詞字典:
ο η το ο οι τη τησ τοον τηκ κ κ κ ι ι ιμαι ε ει ιαι ει ει ιμ σ τ ε ε ι σ τ ο σ ο σ ο σ λ λ λ α λ λ λ λ λ λ λ λ λ λ �
希伯來文 (h3)
演算法詞幹選項:full
預設分析方案:_he_default_
-
演算法詞幹:
full -
預設停用詞字典
印度文 (hi)
演算法詞幹選項:full
預設分析方案:_hi_default_
-
演算法詞幹:
full -
預設停用詞字典
匈牙利文 (hu)
演算法詞幹選項:light|full
預設分析方案:_hu_default_
-
演算法詞幹:
light -
預設停用詞字典:
ahogy ahol aki akik akkor alatt általában amelyek amelyekben amelyeket amelynek ami amit amolyan amíg amikor át abban ahhoz annak arra arról azok azon azt azzal azért aztán azonban bár be belül benne cik cikkek cikeket csak de e digig egész egy egye egylenet egyeeéb egye egyeke ege ekel e
印尼文 (id)
演算法詞幹選項:light|full
預設分析方案:id_default_
-
演算法詞幹:
full -
預設停用詞字典:
ada adanya adalah adapun agaknya agar akankah akhirnya aku akulah amat amatlah anda andalah antar diantaranya antara antaranya diantara apaan mengapa apabila apakah apalagi apatah atau ataukah ataupun bagaikan sebagai sebagainya bagaimana bagaimanapun sebagaimana bagaimanakah bagi bahkan bahwa bahwasanya seiknya bana banyakseba beapa seberapa starti startian starti beibegibei bebibegibebi
愛爾蘭文 (ga)
演算法詞幹選項:full
啟用省略篩選
預設分析方案:_ga_default_
-
演算法詞幹選項:
full -
預設停用詞字典:
ach ag agus aon ararna as b' ba beirt bhúr caoga ceathair ceathrair chtó chuig chun cois céad cúig cúigear d' daichead dar deichniúr den dhá do do do do dtí dá dár dó fao faoi faoin faoin faoina faoin faoin gr Fara fiche gach gan Go gur haon hocht i dia idir in sa in sa in le le le le leis le le le le leis
義大利文 (it)
演算法詞幹選項:light|full
啟用省略篩選
預設分析方案:_it_default_
-
演算法詞幹:
light -
預設停用詞字典:
ad alal allo ai agli all agl alla alle con col coi da dallo dai dagli dall dagl dalla dalle di dello dei degli dell degl della delle in nel nello nei negli nell negl nella nelle su sul sullo sui sugli sugl sugl sulla sulle per tratrotrotrotro io tui le noi voi lomio mia miei mie tuo tua tui tue tue tue tue suo suo suo nosue
日文 (ja)
演算法詞幹選項:full
啟用演算法分解
選用字符化字典
預設分析方案:_ja_default_
-
演算法詞幹:
full -
預設停用詞字典:
の に は を げ で げ し し ゕ さ げ げ る る るぁ� るぁ� ぁ� ぁ� ぁ� ぁ�� ぁ� �� め� か なぁ�� ぁ��� ぁ�� ぁ��� ぁ���� ぁ��� ぁ���ぁ���ぁ����
韓文 (ko)
不支援演算法詞幹
啟用演算法分解
預設分析方案:_ko_default_
-
預設停用詞字典
拉脫維亞文 (lv)
演算法詞幹:light
預設分析方案:_lv_default_
-
演算法詞幹:
light -
預設停用詞字典:
aiz ap ar apakš ārpus augšpus bez caur dēļ gar iekš iz kopš labad lejpus līdz no otrpus pa par pār pēc pie pirms pret priekš starp šaipus uz vi�pus virs virspus zem apakšpus un bet jo ja ka lai tomēr tikko turpret ī kaut gan tāē tā ne t tivien kvien āk
多語言 (mul)
演算法詞幹:不支援
預設分析方案:_mul_default_
-
預設停用詞字典
挪威文 (no)
演算法詞幹選項:minimal|light|full
預設分析方案:_no_default_
-
演算法詞幹:
light -
預設停用詞字典:
og i jeg det at en et den til comm på de med han av ikke ikkje der så var meg seg men ett har om vi min mitt ha hadde hun nå over da ved fra du sin dem oss opp man kan hans hvor eller hva skal sjøl here bli blei blei blitt kunne inn når være noe nne e e skun
波斯文 (fa)
不支援演算法詞幹
預設分析方案:_fa_default_
-
預設停用詞字典:
姬冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪�冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪冪
葡萄牙文 (pt)
演算法詞幹選項:minimal|light|full
預設分析方案:_pt_default_
-
演算法詞幹:
minimal -
預設停用詞字典:
de a que e do da em um para com não uma os no se na pormais as dos como mas ao eles à seu sua ou quando muito nos já eu também só pelo pela até isso ela entre depois sem mesmo aos seus quem nas me esese eles ese les eocê essa num suas meu s minha numa pelos el qual nós lhedeles essas s s s s s pelas se e s e e e
羅馬尼亞文 (ro)
演算法詞幹選項:full
預設分析方案:_ro_default_
-
演算法詞幹:
full -
預設停用詞字典:
acea aceasta această acei aceia acel acela acele acelea acest acesta aceste acestea aceşti aceştia acolo acum ai aibă aici al ăla ale alea ălea altceva altcineva ar 是 aş aşadar asemenea asta ăsta astăsta astăstea ăstea ătia asupra aţa auvem avem avei azi bine bucură că că că când care c�recr căc
俄文 (ru)
演算法詞幹選項:light|full
預設分析方案:_ru_default_
-
演算法詞幹:
light -
預設停用詞字典:
第 10 頁 第 14 頁 第 10 頁 第 1 頁 第 1 頁 第 1 頁 第 1 頁 第 1 頁 第 1 頁 第 1 頁 第 1 頁 第 1 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 頁 第 第 頁 第 頁 第 頁 第 頁 第 第
西班牙文 (es)
演算法詞幹選項:light|full
預設分析方案:_es_default_
-
演算法詞幹:
light -
預設停用詞字典:
de la que el en y a los del se las por un para con no una su al lo como más pero sus le ya este sí porque esta entre cuando muy sin sobre también me hasta hay dode quien desdos nos durante todos deo so setrao eotros eso ante ellos esto mí an algunos qués unos o trao tras eél tanl tanto esa
瑞典文 (sv)
演算法詞幹選項:light|full
預設分析方案:_sv_default_
-
演算法詞幹:
light -
預設停用詞字典:
och det att i en jag hon som han på den med var sör så 到 är 男性 ett om havee de av icke mig dhenne då sin nu har inte hans honom skulle hennes där min man ej vid kunde något från ut när efter upp vi dem vara vad över än dig kan sina härha mot alla
泰文 (th)
不支援演算法詞幹
不支援詞幹字典
預設分析方案:_th_default_
-
預設停用詞字典:
幀冪幀幀幀幀幀幀幀幀幀幀幀幀幀幀幀幀幀幀幀幹�幀幀�幀幀��幀�幹�幀��幀�����幹�����幹�幹��幀�����幹��幀�����幹幹幹����幹幹��幹��������幹���幹����幹��幹�����
土耳其文 (tr)
演算法詞幹:full
預設分析方案:_tr_default_
-
演算法詞幹:
full -
預設停用詞字典