Elaborazione di testo in Amazon CloudSearch - Amazon CloudSearch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Elaborazione di testo in Amazon CloudSearch

Durante l'indicizzazione, Amazon CloudSearch elaboratextetext-arrayIn base allo schema di analisi configurato per il campo per stabilire quali termini aggiungere all'indice. Prima che le opzioni di analisi vengano applicate, il testo è in formato token e normalizzato.

Durante la tokenizzazione, il flusso di testo in un campo viene suddiviso in token separati in corrispondenza di delimitazioni rilevabili mediante le regole di interruzione di parola definite nell'algoritmo di segmentazione del testo Unicode. Per ulteriori informazioni, consultare l'argomento relativo alla segmentazione del testo Unicode.

In base alle regole di interruzione di parola, le, stringhe separate da spazi, come spazi e schede, vengono trattate come token separati. In molti casi i caratteri di punteggiatura vengono eliminati e trattati come spazi. Ad esempio, le stringhe vengono suddivise in corrispondenza dei trattini (-) e del simbolo chiocciola (@). Tuttavia, i punti che non sono seguiti da spazi sono considerati parte del token.

Le stringhe non vengono suddivise in corrispondenza delle maiuscole: le stringhe CamelCase non vengono tokenizzate.

Durante la normalizzazione, le lettere maiuscole vengono convertite in minuscole. Gli accenti vengono in genere gestiti secondo le opzioni di stemming configurate nello schema di analisi del campo. (Lo schema di analisi predefinito per l'inglese rimuove gli accenti).

Una volta completate la tokenizzazione e la normalizzazione, vengono applicati le opzioni di stemming, le stopword e i sinonimi specificati nello schema di analisi.

Quando si invia una richiesta di ricerca, il testo cercato subisce lo stesso processo di elaborazione del testo in modo che possa essere confrontato con i termini visualizzati nell'indice. Tuttavia, quando si esegue una ricerca di prefissi, on viene eseguita alcuna analisi del testo sul termine di ricerca. Ciò significa che la ricerca di un prefisso che termina con s solitamente non restituirà la versione al singolare del termine se è attivato lo stemming. Questo può accadere per qualsiasi termine che finisca con s, non soltanto per i plurali. Ad esempio, se ricerchi Anders nel campo actor nei dati di esempio dei film, saranno restituiti tre film. Se ricerchi Ander*, otterrai quei film e molti altri. Se invece ricerchi ricerchi Anders* non otterrai alcuna corrispondenza, in quanto il termine è archiviato nell'indice come ander (anders non appare nell'indice).

Se lo stemming impedisce che le ricerche con caratteri jolly restituiscano tutte le corrispondenze pertinenti, puoi eliminare lo stemming per il campo di testo impostando l'opzione AlgorithmicStemming su none oppure puoi mappare i dati a un campo literal invece che a un campo text.

Impostazioni di elaborazione del testo specifiche della lingua in Amazon CloudSearch

Arabo (ar)

Opzioni di stemming algoritmico: light

Schema di analisi predefinito: _ar_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    من ومن منها منه في وفي في فيها فيه طم الا بها به ا اى اي أي أى لا ولا الا الا ألا لكن ما وما كما فما فما عن ما عن ما ما مع ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ما ا أنها نها انه أنه نه بان بان فان فان فأن وان وأن ون التى التي التي الي الي الين الين اليلى على عليها عليه اما أما ما اما اما اما اما اما اما اما اما اما اما اما اما اما اما اما اما اما ا أيا كل وكل لم ولم لن ولن هى هي هن وهى وهي وهي وهي وهى فهي فهه انت أنت لجلها له هه ها تلجلم هناه كاه كانت كان يكون تكون وكانت وكان لير بقد نحن بين بين بين بينما منمن حيالان ان ان الن ان ان خلان ان خلان خلان خلان خلان خلان خلان خلان خلان خل بعد قبل حتى عند عندما لدى جميع

Armeno (hy)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _hy_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    այդ այլ այն այս դու դուք եմ են ենք ես եք է էի էին էինք էիր էիք էր ըստ թ ի ին իսկ իր կամ համար հետ հետո մենք մեջ մի ն նա նաև նրա նրանք որ որը որոնք որպես ու ում պիտի վրա և

Basco (eu)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _eu_default_

  • Opzioni di stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    al anitz arabera asko baina batean batek batzuei batzuei batzuek batzuetan batzuk bera beraiek berauek bere beroriek beste bezala da dago dira ditu du dute edo egin ere eta eurak ez gainera gu gutxi guzti haiei haiek haietan hainbeste hala han han dik hango hara hari hark hartan hau hauei hauek hauetan hemen hemendik hemengo hi hona honek honela honetan honi hor horiei horiek horietan horko horra horrek horrela horretan horri hortik hura izan ni noiz nola non nondik nongo nora ze zein zen zenbait zer zergatik ziren zituen zu zuek zuen zuten

Bulgaro (bg)

Opzioni di stemming algoritmico: light

Schema di analisi predefinito: _bg_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    а аз ако ала бе без беше бил била били било близо бъдат бъде бяха в вас ваш вероятно вече взема вие винаги все всеки всички всичко всяка във въпреки върху г ги главно го д да дали до докато докога досега е едва един един ета о зад заедно заради засега затова защо защото и из или им има имат иска й каза каква какво както какъв като кога когато което които който колко която къде където ли м между н ми мнозина мога могат може моля момента му н на над назад направи напред например нас него нея ние никой ний ний нто някои някой няма обаче около освен особено отгоре отново още пак по повече повечето под поне поради после почти прави пред преди през пък първо с са само сега скоро след сме сме оред сред срещу сте съм със също т тази такива такъв там твой те тези тн то това този той толкова точно точно точно рябва тук тъй тя тях у харесва ч често чрез ще щом я

Catalano (ca)

Opzioni di stemming algoritmico: full

Abilitato per il filtro di elisione

Schema di analisi predefinito: _ca_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    a abans ací ah així això al als aleshores algun alguna algunes alhora allà allò altra altre altres amb ambdós ambdues apa aquell aquella aquelles aquells aquest aquesta aquestes aquests aquí baix cada cadascú cadascune cadascuns com contra d'un d'un d'una d'unes d'uns dalt de del dels des després dins dintre donat doncs durant e eh el els em en encara ens entre érem eren éreu es és esta està estàvem estaven estàveu esteu et etc ets pins fora gairebé ha havia he hem heu hi i igual iguals ja l'hi la les li li'n llavors m'he ma mal malgrat mateix mateixa mateixes mateixos me mentre més meu meus meva meves molt molta moltes molts mon mons n'he n'hi ne ni no nogensmenys només nosaltres nostra nostre nostres o oh oi su pas pel pels per però perquè poc poca pocs poques potser propi qual quals quan quant que què quelcom qui quina quines quins s'ha sa semblant sembianti ses seu seus seva seva seves si sobre sobretot sóc solament sols son són sons sota sou t'ha t'han ta tal també tampoc tan tant tanta tantes teu teva teves ton tot tota totes tots un una unes uns us va vaig vam van vas veu vosaltres vostra vostres

Cinese semplificato (zh-Hans)

Stemming algoritmico non supportato

Dizionario di stemming non supportato

Schema di analisi predefinito: _zh-Hans_default_

Cinese tradizionale (zh-Hant)

Stemming algoritmico non supportato

Dizionario di stemming non supportato

Schema di analisi predefinito: _zh-Hant_default_

Ceco (cz)

Opzioni di stemming algoritmico: light

Schema di analisi predefinito: _cs_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    a s k o i u v z dnes cz tímto budeš budem byli jseš můj svým ta tomto tohle tuto tyto jej zda proč máte tato kam tohoto kdo kteří mi nám tom tomuto mít nic proto kterou byla toho protože asi ho naši napište re což tím takže svých její svými jste aj tu tedy teto bylo kde ke pravé ji nad nejsou či pod téma mezi přes ty pak vám ani když však neg jsem tento články aby jsme před pta jejich byl ještě až bez také pouze první vaše která nás nový tipy pokud může strana jeho své jiné zprávy nové není vás jen podle zde už být více bude již než který di které co nebo ten tak má při od po jsou jak další ale si se ve to jako za zpět ze do pro je na atd atp jakmile přičemž já su ona ono oni ony my vy jí ji mne jemu tomu těmu němu němuž jehož jelikož jež jakož načež

Danese (da)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _da_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    og i jeg det en den til er som på de med han af per ikke der var mig sig men et har om vi min havde prosciutto hun nu sopra da fra du ud sin dem os op man hans hvor eller hvad skal selv lei alle vil blev kunne ind når være cane noget ville jo deres efter ned skulle denne mit så sotto hanno scavare anden hende miniera alt meget sit sine vor mod disse hvis din nogle hos blive rogna ad bliver hendes været thi jer sådan

Olandese (nl)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _nl_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    de en van ik te dat die in een hij het niet zijn è stato op aan met als voor aveva er maar om hem dan zou di wat mijn men dit zo porta sopra ze zich bij ook tot je mij uit der daar haar naar heb heeft heebben deze u want nog zal me zij nu ge geen omdat iets worden toch al waren veel meer doen toen moet ben zonder kan hun dus alles onder ja eens hier wie werd altijd doch wordt wezen kunnen ons zelf tegen na canne wil kon niets uw iemand geweest andere

  • Dizionario di stemming predefinito:

    fiets fiets bromfiets bromfiets ei eier tipo kinder

Inglese (en)

Opzioni di stemming algoritmico: minimal|light|full

Schema di analisi predefinito: _en_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    a un e sono come a essere ma da per se in dentro non è non di su o tale che il loro allora là questi a è stato volontà con

Finlandese (fi)

Opzioni di stemming algoritmico: light|full

Schema di analisi predefinito: _fi_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    olla olen olet su olemme olette ovat ole oli olisi olisit olisin olisimme olisitte olisivat olit olin olimme olitte olivat ollut olleet en et emme ette eivät minä minun minut minua minussa minusta minuun minulta minulle sinä sinun sinut sinussa sinusta sinulla sinulta sinulle hän hänen hänet häntä hänessä hänestä häneen hänellä häneltä hänelle me meidän meidät meitä meissä meistä meihin meillä meiltä meille te teidän teidät teitä teissä teistä teihin teillä teiltä teille he heidätä teille n heidät heitä heissä heistä heihin heillä heiltä heille tämä tämän tätä tässä tästä tähän tallä tältä tälle tänä täksi tuo tuon tuotä tuossa tuosta tuohon tuolla tuolta tuolle tuona tuoksi se sen sitä siinä siitä siihen sillä siltä sille sinä siksi nämä näiden näitä näissä näistä näihin näillä näiltä näille näille näille näille näille näiltä näille näille näillinininininininä näille ä näiksi nuo noiden noita noissa noista noihin noilla noilta noille noiksi ne niiden niitä niissä niistä niihin niillä niiltä niille niinä niiksi kuka kenen kenet ketä kenessä kenestä keneen kenellä keneltä kenelle kenenä keneksi ketkä keiden ketkä keitä keistä keihin keillä keiltä keinä keinä keiksi mikä minkä mitkä missä mistä mihin millä miltä mille minä miksi mitkä joka jonka jossa jossa johon jolla jolta jolle jona joksi jotka joiden joita joissa joihin joilla joilta joille joiksi että ja jos koska kuin mutta niin sekä sillä tai vaan vai vaikka kanssa mukaan noin poikki yli kun niin nyt itse

Francese (fr)

Opzioni di stemming algoritmico: minimal|light|full

Abilitato per il filtro di elisione

Schema di analisi predefinito: _fr_default_

  • Stemming algoritmico: minimal

  • Dizionario delle stopword predefinito:

    au aux avec ce ces dans de des du elle en et eux il je la leur lui ma mais me même mes moi mon ne nos notre nous on ou par pas pour qu que qui sa se ses son sur ta te tes toi ton tu un une votre vous c d j l à m n s t y été ées étés étant is es est sommes êtes sont serai seras sera serons serez seront serais serait serions seraient étais était étions étiez étaient fus fut fûmes fûtes furent sois soit soyons soyez soient fusse fusses fût fussions fussiez fussent ayant eu eue eues eus ai as avons avez ont aurai aura aurons aura auons auront aurais aurait aurions auriez auraient avais avions aviez avaient eut eûmes eûtes eurent aie aies ait ayons ayez aient eusse eusses eût eussions eussions ceci celà cette ici ils les leurs quel quels quelles sans soi

Galiziano (gl)

Opzioni di stemming algoritmico: minimal|full

Schema di analisi predefinito: _gl_default_

  • Stemming algoritmico: minimal

  • Dizionario delle stopword predefinito:

    # stopwords galican a aínda alí aquel aquela aquelas aqueles aquilo aquí ao aos as as á ben cando che co coa comigo con connosco contigo convosco coas cos cun cuns cunha cunhas da dalgunhas dalgún dalgúns das de del dela delas deles desde deste do dos dun duns dunhas e el ela elas eles en era eran esa esas ese eses esta estar está están este estes estiven estou eu é facer foi foron fun había hai iso isto la las lle lles lo los mais me meu meus min miñas moi na nas neste nin no non nos nosa nosas nosos nós nun nunha nunhas o os ou ó ós para pero pode pois polas polo polo por que se senón ser seu seus sexa sido sobre súa súas tamén tan te ten teñen teño ter teu teus ti tido tiña tiven túa túas un unha unhas uns vos vosa vosas vosos vós

Tedesco (de)

Opzioni di stemming algoritmico: minimal|light|full

Schema di analisi predefinito: _de_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    aber alle allem allen aller alles als sono anche un ander andere anderem anderen anderes anderm andern anderr anders auch auf aus bei bin bis bist da damit dann der den des dem die das daß derselbe denselben desselben demselben dieselbe dieselben dasselbe dazu dein deine deinem deine deinem deiner deines denn derer dessen dich dir du dies diese diesem diesen dieser dieses doch dort durch ein eine einem einen einen eines einig einige einigem einigen einiges einmal er ihn ihm es etwas euer eure eurem euren eurer eures für gen Hab habe haben cappello hatte hatten hier hin hinter ich mich mir ihr ihre ihrem ihren ihrer ihres euch im in indem ins ist jede jedem jeden jeder jedes jene jenem jenen jener jenes jetzt kann kein keine keinem keinen keiner keines können könnte machen man manche manchem manchen manches mein meine meinem meinen meiner meines mit muses musste nach nicht nichts noch nun nur ob oder ohne sehr sein seine seinem seinen seiner seines selbst sich sie ihnen sind così solche solchem solchen solcher solches soll sollte sondern sonst über um und uns unse unsem unsen unser unses unter viel vom von vor während guerra waren warst era weg weiter welche welchem Welchen welcher Wenn werde werden wie wieder wir wird wirst wo wollte würde würden zu zum zur zwar zwischen

Greco (el)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _el_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    ο η το οι τα του τησ των τον την και κι ειμαι εισαι ειναι ειμαστε ειστε στε στο στον στη στην μα αλλα απο για προσ με σε ως παρε ωσ παρε ως παρε ως πας πε ως πας πε ωσ πας πας πας παρε ως παα αντι κατα μετα θα να δε δεν μη μην επι ενω εαν τοτε που πωσ ποιοσ ποια ποιο ποιοι ποιεσ ποιων πουσ αυτοσ αυτη αυτη αυτη αυτη αυτη αυτη αυτη αυτη αυτη αυτη αυτη αυτη αυτοι αυτων αυτουσ αυτεσ αυτα εκεινοσ εκεινη εκεινο εκεινοι εκεινεσ εκεινα εκεινων εκεινουσ οπωσ ομωσ ισωσ οσο οτι

Ebraico (h3)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _he_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito

Indi (hi)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _hi_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito

Ungherese (hu)

Opzioni di stemming algoritmico: light|full

Schema di analisi predefinito: _hu_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    un ahogy ahol aki akik akkor alatt által általában amely amelyek amelyekben amelyeket amelyet amelynek ami amit amolyan amíg amikor át abban ahhoz annak arra arról az azok azon azt azzal azért azután azonban bár be belül benne cikk cikkek cikkeket csak de e eddig egész egy egyes egyetlen egyéb egyik egyre ekkor el elég ellen elő először előtt első én éppen ebben ehhez emilyen ennek erre ez ezt ezek ezen ezzel ezért és fel felé hanem hiszen hogyan igen így illetve illetve ill. ill ilyen ilyenkor ison ismét itt jó jó jót l jobban kell kellett keresztül keressünk ki kívül között közül legalább lehet lehetett legyen lenne lenni lesz lett maga magát majd már más másik meg még mellett mert mely melyek mi mit míg miért milyen mikor minden mindenki mindig menta mintha mivel nagyobb nagyon ne néha nekem neki nem néhány nélkül nincs olyan ott össze ő ők őket pedig persze rá s saját sem semmi sok sokat sokkal számára szemben szerint szinte talán tehát teljes tovább továbbá több úgy ugyanis új újabb újra után utána utolsó vagy vagyis valaki valami valamint való vagyok van vannak volt voltak voltunk voltunk vissza vele viszont

Indonesiano (id)

Opzioni di stemming algoritmico: light|full

Schema di analisi predefinito: id_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    ada adanya adalah adapun agak agaknya agar akan akankah akhirnya aku akulah amat amatlah anda andalah antar diantaranya antara antaranya diantara apa apaan mengapa apabila apakah apalagi apatah atau ataupun bagai bagaikan sebagai seainbagai bagaimana bagaimanapun sebagaimana bagaimanakah bagi bahkan bahwa bahwasanya sebaliknya banyak sebanyak beberapa seberapa begini beginikah beginilah sebegini begitu begitu begitulah begitulah begitupun sebegitu belum belumlah sebelum sebelumnya sebenarnya berapakah berapapapapun betulkah sebetulnya ya biasa biasanya bila bilakah bisa bisakah sebisanya boleh bolehkah bolehlah buat bukan bukankah bukanlah bukannya cuma percuma dahulu dalam dan dapat dari daripada dekat demikian demikianlah sedemikian dengan depan di dia dialah dini diri dirinya terdiri dong dulu enggaknya entah terhadap terhadapnya hal hampir hanya hanyalah harus haruslah harusnya seharusnya hendak hendaklah hendaknya hingga ia ialah ibarat ingin inginkah inginkan ini inikah inilah itu itukah itulah jangan jangankan jangankan janganlah jikalau juga justru kala kalau kalaulah kalaupah kalian kami kamilah kamu kamulah kan kapan kapankah kapanpun dikarenakan karena karenanya ke kecil kemudian kenapa kepada kepadanya ketika seketika khususnya kini kinilah kiranya kita kitalah kok lagi lagian selagi lah lain lainnya melainkan selaku lalu melalui terlalu lama lamanya selama selamanya lebih terlebih bermacam macam macam makanya makin malah malahan mampu mampukah mana manakala manalagi masih masihkah semasih masing mau maupun semaunya memang mereka merekalah meski meskipun semula mungkin mungkinkah nah namun nanti nantinya nyaris oleh olehnya seorang seseseorang pada padanya padahal paling sepanjang pantas sepantasnya sepantasnyalah para pasti pastilah per pernah pula gioco di parole merupakan rupanya serupa saat saatnya sesaat saja sajalah vendita bersama sama sesama sambil sampai sana sangat sangatlah saya sayalah se sebab sebabnya sebuah tersebut tersebutlah sedangkan sedikit sedikitnya segala segalanya segalanya sesegalanya sejak sejenak sekali sekalian sekalipun sesesekali sekaligus sekarang sekarang sekitarnya sela selain seluruh seluruhnya semakin sementara sempat semua semuanya sendiri sendirinya seolah seperti sepertinya seringnya serta siapa siapakah siapapapun disini disinilah sini sinilah sesuatu sesuatu suatu sesudah sesudahnya sudah sudahkah sudahlah supaya tadi tadinya tak tanpa setelah telah tentang tentu tentulah tentunya tertentu seterusnya tapi tetapi setiap tiap setidaknya tidak tidakkah tidaklah toh waduh wah wahai sewaktu walau walaupun wong yaitu yakni yang

Irlandese (ga)

Opzioni di stemming algoritmico: full

Abilitato per il filtro di elisione

Schema di analisi predefinito: _ga_default_

  • Opzioni di stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    a ach ag agus an aon ar arna come b' ba beirt bhúr caoga ceathair ceathrar chomh chtó chuig chun cois céad cúig cúigear d'daichead dar de deich deichniúr den dhá do don dtí dár dó faoin faoina faoinár fara schede gach gan go gur haon hocht i iad idir in ina ins inár is le leis lena lenár m'mar mo mé na nach naoi naonúr ná ní níor nó nócha ocht ochtar os roimh sa seacht seachtar seachtó seasca seisear siad sibh sinn sna sé sí tar thar thú triúr trína trínár tríocha tú um ár é éis í ó ón óna ónár

Italiano (it)

Opzioni di stemming algoritmico: light|full

Abilitato per il filtro di elisione

Schema di analisi predefinito: _it_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    ad al allo ai agli all agl alla alle con col coi da dallo dai dai dall dagl dalla dalle di dello degli degli dell degl della in nel nei nell negl nella su sullo sullo sui sull sugl sulla per tra contro io lei noi voi voi loro mio miei mie tua tua tua sua suoi suo nostro nostra nostra nostri nostri nostre nostre vostre vostre vostre vostre mi ti ci vi vi lo la li le gli ne il uno ma ed se perché anche come dov dove che chi non più quale quanti quanti quanta quante quello quelli quella questi questi questa questa si tutto tutti a c e i l o ho hai hai abbiamo avete hanno abbia abbiate abbiano avrò avranno avranno avranno avranno avrei avremmo avremmo avremmo avremmo avremmo avreste avremmo avreste avreste avevate avevate avevano avevate ebbi avesti ebbe avemmo avemmo avemmo avessimo avere avuto avessimo avuto avuta avuti avute avute sono sei siete siete siate siate siano sarsaremo sarete saresti saresti saremmo saremmo sareste sarebbero ero eri era eravamo eravate erano fui fosti fu fummo foste furono fossimo fossimo fossero essendo faccio fai fanno facciate facciano farete farete farete faresti faresti faresti faremmo faremmo faremmo faremmo faremmo faremmo faremmo faremmo faremmo fareste fareste farebbero fareste fareste fareste fareste fareste fareste fareste fareste fareste facevi facevi facevano facevano facevano facevano facesti facemmo facemmo faceste facessi facessi facessi facessi facessimo sto sta sta sta sta sta sta stiate stiate stiano starai starai starà staremo staremo staremo starete starete starete starete staresti starebbero stavi stava stavamo stavate stavano stavano stetti stesti stette stemmo steste stettero stessi stessimo stessimo stessimo stessimo stando

Giapponese (ja)

Opzioni di stemming algoritmico: full

Scomposizione algoritmica abilitata

Dizionario di tokenizzazione facoltativo

Schema di analisi predefinito: _ja_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    到 は ある いる る いる なる ななない まる たるからなる るるるににる られる にる にる にかるる にかるかるかなくしかには は、は、るるのできる うの到 なのとにれる おれる いうらは は にする たにする たます ん なにしたたにまたは はのにする とんとといっです とし

Coreano (ko)

Stemming algoritmico non supportato

Scomposizione algoritmica abilitata

Schema di analisi predefinito: _ko_default_

  • Dizionario delle stopword predefinito

Lettone (lv)

Stemming algoritmico: light

Schema di analisi predefinito: _lv_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    aiz ap ar apakš ārpus bez caur dēgar iekš iz kopš labad lejpus līdz no otrpus pa par pār pēc pie pirms pret priekš starp šaipus uz viņpus virs zem apakšpus un bet jo ja ka lai tomēr tikko turpretī ī kaut gan tādētā ne tikvien vien kā ir te vai kamēr ar diezin droši diemžēl nebūt ik taču nu pat tiklab iekšpus nedz tik nevis turpretim jeb iekam iekām iekām kolīdz līdzko tiklīdz jebšu tālab tāpēc nekā itin jā jau jel nnezin tad tikai vis tak iekams vien būt biju ji bija bijām bijāt esmu esi esam esat būšu būsi būsim būsiet tikt tiku tiki tikām tikāt tieku tiek tiekam tiekam tiekat tikšu tiks tiksim tiksiet tapt tapi tapāt topat tapšu tapsi rubinetti tapsim tapsiet kļūt kļuvu kļuvi kļuvām kļuvāt kļūstu kļūsti kļūst kļūstam kļūstat kļūšu kļūsi kļūs kļūs kļūs kļūs kļūs kļūs kļūs ļūsiet varēt varēju varējām varēšu varēsim var varēji varējāt varēsi varēsiet varat varēja varēs

Più lingue (mul)

Stemming algoritmico: non supportato

Schema di analisi predefinito: _mul_default_

  • Dizionario delle stopword predefinito

Norvegese (no)

Opzioni di stemming algoritmico: minimal|light|full

Schema di analisi predefinito: _no_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    og i jeg det en et den til er som på de med han av ikke ikkje der så var meg seg men ett har om vi min guanto ha hadde hun nå sopra da ved fra du ut sin dem oss opp man kan hans hvor eller hva skal selv sjøl suo alle vil vli ble blei blitt kunne inn når ære kom noen noe ville dere som deres kun ja Etter ned skulle denne per deg si sine sitt mot å meget hvorfor dette disse uten hvordan ingen din ditt blir samme hvilken hvilke sånn inni mellom vår hvem vors hvis både bare enn fordi før mange også slik vært være båe begge siden dykge k dykkar dei deira deires deim di då es ein eit eitt elles honom hjå ho hoe henne hennar hennes hoss hossen ikkje ingi inkje korleis korso kva kvar kvarhelst kven kvi kvifor me medan mi mine mykje no nokon noka nokor noko nokre si sia sidan così somt somme um upp vere vore verte varte vart

Persiano (fa)

Stemming algoritmico non supportato

Schema di analisi predefinito: _fa_default_

  • Dizionario delle stopword predefinito:

    انان نداشته سراسر خياه ايشان وي تاكنون بيشتري دوم دس ناشي ون يا داشتند سا داشتند سس هنا م هرنشنشان امسال ديل دير شديد شديد شند شديد شند شديد شدند طور ده ده دطنخستين ولي را ه وسه كدام قابل يجت رفت هفت همنين در هزار بلي شايد اما شناسي شرفته داشته داشته دانست داتت داشت داشت داشتتتتتت داشت داشت داشتتتت داشت داشت داشتتتتن خواهيم ميليارد وقتيكه امد خواهد جن اورده شده بلكه خدمات شدن برخي نبود بسياري جلويري حق كردند نوعي بعري نكرده نير نبايد بوده بودن داد اورد هست شود دنبال دادنبال دادايد سابق هيهمان ان ان ان ان ان ان ان ان ان ان ان ان ان ان ان انجا نجا كمتر كجاست ردد كسي تر مردم تان دادن بودند سري جدا ندارند من يكديدير دارد دهند بنابراين هنامي سمي ست جا انه خود دادادادند زند زند زند زند زند زند زند دند زند زند زند زند زند زند زند ياد دارند ار بدون بهترين بيشتر البته به براساس بيرون كرد بعي رفت اي اي ميليون اطجريان تول بر ماند برابر باشيم مدتي ويند اكنون تا تنها جديد ند بي نشده كردن كردن كردم كرده كنيم نيم نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نزد نقصد فقبالاي ديران اين ديروتوسسوم ايم داند سوي استفاده شما كنار دار داريم ساخته طور امده رفته نخست بيست نزيت نزديت طيت كيت كيت كنست كنست كنديت بيت كنكنكنديت بيت بيت كنكنست يد انها تمامي داشت يكي طريق ايست روه نمايد فت ندين ين يزي تواند ام ايا با ان ايد ترين اينكه ديري راه هايي بروهمنان اعين كس حدود مختلمقابل يطيرد ندارد ممون سازي شان مورد باره مره مره مره مره مره مره سي خويبرخوردار ون خارشهنوتحت من هستيم فته فكر بسيار براي روزهاي روزهاي انكه نخواهد بالا كل وقتي كي كي كه كه كه نيست است كجا كند نين يابد بندي حتي توانند عقی خواست كند بين تمام همه ما باشند مل شد اري باشد اره طبعد اصورت ير جاي بيرير جاي بيريزي اند زيرا ونه بار لطفا مي درباره من ده همين اري عبري عباري عععباري عععباري لت شته هم فوق نه ها شوند اباد همواره هر اول خواهند هار نام امرومان هان هاي قبل كنم سعي تازه را هستند زير جلوي عنوان بد بوان بون بون بد بون بون بون بون بون بون بون بون بون بون بون بد

Portoghese (pt)

Opzioni di stemming algoritmico: minimal|light|full

Schema di analisi predefinito: _pt_default_

  • Stemming algoritmico: minimal

  • Dizionario delle stopword predefinito:

    de a o que e do da em um para com não uma os no se na por mais as dos como mas ao ele das à seu sua ou quando muito nos já eu também só pelo pela até isso ela entre depois sem mesmo aos seus quem nas me esse esse eles você essa num nem suas meu às minha numa pelos elas qual nólos s lhe deles essas esses pelas este dele tu te vocês vos lhes meus minhas teu tua teus tuas nosso nossa nossos nossas dela delas esta estes estas aquele aqueles aquelas isto aquilo estou está estamos estão estive estivemos estiveram estavam estivera estivéramos estejamja os estejam estivesse estivéssemos estivessem estiver estivermos estiverem hei há havemos hão houvemos houveram houvéramos haja hajamos hajam houvesse houvéssemos houvessem houvermos houvermos houverem houverei houverá houveremos houveria houveríamos houveríamos houveriam sou somos são ér ramos eram fui foi fomos foram fora fôramos seja sejamos sejam fosse fôssemos fossem per formos forem serei será seremos serão seria seríamos seriam tenho tem temos tém tinha tínhamos tinham tive teve tivemos tiveram tivera tivéramos tenha tenhamos tenham tivesse tivéssemos tivessem tiver tivermos tiverem terá terá s terão teria teríamos teriam

Romeno (ro)

Opzioni di stemming algoritmico: full

Schema di analisi predefinito: _ro_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito:

    acea aceasta această aceea acei aceia acel acele acelea acest acesta aceste acestea aceşti aceştia acolo acum ai aia aibă aici al ăla ale alea ălea altceva altcineva am ar sono aş aşadar asemenea asta ăsta astăzi astea ăstea ăştia asupra aţi au avea avem aveţi azi bine bucur bună ca că căci când care cărei căror cărui câte câţi către câtva ce cel ceva chiar cînd cine cineva cît cîte cîte cîtva contra cu cum cumva curând da dă dacă dar datorită de deja deoarece deşi din dinaintea dintr dintre drept după ea ei el ele eram este eşti eu face fără fi fie fiecare fii fim fiţi iar ieri îi îl îmi împotriva în înainte înaintea încât încît încotro între întrucât întrucît îţi la lângă le li lîngă lor lui mă mâine mea mei mele mereu mi mine multă multă ne nicăieri nimeni nişte noastră noastre noi noştri nostru nu ori oricând oricare oricât orice oricînd oricine oricît oricum oriunde până pe pentru peste pînă poate pot prea prima primul prin printr sa să săi vendita sau său se şi sînt sîntem sînteţi spre sub sunt suntem sunteţi ta tăi tale tău te ţi ţie tine toată tot toţi totuşi unde unde deva unei unele uneori unor vă vi voastră voastre voi voştri vostru vouă vreun

Russo (ru)

Opzioni di stemming algoritmico: light|full

Schema di analisi predefinito: _ru_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    и в во не что он на я с со как а то все она так его но да ты к у же вы за бы по только ее мне было вот от меня ет о из ему тепепет когда даже ну вдруг ли если уже или ни быть был него до вас нибудь опять уж вам сказал ведь там потом себя ничего ей ей ей ей мо ей мой можо ей можо ей можо ей можо ей може ет они тут где есть надо ней для мы тебя их чем была сам чтоб без будто человек чего раз тоже себе под жизнь будет ж тогда кто этот горил того потому какой совсем на м здесь этом один почти мой тем чтобы нее кажется сейчас были куда зачем сказать всех никогда сегодня можно при наки но при но при онец два об другой хоть после над больше тот через эти нас про всего них кая много разве сказала три эту моя впрочем хорошо свою этой перед иногда лучше чуть том нельзя такой им более ксегда онечно всю между

Spagnolo (es)

Opzioni di stemming algoritmico: light|full

Schema di analisi predefinito: _es_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    de la que el en y a los del se las por un para con no una su al lo como más pero sus le ya o este sí porque esta entre cuando muy sin sobre también me hasta hay donde quien desde todo nos durante todos uno les ni contra otros ese eso ante ellos e esto mí antes algunos qué unos yo otro otro as otra él tanto esa estos mucho quienes nada muchos cual poco ella estar estas algunas algo nosotros mi mis tú te ti tus ellas nosotras vosotros vosotros vosotras os mío míos mías tuya tuyos suyo suya nuestro nuestras vuestras vuestra vuestros vuestras esos esas estoy estás está estamos estáis están esté estés estéis estaré estarás estará estaréis estaréis estarán estaría estarías estarías estarías estaríais estarían estabas estabas estabais estaban estuve estuviste estuvimos estuvisteis estuvisteis estuvieron estuvieras estuviéramos estuvierais estuvieran estuviese estuviésemos estuvieseis estuviesen estando estado estada estadas estad ha hemos habéis han haya hayas hayamos hayáis hayan habré habrás habrá habremos habréis habrán habría habrías habrías habríais habrían habías habías habías habías os habíais hube hubiste hubo hubimos hubisteis hubieron hubiera hubieras hubiéramos hubierais hubiese hubiesi hubiesi hubiésemos hubieseis hubieseis habiendo habido habida habidos habidas soy eres es somos sois son sea seas seamos seáis sean seré serás seréemos seréis serán serías serías seríais seríais seríais seríais seríais era era era éramos erais eran fui fuiste fuimos fuisteis fueron fueras fueras fuerais fueran fuese fueses fuésemos fueseis fuesen siendo sido tengo tienes tiene tenemos tenéis tienen tenga tengas tengamos tengáis tendré tendrás tendrá tendremos tendréis tendría tendrías tendrías tendrías tendrías os tendríais tendrían tenía tenías teníamos teníais tenían tuve tuviste tuvo tuvimos tuvisteis tuvieron tuvieras tuvieras tuvierais tuvieran tuviese tuvieses tuviésemos tuvieseis tuviesen teniendo tenida tenidos tenidas tenidas

Svedese (sv)

Opzioni di stemming algoritmico: light|full

Schema di analisi predefinito: _sv_default_

  • Stemming algoritmico: light

  • Dizionario delle stopword predefinito:

    och det att i en jag hon som han på den med var sig för så till är men ett om hade de av icke mig du henne då sin nu har inte hans honom skulle hennes där min man ej vid kunde något från ut när efter upp vi dem vara vad över än dig kan sina här ha mot alla sotto någon Eller allt mycket berlina ju denna själv detta åt utan varit hur ingen mitt ni bli blev oss din dessa några deras blir mina samma vilken er sådan vår blivit dess inom mellan sådant varför varje vilka ditt vem vilket sitta sådana vart dina vars vårt våra ert era vilkas

Tailandese (th)

Stemming algoritmico non supportato

Dizionario di stemming non supportato

Schema di analisi predefinito: _th_default_

  • Dizionario delle stopword predefinito:

    意大利 意大利 าper la prima volta che sei stato tu???????????????????????????????????!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 意大利 าาาานา意大利 า

Turco (tr)

Stemming algoritmico: full

Schema di analisi predefinito: _tr_default_

  • Stemming algoritmico: full

  • Dizionario delle stopword predefinito