Appendix D. Plugin Tokenizer

1. Introduction
2. Installation e uso

1. Introduction

Le cercatores del radice (tokenizers) meliora le qualitate de concordantias con le recognition del parolas declinate in le datos del memoria primari e in le traduction. Illos meliora alsi la concordantia del glossario.

Un cercator de radice pro le anglese, per exemplo, deberea identificar le linea "cats" (e possibilemente "catlike", "catty" etc.) como basate super le radice "cat", e "stemmer", "stemming", "stemmed" como basate super "stem". Un algorithmo de cerca del radice reduce le parolas "fishing", "fished", "fish", e "fisher" al radice, "fish". Isto es in modo special utile in caso de linguas que usa formas con pre- e suffixo pro le radices. Faciente se prestar un exemplo ex le sloveno, ci "bon" in omne possibile formas grammaticamente correcte:

  • lep, lepa, lepo - singular, masculin, feminin, neutral

  • lepši, lepša, lepše . - comparative, nominative, masculin, feminin, neutral, resp. Forma plural del adjective

  • najlepših - superlative, plural, genitive pro M,F,N

2. Installation e uso

Le tokenizers son includite in OmegaT. OmegaT selige automaticamente un tokenizer pro le lingua fonte e uno pro le lingua de destination secundo le preparationes del lingua del projecto. Il es possibile seliger un altere tokenizer o un version differente del tokenizer del fenestra Proprietates del Projecto.

Incompatibilitates

OmegaT non lanceara se si son trovate tokenizers in le plica /plugin. Leva omne le tokenizers ex le plica /plugin ante que tu lancea OmegaT.