Chapter 11. Operar con le texto simple

1. Codification prefixate initial
2. Le solution de OmegaT

1. Codification prefixate initial

Le Files de texto simple - in le major parte del casos files con le extension txt - contine sol information textual e non offere nulle maniera decisemente definite pro informar le computator re qual lingua illos contine. Le maximo que OmegaT pote facer in tal caso, es assumer que le texto es scripte in le mesme lingua que le computator ipse usa. Isto non es problema pro le files codificate in Unicode per serie de codification a character de 16 bit. Si le texto es codificate in 8 bits, tamen, on pote esser affrontate con le difficile situation sequente: in loco de monstrar le texto, pro characteres japonese...

...le systema monstrara lo affin isto per exemplo:

Le computator, ubi functiona OmegaT, ha le russo ut lingua prefixate, e assi monstra le characteres in le alphabeto cyrillic e non in kanji.

2. Le solution de OmegaT

Il ha in fundo tres manieras pro adressar iste problema in OmegaT. Illos omne implica le application del filtros de file in le menu Optiones.

Cambia le codification de tu files a Unicode

aperi tu file fonte in un redactor de texto que interpreta correctemente su codification e salva le file in codification "UTF-8". Cambia le extension del file ab .txt a .utf8. OmegaT interpretara automaticamente le file como file UTF-8. Isto es le alternativa le plus sensate, que sparnia te problemas in le perspective longe.

Specifica le codification pro tu files de texto simple

- id es le files con le extension .txt - : in le section Files de texto del fenestra de dialogo Filtros de File, cambia le Codification del File fonte ab <auto> al codification que corresponde a tu file fonte .txt, per exemplo al .jp pro le exemplo precedente.

Cambia le extensiones de tu files fonte in texto simple

per exemplo ab .txt a .jp pro le textos simple japonese: in le section Files de texto del fenestra de dialogo filtros de file, adde nove Modello de Nomine de fonte (*.jp pro iste exemplo) e selige le parametros appropriate pro le codification fonte e de destination

OmegaT ha per base prefixate le sequente lista curte disponibile render lo plus facile pro te tractar con alicun files de texto simple:

  • Le files .txt son automaticamente (<auto>) interpretate per OmegaT como codificate in le codification base prefixate del computator.

  • Le files .txt1 son files in ISO-8859-1, que coperi le major parte del linguas del Europa occidental.

  • Le files .txt2 son files in ISO-8859-2, que coperi le major parte del linguas del Europa central e oriental.

  • Le files .utf8 son interpretate per OmegaT como codificate in UTF-8 (un codification que concerne quasi tote le linguas in le mundo).

Tu pote controlar ce tu mesme per seliger le commando Filtros de File in le menu Optiones. Per exemplo, quando tu ha un file de texto chec (multo probabilemente scripte in le codice ISO-8859-2) tu debe sol cambiar le extension .txt in .txt2 e OmegaT interpretara su contentos correctemente. E naturalmente, si tu vole trovar te sur le latere secur, considera converter iste genere de file a Unicode, id es al formato de file .utf8 .