Chapter 14. Segmentation del origine

1. Regulas de Segmentation
2. Prioritate Regula
3. Creation de un regula nove
4. Alicun exemplos simplice

Le instrumentos de memoria de traduction functiona con unitates textual nominate segmentos. OmegaT ha duo manieras a segmentar un texto: per paragrapho o per segmentation a phrase (alsi referite a "segmentation basate sur le regulas”). Pro seliger le typo del segmentation, selige ProjectoProprietates... ex le menu principal e marca o leva le marca al quadrato de controlo supplite. Le segmentation a paragrapho es avantagiose in certe casos, assi como traductiones multo creative o stilistic in le qual le traductor pote desiderar de cambiar le ordine de integre phrases; pro le majoritate del projectos, comocunque, le segmentation a phrase es un selection a preferer, pois que illo delivra concordantias melior ex traductiones previe. Si esseva seligite le segmentation a phrase, tu pote preparar le regulas con le selection OptionesSegmentation...ex le Menu Principal.

Regulas de segmentation confidibile son jam disponibile pro multe linguas, ergo il es verisimile que tu non debe esser implicate con le scriptura de tu proprie regulas de segmentation. del altere parte iste functionalitate pote esser multo utile in casos particular, ubi tu tu pote accrescer tu productivitate per le accordatura del regulas de segmentation al texto a traducer.

Advertimento: post que le texto essera segmentate differentemente postquam le optiones del filtro esseva cambiate, ita tu pote deber initiar le traduction ab ovo. Al mesme tempore le segmentos previe valide in le memoria de traduction del projecto rotara in segmentos orphane. Si tu cambia le optiones de segmentation durante que un projecto es aperte, tu debe recargar le projecto pro que le cambios sume effecto.

OmegaT usa le sequentia de grados sequente:

Segmentation a nivello de structura

OmegaT in prime loco analysa le texto pro le segmentation a nivello de structura. durante iste processo il es sol le structura del file fonte que es usate pro producer le segmentos.

Per exemplo, le files de texto pote esser segmentate sur le interruptiones de linea, lineas vacue, o non esser segmentate del toto. Files continente formattation (documentos ODF, documentos HTML, etc.) son segmentate sur le tags a nivello de bloco (paragrapho). Le attributos de objecto traducibile in le files XHTML o HTML pote esser extrahite como segmentos separate.

Segmentation a nivello de phrase

post segmentate le file fonte in unitates structural, OmegaT segmentara iste blocos ulteriormente in phrases.

1. Regulas de Segmentation

Le processo de segmentation pote esser illustrate como seque: le cursor move secundo le texto, un character a un vece. a cata position del cursor le regulas, consistente de un modello Ante e Post , son applicate in lor date ordine pro vider si alicun del modellos Ante es valide pro le texto al sinistra e le correspondente modello Post pro le texto al dextra del cursor. Si le regula concorda, le cursor move sur sin inserer un interruption de segmento (pro un regula de exception) o un nove interruption de segmento es create al position actual del cursor (pro le regula de interruption).

Le duo typos de regulas conduce se como seque:

Regula de interruption

Separa le texto fonte in segmentos. Per exemplo, "haber facite lo rende senso? io non esseva secur." deberea esser fisse in duo segmentos. Pro que isto accide, il deberea esser un regula de interruption pro le "?", quando sequite per spatios e un parola que initia per littera majuscule. Pro definir un regula como regula de interruption, marca le quadrato de controlo Interruption/Exception.

Regula de Exception

specifica qual partes del texto NON deberea esser separate. Malgrado del periodo, "Mrs. Dalloway " deberea non esser fisse in duo segmentos, assi un regula de exception deberea esser establite pro Mrs (e pro Mr, pro Dr, pro prof etc), sequite per un periodo. Pro definir un regula como regula de exception, lassa le quadrato de controlo Interruption/Exception non marcate.

Le regulas de interruption prefixate deberea esser bastante pro le major parte del linguas europee e le japonese. in viste del flexibilitate, tu pote reguardar como definir plus regulas de exception pro tu lingua fonte pro suppler segmentos plus significative e coherente.

2. Prioritate Regula

omne collectiones de regula de segmentation pro un modello concordantia de lingua son active e son applicate in le date ordine de prioritate, assi le regulas pro le lingua specific deberea esser superior a illos base. Assi, e. g. , le regulas pro le francese canadian (FR-CA) debe esser supere que le regulas pro le francese (FR.*), e supere que los jam arrangiate (.*) . assi, quando on rende ab le francese canadian le regulas pro le francese canadian - si alicun - essera applicate antea, sequite per le regulas pro le francese e in fin, per le Regulas base.

3. Creation de un regula nove

deberea esser evitate cambios major al regulas de segmentation, specialmente post le completamento del prime minuta, ma cambios minor, assi como le addition de un abbreviation admittite, pote esser avantagiose.

Pro modificar o expander un collection de regulas existente, clicca simplemente sur illo in le tabella vertice. Le regulas pro ce collection apparera in le medietate inferior del fenestra.

Pro crear un collection de regulas vacue pro un patrono de lingua nove clicca Adde in le medietate superior del fenestra de dialogo. Un linea vacue apparera al fundo del tabella superior (tu pote deber rolar in basso pro vider lo). Cambia le nomine del collection de regula e le patrono de lingua pro le lingua concernite e su codice (vide Appendix A, Linguas - lista del codices ISO 639 pro un lista del codices de lingua). Le syntaxe del schema del lingua conforma al syntaxe del expression regular. Si tu collection de regulas tracta un par de lingua-pais, nos mone te de mover lo al summitate per le button Move in alto.

Adde le modellos Before e After. Pro verificar lor syntaxe e lor applicabilitate, il es consiliabile usar instrumentos que permitte te pro vider lor effecto directemente. Vide le capitulo re le Expressiones regular. Un bon puncto de initio essera semper le regulas existente.

4. Alicun exemplos simplice

Intento Ante Post Nota
Fixa le initio del segmento post un periodo ('.') sequite per un spatio, tabulation ... Re OmegaT - introduction \s "\." sta pro le character periodo. "\s" significa cata character spatio blanc (spatio, tabulation, nove pagina etc.)
Non segmentar post Mr. mr \s Isto un regula de exception, assi le quadrato de controlo del regula non debe esser marcate
Impone un segmento poster "。" (periodo japonese)   Note que after es vacue
Non segmentar post M. Mr. Mrs. e Ms. Mr??s??\. \s Regula de exception - vide le uso del ? in expressiones regular