Chapter 16. Expressiones regular

1. Instrumentos Regex e exemplos de uso

Le expressiones regular (o in breve regex) usate in le regulas de recercas e de segmentation son illos supportate per Java. Si tu deberea necessitar information plus specific, consulta le documentation Regex Java. Vide referentias additional e exemplos in sequito.

Note

Iste capitulo es designate pro usatores experte, que debe definir lor proprie variantes de regulas de segmentation o imagina elementos clave de recerca plus complexe e potente.

Table 16.1. Regex - Flags

Le construction ... concorda le sequente
(?i) Habilita concordantia insensitive al majusculas (per base prefixate, le schema es sensitive al majusculas).

Table 16.2. Regex - Character

Le construction ... concorda le sequente
x Le character x, excepte le following...
\uhhhh Le character con valor hexadecimal 0xhhhh
\t Le character de tabulation ('\u0009')
\n Le character nove linea ('\u000A')
\r Le character retorna-carro ('\u000D')
\f Le character nove folio ('\u000C')
7.A. Le character alerta (campana) ('\u0007')
\e Le character escappa ('\u001B')
\cx Le character de controlo correspondente a x
\0n Le character con valor octal 0n (0 <= n <= 7)
\0nn Le character con valor octal 0nn (0 <= n <= 7)
\0mnn Le character con valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh Le character con valor hexadecimal 0xhh

Table 16.3. Regex - Quotation

Le construction ... concorda le sequente
\ Nihil, excepte quotes le character sequente. Isto necessita si tu vole entrar in cata del meta-characteres !$()*+.<>?[\]^{|} pro concordar como se ipse.
\\ Per exemplo, isto is le character barra reverse
\Q Nihil, excepte quotes omne characteres usque /E.
\E Nihil, excepte le fines del quotas initiate per \Q

Table 16.4. Regex - classes pro le blocos Unicode e categorias

Le construction ... concorda le sequente
\p{InGreek} Un character in le bloco block (simple block)
\p{Lu} Un littera majuscule ( categoria simple)
\p{Sc} Un symbolo de numerario
\P{InGreek} omne character excepte uno in in lebloco Greek block (negation)
[\p{L}&&[^\p{Lu}]] qualcunque litera extra un litera majuscule (subtraction)

Table 16.5. Regex - Classes de Character

Le construction ... concorda le sequente
[abc] a, b, o c (classe simple)
[^abc] Cata character extra a, b, o c (negation)
[a-zA-Z] De a per z o A per Z, inclusive (campo)

Table 16.6. Regex - Classes de character prefixate

Le construction ... concorda le sequente
. Omne character (excepte pro le terminatores del linea)
\d Un cifra: [0-9]
\D Un non-cifra: [^0-9]
\s Un character spatio blanc: [ \t\n\x0B\f\r]
\S Un character non spatio blanco: [^\s]
\w Un character del parola: [a-zA-Z_0-9]
\W Un character non del parola: [^\w]

Table 16.7. Regex - Concordatores de confin

Le construction ... concorda le sequente
^ Le principio de un linea
$ Le fin de un linea
7.B. Un frontiera de parola
7.B. Un frontiera de non-parola

Table 16.8. Regex - quantificatores avide

Le construction ... concorda le sequente
X? X, un vice o nullo del toto
X* X, zero o plus vices
X+ X, un o plus vices

Note

le quantificatores avide concordara a mesura que illos pote. Per exemplo, a+? concordara le aaa in aaabbb

Table 16.9. Regex - Quantificatores reluctante (non-avide)

Le construction ... concorda le sequente
X?? X, un vice o nullo del toto
X*? X, zero o plus vices
X+? X, un o plus vices

Note

le quantificatores non-avide concordara ut pauco illos pote. Per exemplo, a+? concordara le prime a in aaabbb

Table 16.10. Regex - Operatores Logic

Le construction ... concorda le sequente
XY X sequite per Y
X|Y Vel X vel Y
(XY) XY como un gruppo singule

1. Instrumentos Regex e exemplos de uso

Plure instrumentos interactive son disponibile pro disveloppar e essayar le expressiones regular. Illos generalmente seque circa le mesme modello (pro un exemplo ex le Probator del Expression Eegular vide in sequito): le expression regular (entrata summe) analyse le texto de recerca (Cassa de texto in le medio) , que rende le occurrentias, monstrate in le Cassa de texto resultato.

Figure 16.1. Probator de Regex

Probator de Regex

Vide Le Regex Coach versiones de un application autonome pro Windows, Linux e FreeBSD. Isto es identic al exemplo precedente.

Un sympathic collection de casos regex utile pote esser trovate in OmegaT ipse (vide Optiones > Segmentation). Le lista sequente include expressiones que tu pote trovar utile quando recerca per le memoria de traduction:

Table 16.11. Regex - Exemplos de expressiones regular in le traductiones

Expression regular Trova le sequente:
(\b\w+\b)\s\1\b parolas duple
[\.,]\s*[\.,]+ virgula o un periodo, sequite per spatios e etsi un altere virgula o periodo
Re OmegaT - introduction \s+$ spatios extra post le puncto al fin del linea
\s+a\s+[aeiou] Anglese: le parolas que initia con vocales deberea generalmente esser precedite per "an" e non per "a"
\s+an\s+[^aeiou] Anglese: le mesme controlo del precedente, ma concernente consonantes ("a" e non "an")
\s{2,} plus que un spatio
\.[A-Z] Periodo, sequite per un littera majuscule - possibilemente un spatio es mancante inter le periodo e le initio de un nove phrase?
\bis\b cerca pro “is”, non “this” o “isn't” etc.