Le expressiones regular (o in breve regex) usate in le regulas de recercas e de segmentation son illos supportate per Java. Si tu deberea necessitar information plus specific, consulta le documentation Regex Java. Vide referentias additional e exemplos in sequito.
Iste capitulo es designate pro usatores experte, que debe definir lor proprie variantes de regulas de segmentation o imagina elementos clave de recerca plus complexe e potente.
Table 16.1. Regex - Flags
Le construction | ... concorda le sequente |
---|---|
(?i) | Habilita concordantia insensitive al majusculas (per base prefixate, le schema es sensitive al majusculas). |
Table 16.2. Regex - Character
Le construction | ... concorda le sequente |
---|---|
x | Le character x, excepte le following... |
\uhhhh | Le character con valor hexadecimal 0xhhhh |
\t | Le character de tabulation ('\u0009') |
\n | Le character nove linea ('\u000A') |
\r | Le character retorna-carro ('\u000D') |
\f | Le character nove folio ('\u000C') |
7.A. | Le character alerta (campana) ('\u0007') |
\e | Le character escappa ('\u001B') |
\cx | Le character de controlo correspondente a x |
\0n | Le character con valor octal 0n (0 <= n <= 7) |
\0nn | Le character con valor octal 0nn (0 <= n <= 7) |
\0mnn | Le character con valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7) |
\xhh | Le character con valor hexadecimal 0xhh |
Table 16.3. Regex - Quotation
Le construction | ... concorda le sequente |
---|---|
\ | Nihil, excepte quotes le character sequente. Isto necessita si tu vole entrar in cata del meta-characteres !$()*+.<>?[\]^{|} pro concordar como se ipse. |
\\ | Per exemplo, isto is le character barra reverse |
\Q | Nihil, excepte quotes omne characteres usque /E. |
\E | Nihil, excepte le fines del quotas initiate per \Q |
Table 16.4. Regex - classes pro le blocos Unicode e categorias
Le construction | ... concorda le sequente |
---|---|
\p{InGreek} | Un character in le bloco block (simple block) |
\p{Lu} | Un littera majuscule ( categoria simple) |
\p{Sc} | Un symbolo de numerario |
\P{InGreek} | omne character excepte uno in in lebloco Greek block (negation) |
[\p{L}&&[^\p{Lu}]] | qualcunque litera extra un litera majuscule (subtraction) |
Table 16.5. Regex - Classes de Character
Le construction | ... concorda le sequente |
---|---|
[abc] | a, b, o c (classe simple) |
[^abc] | Cata character extra a, b, o c (negation) |
[a-zA-Z] | De a per z o A per Z, inclusive (campo) |
Table 16.6. Regex - Classes de character prefixate
Le construction | ... concorda le sequente |
---|---|
. | Omne character (excepte pro le terminatores del linea) |
\d | Un cifra: [0-9] |
\D | Un non-cifra: [^0-9] |
\s | Un character spatio blanc: [ \t\n\x0B\f\r] |
\S | Un character non spatio blanco: [^\s] |
\w | Un character del parola: [a-zA-Z_0-9] |
\W | Un character non del parola: [^\w] |
Table 16.7. Regex - Concordatores de confin
Le construction | ... concorda le sequente |
---|---|
^ | Le principio de un linea |
$ | Le fin de un linea |
7.B. | Un frontiera de parola |
7.B. | Un frontiera de non-parola |
Table 16.8. Regex - quantificatores avide
Le construction | ... concorda le sequente |
---|---|
X? | X, un vice o nullo del toto |
X* | X, zero o plus vices |
X+ | X, un o plus vices |
le quantificatores avide concordara a mesura que illos pote. Per exemplo, a+? concordara le aaa in aaabbb
Table 16.9. Regex - Quantificatores reluctante (non-avide)
Le construction | ... concorda le sequente |
---|---|
X?? | X, un vice o nullo del toto |
X*? | X, zero o plus vices |
X+? | X, un o plus vices |
le quantificatores non-avide concordara ut pauco illos pote. Per exemplo, a+? concordara le prime a in aaabbb
Table 16.10. Regex - Operatores Logic
Le construction | ... concorda le sequente |
---|---|
XY | X sequite per Y |
X|Y | Vel X vel Y |
(XY) | XY como un gruppo singule |
Plure instrumentos interactive son disponibile pro disveloppar e essayar le expressiones regular. Illos generalmente seque circa le mesme modello (pro un exemplo ex le Probator del Expression Eegular vide in sequito): le expression regular (entrata summe) analyse le texto de recerca (Cassa de texto in le medio) , que rende le occurrentias, monstrate in le Cassa de texto resultato.
Vide Le Regex Coach versiones de un application autonome pro Windows, Linux e FreeBSD. Isto es identic al exemplo precedente.
Un sympathic collection de casos regex utile pote esser trovate in OmegaT ipse (vide Optiones > Segmentation). Le lista sequente include expressiones que tu pote trovar utile quando recerca per le memoria de traduction:
Table 16.11. Regex - Exemplos de expressiones regular in le traductiones
Expression regular | Trova le sequente: |
---|---|
(\b\w+\b)\s\1\b | parolas duple |
[\.,]\s*[\.,]+ | virgula o un periodo, sequite per spatios e etsi un altere virgula o periodo |
Re OmegaT - introduction \s+$ | spatios extra post le puncto al fin del linea |
\s+a\s+[aeiou] | Anglese: le parolas que initia con vocales deberea generalmente esser precedite per "an" e non per "a" |
\s+an\s+[^aeiou] | Anglese: le mesme controlo del precedente, ma concernente consonantes ("a" e non "an") |
\s{2,} | plus que un spatio |
\.[A-Z] | Periodo, sequite per un littera majuscule - possibilemente un spatio es mancante inter le periodo e le initio de un nove phrase? |
\bis\b | cerca pro “is”, non “this” o “isn't” etc. |