Le expressiones regular (o in breve regex) usate in le regulas de recercas e de segmentation son illos supportate per Java. Si tu deberea necessitar information plus specific, consulta le documentation Regex Java. Vide referentias additional e exemplos in sequito.
Iste capitulo es designate pro usatores experte, que debe definir lor proprie variantes de regulas de segmentation o imagina elementos clave de recerca plus complexe e potente.
Table 16.1. Regex - Flags
| Le construction | ... concorda le sequente |
|---|---|
| (?i) | Habilita concordantia insensitive al majusculas (per base prefixate, le schema es sensitive al majusculas). |
Table 16.2. Regex - Character
| Le construction | ... concorda le sequente |
|---|---|
| x | Le character x, excepte le following... |
| \uhhhh | Le character con valor hexadecimal 0xhhhh |
| \t | Le character de tabulation ('\u0009') |
| \n | Le character nove linea ('\u000A') |
| \r | Le character retorna-carro ('\u000D') |
| \f | Le character nove folio ('\u000C') |
| 7.A. | Le character alerta (campana) ('\u0007') |
| \e | Le character escappa ('\u001B') |
| \cx | Le character de controlo correspondente a x |
| \0n | Le character con valor octal 0n (0 <= n <= 7) |
| \0nn | Le character con valor octal 0nn (0 <= n <= 7) |
| \0mnn | Le character con valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7) |
| \xhh | Le character con valor hexadecimal 0xhh |
Table 16.3. Regex - Quotation
| Le construction | ... concorda le sequente |
|---|---|
| \ | Nihil, excepte quotes le character sequente. Isto necessita si tu vole entrar in cata del meta-characteres !$()*+.<>?[\]^{|} pro concordar como se ipse. |
| \\ | Per exemplo, isto is le character barra reverse |
| \Q | Nihil, excepte quotes omne characteres usque /E. |
| \E | Nihil, excepte le fines del quotas initiate per \Q |
Table 16.4. Regex - classes pro le blocos Unicode e categorias
| Le construction | ... concorda le sequente |
|---|---|
| \p{InGreek} | Un character in le bloco block (simple block) |
| \p{Lu} | Un littera majuscule ( categoria simple) |
| \p{Sc} | Un symbolo de numerario |
| \P{InGreek} | omne character excepte uno in in lebloco Greek block (negation) |
| [\p{L}&&[^\p{Lu}]] | qualcunque litera extra un litera majuscule (subtraction) |
Table 16.5. Regex - Classes de Character
| Le construction | ... concorda le sequente |
|---|---|
| [abc] | a, b, o c (classe simple) |
| [^abc] | Cata character extra a, b, o c (negation) |
| [a-zA-Z] | De a per z o A per Z, inclusive (campo) |
Table 16.6. Regex - Classes de character prefixate
| Le construction | ... concorda le sequente |
|---|---|
| . | Omne character (excepte pro le terminatores del linea) |
| \d | Un cifra: [0-9] |
| \D | Un non-cifra: [^0-9] |
| \s | Un character spatio blanc: [ \t\n\x0B\f\r] |
| \S | Un character non spatio blanco: [^\s] |
| \w | Un character del parola: [a-zA-Z_0-9] |
| \W | Un character non del parola: [^\w] |
Table 16.7. Regex - Concordatores de confin
| Le construction | ... concorda le sequente |
|---|---|
| ^ | Le principio de un linea |
| $ | Le fin de un linea |
| 7.B. | Un frontiera de parola |
| 7.B. | Un frontiera de non-parola |
Table 16.8. Regex - quantificatores avide
| Le construction | ... concorda le sequente |
|---|---|
| X? | X, un vice o nullo del toto |
| X* | X, zero o plus vices |
| X+ | X, un o plus vices |
le quantificatores avide concordara a mesura que illos pote. Per exemplo, a+? concordara le aaa in aaabbb
Table 16.9. Regex - Quantificatores reluctante (non-avide)
| Le construction | ... concorda le sequente |
|---|---|
| X?? | X, un vice o nullo del toto |
| X*? | X, zero o plus vices |
| X+? | X, un o plus vices |
le quantificatores non-avide concordara ut pauco illos pote. Per exemplo, a+? concordara le prime a in aaabbb
Table 16.10. Regex - Operatores Logic
| Le construction | ... concorda le sequente |
|---|---|
| XY | X sequite per Y |
| X|Y | Vel X vel Y |
| (XY) | XY como un gruppo singule |
Plure instrumentos interactive son disponibile pro disveloppar e essayar le expressiones regular. Illos generalmente seque circa le mesme modello (pro un exemplo ex le Probator del Expression Eegular vide in sequito): le expression regular (entrata summe) analyse le texto de recerca (Cassa de texto in le medio) , que rende le occurrentias, monstrate in le Cassa de texto resultato.
Vide Le Regex Coach versiones de un application autonome pro Windows, Linux e FreeBSD. Isto es identic al exemplo precedente.
Un sympathic collection de casos regex utile pote esser trovate in OmegaT ipse (vide Optiones > Segmentation). Le lista sequente include expressiones que tu pote trovar utile quando recerca per le memoria de traduction:
Table 16.11. Regex - Exemplos de expressiones regular in le traductiones
| Expression regular | Trova le sequente: |
|---|---|
| (\b\w+\b)\s\1\b | parolas duple |
| [\.,]\s*[\.,]+ | virgula o un periodo, sequite per spatios e etsi un altere virgula o periodo |
| Re OmegaT - introduction \s+$ | spatios extra post le puncto al fin del linea |
| \s+a\s+[aeiou] | Anglese: le parolas que initia con vocales deberea generalmente esser precedite per "an" e non per "a" |
| \s+an\s+[^aeiou] | Anglese: le mesme controlo del precedente, ma concernente consonantes ("a" e non "an") |
| \s{2,} | plus que un spatio |
| \.[A-Z] | Periodo, sequite per un littera majuscule - possibilemente un spatio es mancante inter le periodo e le initio de un nove phrase? |
| \bis\b | cerca pro “is”, non “this” o “isn't” etc. |