3.9 Sommario
- Le espressioni regolari descrivono insiemi di stringhe da confrontare.
In
awk
, le costanti regexp sono scritte racchiuse
fra barre: /
…/
.
- Le costanti regexp possono essere usate da sole in modelli di ricerca e
in espressioni condizionali, o come parte di espressioni di ricerca
usando gli operatori ‘~’ e ‘!~’.
- Le sequenze di protezione consentono di rappresentare caratteri non stampabili
e consentono anche di rappresentare metacaratteri regexp come caratteri
letterali per i quali cercare corrispondenze.
- Gli operatori regexp consentono raggruppamento, alternativa e
ripetizione.
- Le espressioni tra parentesi quadre sono delle notazioni abbreviate per
specificare insiemi di caratteri che possono avere corrispondenze in un
punto particolare di una regexp.
All’interno di espressioni tra parentesi quadre, le classi di caratteri POSIX
consentono di specificare certi gruppi di caratteri in maniera indipendente
dalla localizzazione.
- Le espressioni regolari individuano il testo più lungo possibile, a partire
da sinistra nella stringa in esame. Questo ha importanza nei casi in cui
serve conoscere la lunghezza della corrispondenza, come nella sostituzione di
testo e quando il separatore di record sia una regexp.
- Espressioni di ricerca possono usare regexp dinamiche, ossia, i valori
delle stringhe sono considerato come espressioni regolari.
- La variabile
gawk
IGNORECASE
consente di controllare la
differenza maiuscolo/minuscolo nel confronto mediante regexp. In altre
versioni di awk
, vanno usate invece le funzioni tolower()
o
toupper()
.