Cos'è Regex?
Le espressioni regolari (regex) sono sequenze di caratteri che definiscono pattern di ricerca. Sono incredibilmente potenti per trovare, combinare e manipolare testo.
Caratteri Base
| Pattern | Descrizione | Esempio |
|---|
| . | Qualsiasi carattere eccetto nuova riga | a.c trova "abc", "a1c" |
| \d | Qualsiasi cifra (0-9) | \d\d trova "42" |
| \D | Qualsiasi non-cifra | \D+ trova "abc" |
| \w | Carattere parola (a-z, A-Z, 0-9, _) | \w+ trova "hello_123" |
| \W | Carattere non-parola | \W trova "@", "#" |
| \s | Spazio bianco (spazio, tab, nuova riga) | \s+ trova " " |
| \S | Non-spazio bianco | \S+ trova "hello" |
Quantificatori
| Pattern | Descrizione | Esempio |
|---|
| * | 0 o più | ab*c trova "ac", "abc", "abbc" |
| + | 1 o più | ab+c trova "abc", "abbc" |
| ? | 0 o 1 (opzionale) | colou?r trova "color", "colour" |
| {n} | Esattamente n volte | \d{4} trova "2025" |
| {n,} | n o più volte | \d{2,} trova "42", "123" |
| {n,m} | Tra n e m volte | \d{2,4} trova "42", "123", "2025" |
Ancore
| Pattern | Descrizione | Esempio |
|---|
| ^ | Inizio della stringa/riga | ^Ciao trova "Ciao Mondo" |
| $ | Fine della stringa/riga | Mondo$ trova "Ciao Mondo" |
| \b | Confine di parola | \bgatto\b trova "gatto" non "gattopardo" |
| \B | Non-confine di parola | \Bgatto trova "gattopardo" |
Classi di Caratteri
| Pattern | Descrizione | Esempio |
|---|
| [abc] | Trova qualsiasi a, b, o c | [aeiou] trova vocali |
| [^abc] | Trova qualsiasi eccetto a, b, o c | [^0-9] trova non-cifre |
| [a-z] | Intervallo: qualsiasi lettera minuscola | [a-zA-Z] qualsiasi lettera |
| [0-9] | Intervallo: qualsiasi cifra | [0-9]+ trova numeri |
Gruppi e Alternanza
| Pattern | Descrizione | Esempio |
|---|
| (abc) | Gruppo di cattura | (\d+)-(\d+) cattura entrambi i numeri |
| (?:abc) | Gruppo senza cattura | (?:https?://) raggruppa senza catturare |
| a|b | Alternanza (o) | gatto|cane trova entrambi |
| \1 | Riferimento al gruppo 1 | (\w)\1 trova "aa", "bb" |
Pattern Comuni
Indirizzo Email
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
URL
https?://[\w.-]+(?:/[\w./-]*)?
Numero di Telefono (Italia)
\+?39?[-.\s]?\d{2,3}[-.\s]?\d{6,7}
Data (AAAA-MM-GG)
\d{4}-\d{2}-\d{2}
Indirizzo IP (IPv4)
\b(?:\d{1,3}\.){3}\d{1,3}\b
Codice Fiscale
[A-Z]{6}\d{2}[A-Z]\d{2}[A-Z]\d{3}[A-Z]
Flag
| Flag | Descrizione |
|---|
| i | Ricerca senza distinzione maiuscole/minuscole |
| g | Globale - trova tutte le occorrenze |
| m | Multilinea - ^ e $ corrispondono a inizio/fine riga |
| s | Dotall - . corrisponde anche a nuove righe |
Consigli per Usare Regex Data Extractor
- Inizia semplice e aumenta la complessità gradualmente
- Usa la funzione di anteprima per testare i tuoi pattern
- Escapa i caratteri speciali con barra rovesciata quando vuoi trovarli letteralmente
- Usa quantificatori non-avidi (
*?, +?) quando necessario - Testa con casi limite per assicurarti che il tuo pattern funzioni correttamente
Con Regex Data Extractor, puoi applicare questi pattern direttamente su qualsiasi pagina web ed estrarre esattamente i dati di cui hai bisogno. Buone estrazioni!