דף עזר Regex

שלטו בביטויים רגולריים עם המדריך המקיף הזה. למדו דפוסים למציאת טקסט, מספרים, אימיילים, כתובות URL ועוד. מושלם למתחילים ומשתמשים מתקדמים.

G
GUi Softworks
8 דקות קריאה

מה זה Regex?

ביטויים רגולריים (regex) הם רצפי תווים המגדירים דפוסי חיפוש. הם עוצמתיים להפליא למציאה, התאמה ומניפולציה של טקסט.

תווים בסיסיים

דפוסתיאורדוגמה
כל תו מלבד שורה חדשהa.c מוצא "abc", "a1c"
\dכל ספרה (0-9)\d\d מוצא "42"
\Dכל לא-ספרה\D+ מוצא "abc"
\wתו מילה (a-z, A-Z, 0-9, _)\w+ מוצא "hello_123"
\Wתו לא-מילה\W מוצא "@", "#"
\sרווח לבן (רווח, טאב, שורה חדשה)\s+ מוצא " "
\Sלא-רווח לבן\S+ מוצא "hello"

כמתים

דפוסתיאורדוגמה
*0 או יותרab*c מוצא "ac", "abc", "abbc"
+1 או יותרab+c מוצא "abc", "abbc"
?0 או 1 (אופציונלי)colou?r מוצא "color", "colour"
{n}בדיוק n פעמים\d{4} מוצא "2025"
{n,}n פעמים או יותר\d{2,} מוצא "42", "123"
{n,m}בין n ל-m פעמים\d{2,4} מוצא "42", "123", "2025"

עוגנים

דפוסתיאורדוגמה
^תחילת מחרוזת/שורה^שלום מוצא "שלום עולם"
$סוף מחרוזת/שורהעולם$ מוצא "שלום עולם"
\bגבול מילה\bcat\b מוצא "cat" לא "category"
\Bלא-גבול מילה\Bcat מוצא "category"

מחלקות תווים

דפוסתיאורדוגמה
[abc]מוצא כל a, b, או c[aeiou] מוצא תנועות
[^abc]מוצא כל דבר חוץ מ-a, b, או c[^0-9] מוצא לא-ספרות
[a-z]טווח: כל אות קטנה[a-zA-Z] כל אות
[0-9]טווח: כל ספרה[0-9]+ מוצא מספרים

קבוצות וחלופה

דפוסתיאורדוגמה
(abc)קבוצת לכידה(\d+)-(\d+) לוכד שני מספרים
(?:abc)קבוצה ללא לכידה(?:https?://) מקבץ ללא לכידה
a|bחלופה (או)חתול|כלב מוצא כל אחד
\1הפניה לקבוצה 1(\w)\1 מוצא "aa", "bb"

דפוסים נפוצים

כתובת אימייל

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

URL

https?://[\w.-]+(?:/[\w./-]*)?

מספר טלפון (ישראל)

\+?972?[-.\s]?[2-9]\d?[-.\s]?\d{3}[-.\s]?\d{4}

תאריך (YYYY-MM-DD)

\d{4}-\d{2}-\d{2}

כתובת IP (IPv4)

\b(?:\d{1,3}\.){3}\d{1,3}\b

תעודת זהות

\d{9}

דגלים

דגלתיאור
iחיפוש ללא רגישות לאותיות גדולות/קטנות
gגלובלי - מוצא את כל ההתאמות
mמרובה שורות - ^ ו-$ מתאימים לתחילת/סוף שורה
sDotall - נקודה מתאימה גם לשורות חדשות

טיפים לשימוש ב-Regex Data Extractor

  1. התחילו פשוט והגדילו את המורכבות בהדרגה
  2. השתמשו בתכונת התצוגה המקדימה לבדיקת הדפוסים שלכם
  3. השתמשו בלוכסן אחורי כדי לברוח מתווים מיוחדים כשרוצים למצוא אותם כפשוטם
  4. השתמשו בכמתים לא-חמדניים (*?, +?) כשצריך
  5. בדקו עם מקרי קצה כדי לוודא שהדפוס שלכם עובד נכון

עם Regex Data Extractor, אתם יכולים להחיל דפוסים אלה ישירות על כל דף אינטרנט ולחלץ בדיוק את הנתונים שאתם צריכים. חילוצים מוצלחים!

regexדף עזרדפוסיםמדריך