Представлення символів за їхнім кодом
У деяких випадках бажано представляти символи за їхнім кодом.
Представлення | Пояснення | Кодування |
---|---|---|
\0n | n - вісімкове число від 0 до 377 | 8-бітне |
\xdd | d - шістнадцяткова цифра | |
\udddd | 16-бітне (Юнікод) |
Керуючі символи
Представлення | Символ | Позначення | Розшифровка |
---|---|---|---|
\t | Табуляція | HT | Horizontal tabulation |
\v | Вертикальна табуляція | VT | Vertical tabulation |
\r | Повернення каретки | CR | Carriage return |
\n | Переведення рядка | LF | Line feed |
\f | Кінець сторінки | FF | Form feed |
\a | Дзвінок | BEL | Bell character |
\e | Escape-Символ | ESC | Escape character |
\b | Забій Повинен знаходитися всередині квадратних дужок (інакше інтерпретується як межа слова). | BS | Backspace |
\cA ... \cZ | Ctrl+A ... Ctrl+Z Наприклад, послідовність Еквівалентно |
Скорочені позначення символьних класів
Для часто використовуваних символьних класів існують короткі позначення.
Представлення | Еквівалент | Значення |
---|---|---|
\d | [0-9] | Цифра |
\D | [^\d] | Будь-який символ, окрім цифри |
\w | [A-Za-zА-Яа-я0-9_] | Символи, що утворюють «слово» (літери, цифри й символ підкреслення) |
\W | [^\w] | Символи, що не утворюють «слово» |
\s | [ \t\v\r\n\f] | Пробільний символ |
\S | [^\s] | Непробільний символ |
Символьні класи POSIX
Багато діапазонів символів залежать від обраних налаштувань локалізації. POSIX стандартизував оголошення деяких класів і категорій символів, як показано в такій таблиці:
POSIX-Клас | Еквівалент | Значення |
---|---|---|
[:upper:] | [A-Z] | Символи верхнього регістру |
[:lower:] | [a-z] | Символи нижнього регістру |
[:alpha:] | [[:upper:][:lower:]] | Літери |
[:digit:] | [0-9] , тобто \d | Цифри |
[:xdigit:] | [[:digit:]A-Fa-f] | Шістнадцяткові цифри |
[:alnum:] | [[:alpha:][:digit:]] | Літери й цифри |
[:word:] | [[:alnum:]_] , тобто \w | Символи, що утворюють «слово» |
[:punct:] | [-!"#$%&'()*+,./:;<=>?@[\\\]_'{|}~] | Знаки пунктуації |
[:blank:] | [ \t] | Пробіл і табуляція |
[:space:] | [[:blank:]\v\r\n\f] , тобто \s | Пробільні символи |
[:cntrl:] | [\x00-\x1F\x7F] | Керуючі символи |
[:graph:] | [\x21-\x7E] | Друковані символи |
[:print:] | [\x20-\x7E] , тобто [[:graph:] ] | Друковані символи із пробілом |
Використання класу можливо лише всередині квадратних дужок (приклад частої помилки - ^[:upper:]il+$
замість ^[[:upper:]]il+$
).
Примітки
- Зазначений еквівалент неповний, тому що в діапазон входять усі літери всіх мов.
Див. також
Література
- Фридл, Дж. Регулярные выражения. — Спб. : , 2001. — 352 с. — (Библиотека программиста) — .
- Смит, Билл. Методы и алгоритмы вычислений на строках (regexp) = Computing Patterns in Strings. — М. : «Вильямс», 2006. — 496 с. — .
- Форта, Бен. Освой самостоятельно регулярные выражения. 10 минут на урок = Sams Teach Yourself Regular Expressions in 10 Minutes. — М. : «Вильямс», 2004. — 192 с. — .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Predstavlennya simvoliv za yihnim kodomU deyakih vipadkah bazhano predstavlyati simvoli za yihnim kodom Predstavlennya Poyasnennya Koduvannya 0 i n i n visimkove chislo vid 0 do 377 8 bitne x i dd i d shistnadcyatkova cifra u i dddd i 16 bitne Yunikod Keruyuchi simvoliPredstavlennya Simvol Poznachennya Rozshifrovka t Tabulyaciya HT Horizontal tabulation v Vertikalna tabulyaciya VT Vertical tabulation r Povernennya karetki CR Carriage return n Perevedennya ryadka LF Line feed f Kinec storinki FF Form feed a Dzvinok BEL Bell character e Escape Simvol ESC Escape character b Zabij Povinen znahoditisya vseredini kvadratnih duzhok inakshe interpretuyetsya yak mezha slova BS Backspace cA cZ Ctrl A Ctrl Z Napriklad poslidovnist cM cJ vidpovidaye keruyuchim simvolam CR LF Ekvivalentno x01 x1A Skorocheni poznachennya simvolnih klasivDlya chasto vikoristovuvanih simvolnih klasiv isnuyut korotki poznachennya Predstavlennya Ekvivalent Znachennya d 0 9 Cifra D d Bud yakij simvol okrim cifri w A Za zA Yaa ya0 9 Simvoli sho utvoryuyut slovo literi cifri j simvol pidkreslennya W w Simvoli sho ne utvoryuyut slovo s t v r n f Probilnij simvol S s Neprobilnij simvol Simvolni klasi POSIX Bagato diapazoniv simvoliv zalezhat vid obranih nalashtuvan lokalizaciyi POSIX standartizuvav ogoloshennya deyakih klasiv i kategorij simvoliv yak pokazano v takij tablici POSIX Klas Ekvivalent Znachennya upper A Z Simvoli verhnogo registru lower a z Simvoli nizhnogo registru alpha upper lower Literi digit 0 9 tobto d Cifri xdigit digit A Fa f Shistnadcyatkovi cifri alnum alpha digit Literi j cifri word alnum tobto w Simvoli sho utvoryuyut slovo punct amp lt gt Znaki punktuaciyi blank t Probil i tabulyaciya space blank v r n f tobto s Probilni simvoli cntrl x00 x1F x7F Keruyuchi simvoli graph x21 x7E Drukovani simvoli print x20 x7E tobto graph Drukovani simvoli iz probilom Vikoristannya klasu mozhlivo lishe vseredini kvadratnih duzhok priklad chastoyi pomilki upper il zamist b b upper b b il PrimitkiZaznachenij ekvivalent nepovnij tomu sho v diapazon vhodyat usi literi vsih mov Div takozhRegulyarni viraziLiteraturaFridl Dzh Regulyarnye vyrazheniya Spb 2001 352 s Biblioteka programmista ISBN 5 318 00056 8 Smit Bill Metody i algoritmy vychislenij na strokah regexp Computing Patterns in Strings M Vilyams 2006 496 s ISBN 0 201 39839 7 Forta Ben Osvoj samostoyatelno regulyarnye vyrazheniya 10 minut na urok Sams Teach Yourself Regular Expressions in 10 Minutes M Vilyams 2004 192 s ISBN 0 672 32566 7