KnigkinDom.org» » »📕 Программирование. Принципы и практика использования C++ Исправленное издание - Бьёрн Страуструп

Программирование. Принципы и практика использования C++ Исправленное издание - Бьёрн Страуструп

Книгу Программирование. Принципы и практика использования C++ Исправленное издание - Бьёрн Страуструп читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!

1 ... 243 244 245 246 247 248 249 250 251 ... 337
Перейти на страницу:

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
class="empty-line"/>

1––2

Для задания конкретного количества вхождений или конкретного диапазона вхождений используются фигурные скобки. Например, выражение

w{2}–d{4,5}

соответствует только строкам, содержащим две буквы и дефис, за которым следуют четыре или пять цифр:

Ab–1234

XX–54321

22–54321

но не

Ab–123

?b–1234

Да, цифры задаются символами w.

23.8.4. Группировка

 Для того чтобы указать, что некое регулярное выражение является частичным шаблоном (sub-pattern), его следует заключить в круглые скобки. Рассмотрим пример.

(d*:)

Данное выражение определяет частичный шаблон, не содержащий ни одной или содержащий несколько цифр, за которыми следует двоеточие. Группу можно использовать как часть более сложного шаблона. Рассмотрим пример.

(d*:)?(d+)

Данное выражение задает необязательную и, возможно, пустую последовательность цифр, за которыми следуют двоеточие и последовательность из одной или нескольких цифр. Этот лаконичный и точный способ выражения шаблонов изобрели обычные люди!

23.8.5. Варианты

Символ “или” (|) задает альтернативу. Рассмотрим пример.

Subject: (FW:|Re:)?(.*)

Это выражение распознает тему сообщения электронной почты с необязательными символами FW: или Re:, за которыми может не стоять ни одного символа или может стоять несколько символов. Рассмотрим пример.

Subject: FW: Hello, world!

Subject: Re:

Subject: Norwegian Blue

но не

SUBJECT: Re: Parrots

Subject FW: No subject!

Пустая альтернатива не допускается.

(|def) // ошибка

Однако мы можем указать несколько альтернатив сразу.

(bs|Bs|bS|BS)

23.8.6. Наборы символов и диапазоны

 Специальные символы представляют собой обозначение наиболее распространенных классов символов: цифр (d); букв, цифр и знака подчеркивания (w) и др. (см. раздел 23.7.2). Однако часто бывает полезно определить свой собственный специальный символ. Сделать это очень легко. Рассмотрим пример.

В спецификации класса символов дефис () используется для указания диапазона, например, [1–3] (1, 2 или 3) и [w–z] (w, x, y или z). Пожалуйста, будьте аккуратны при использовании таких диапазонов: не все языки содержат одинаковые буквы, и порядки их следования в алфавитах разных языков могут отличаться. Если вам необходим диапазон, не являющийся частичным диапазоном букв и цифр, принятых в английском языке, то обратитесь к документации.

Следует подчеркнуть, что мы используем специальные символы, такие как w (означающий “любой словообразующий символ”), в спецификации класса символов. Как же нам вставить обратную косую черту () в класс символов? Как обычно, превращаем ее в управляющий символ: \.

 

 Если первым символом в спецификации класса символов является символ ^, это означает отрицание ^. Например:

В последнем регулярном выражении символ ^ стоит не на первом месте после квадратной скобки ([), значит, это простой символ, а не оператор отрицания. Регулярные выражения могут быть очень хитроумными.

Реализация библиотеки regex также содержит набор именованных классов символов, используемых для сравнения. Например, если хотите сравнивать буквенноцифровые символы (т.е. буквы или цифры: a–z, или A–Z, или 0–9), то это можно сделать с помощью регулярного выражения [[:alnum:]]. Здесь слово alnum представляет собой имя совокупности символов (набор буквенно-цифровых символов). Шаблон для непустой строки буквенно-цифровых символов, заключенной в квадратные скобки, может выглядеть так: "[[:alnum:]]+". Для того чтобы поместить это регулярное выражение в строковый литерал, мы должны сделать кавычки управляющими символами.

string s = ""[[:alnum:]]+"";

Более того, чтобы поместить строковый литерал в объект класса regex, мы должны сделать управляющими символами не только кавычки, но и саму обратную косую черту и использовать для инициализации круглые скобки, так как конструктор класса regex является явным:

regex s("\"[[:alnum:]]+\"");

Использование регулярных выражений вынуждает вводить множество обозначений. Перечислим стандартные классы символов.

Реализация библиотеки regex может содержать и другие классы символов, но если вы решили использовать именованный класс, не указанный в этом списке, убедитесь, что он не ухудшает переносимость программы.

23.8.7. Ошибки в регулярных выражениях

Что произойдет, если мы зададим неправильное регулярное выражение? Рассмотрим пример.

regex pat1("(|ghi)"); // пропущенный оператор альтернативы

regex pat2("[c–a]");  // не диапазон

Когда мы присваиваем шаблон объекту класса regex, он подвергается проверке. Если механизм сравнения регулярных выражений не может работать из-за того, что регулярное выражение неправильное или слишком сложное, генерируется исключение bad_expression.

Рассмотрим небольшую программу, позволяющую исследовать механизм сравнения регулярных выражений.

#include <boost/regex.hpp>

#include <iostream>

#include <string>

#include <fstream>

#include<sstream>

using namespace std;

using namespace boost; // если вы используете реализацию библиотеки

                       // boost

// получаем извне шаблон и набор строк

// проверяем шаблон и ищем строки, содержащие этот шаблон

int main()

{

  regex pattern;

  string pat;

  cout << "введите шаблон: ";

  getline(cin,pat); // считываем шаблон

  try {

    pattern = pat;  // проверка шаблона

    cout << "Шаблон: " << pattern << 'n';

  }

  catch (bad_expression) {

    cout << pat

         << "Не является корректным регулярным выражениемn";

    exit(1);

  }

  cout << "Введите строки:n";

  string line;   // входной буфер

  int lineno = 0;

  while (getline(cin,line)) {

    ++lineno;

    smatch matches;

    if (regex_search(line, matches, pattern)) {

      cout << " строка " << lineno << ": " << line << 'n';

      for (int i = 0; i<matches.size(); ++i)

        cout << "tmatches[" << i << "]: "

             << matches[i] << 'n';

    }

    else

      cout << "не соответствует n";

  }

}

ПОПРОБУЙТЕ

Запустите эту программу и попробуйте применить ее для проверки нескольких шаблонов, например abc, x.*x, ( .* ), ([^)]*) и w+w+(Jr.) ?.

23.9. Сравнение регулярных выражений

 

 Регулярные выражения в основном используются в двух ситуациях.

Поиск строки, соответствующей регулярному выражению в (произвольно длинном) потоке данных, — функция regex_search() ищет этот шаблон как подстроку в потоке.

Сравнение регулярного выражения со строкой (заданного размера)

1 ... 243 244 245 246 247 248 249 250 251 ... 337
Перейти на страницу:
Отзывы - 0

Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.


Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

  • 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
  • 2. Просьба отказаться от оскорблений, угроз и запугиваний.
  • 3. Просьба отказаться от нецензурной лексики.
  • 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.


Партнер

Новые отзывы

  1. Гость Татьяна Гость Татьяна24 сентябрь 22:20 Как то не очень... Невеста по ошибке. Я не дам тебе развод - Майя Линн
  2. Римма Римма24 сентябрь 21:52 Почему главные героинитпкие идиотки? И сюжет не плохой, и написано хорошо. Но как героиня - так дура дурой.... Хозяйка маленького дома, или Любимая для дракона - Кира Рамис
  3. Римма Римма20 сентябрь 12:27 Много ненужных пояснений и отступлений. Весь сюжет теряет свою привлекательность. Героиня иногда так тупит, что читать не... Хозяйка приюта для перевертышей и полукровок - Елена Кутукова
Все комметарии
Новое в блоге