(парсинг)
В информатике, синтаксический анализ— это процесс сопоставления линейной последовательности лексем (слов, токенов) языка с его формальной грамматикой. Результатом обычно является дерево разбора (синтаксическое дерево). Обычно применяется совместно с лексическим анализом. Синтаксический анализатор (парсер) — это программа или часть программы, выполняющая синтаксический анализ.
При парсинге исходный текст преобразуется в структуру данных, обычно — в дерево, которое отражает синтаксическую структуру входной последовательности и хорошо подходит для дальнейшей обработки.
Как правило, результатом синтаксического анализа является синтаксическая структура предложения, представленная либо в виде дерева зависимостей, либо в виде дерева составляющих, либо в виде некоторой комбинации первого и второго способов представления.
Всё что угодно, имеющее «синтаксис», поддается автоматическому анализу.
языки программирования — разбор исходного кода языков программ
структурированные данные — данные, языки их описания, оформления и т. д. Например, XML, HTML, CSS, ini-файлы, специализированные конфигурационные файлы и т.п.;
SQL-запросы (DSL-язык);
математические выражения;
регулярные выражения (которые, в свою очередь, могут использоваться для автоматизации лексического анализа);
формальные грамматики;
лингвистика — человеческие языки. Например, машинный перевод и другие генераторы текстов;
При поиске способов парсинга XML на PHP, было обнаружено несколько способов решения данной задачи. Первый способ простой набор функций в PHP для работы с XML-файлами, который называется «XML Parser Functions».Второй способ основан на использовании расширения SimpleXML, которое доступно в PHP начиная с версии 5. Для решения данной задачи был выбран второй метод, так как он оказался проще в реализации и более гибким.