Обработка Custom Extraction Лягушки

Утилита обработки файла выгрузки Custom Extraction из Screaming Frog'а — для слияния данных по одному экстрактору в одну колонку (когда экстрактор встречается несколько раз на одном URL'е) и подсчёта встречаемости экземпляров такого экстрактора.




Интерфейс

Интерфейс fcce

CSV файл Custom Extraction

Путь к файлу выгрузки Custom Extraction Лягушки, принимается только CSV формат.


Разделитель

Что использовать при склейке колонок одного экстрактора, по умолчанию — запятая.


Добавить счётчики

Подсчёт встречаемости повторяющихся экстракторов на каждом URL'е.


Повторяющийся экстрактор

Это такой, который встречается более одного раза на один URL. В экспорте Лягушки такие экстракторы идут с возрастающими порядковыми номерами, например, название экстрактора 1, название экстрактора 2, название экстрактора 3 и т.д.


Откуда взялось

Как известно, Лягушку с функционалом экстракторов можно использовать как парсер, однако нельзя задать вывод информации в экспорте. В частности, не всегда устраивает разделение одного экстрактора по разным колонкам (например, поиск по содержимому экстрактора удобнее производить в одной колонке, а не в гирлянде колонок). А также, иногда полезен подсчёт сущностей экстракторов, которые встречаются несколько раз на страницу (пример применения рассматривался при счёте товаров в категориях магазина). Поэтому и сделана была эта утилита.

Использованные картинки: 1, 2, 3