Метод подбора синонимов при работе с семантикой

Семантика

Способ далеко не самый лучший, но простой, и бывает довольно результативным – иногда позволяет выцепить важные синонимы с малыми усилиями.

Это не панацея, и вполне можно упустить некоторые синонимы


Смысл синонимов

Тут всё очевидно – имея нужные базовые фразы, можно их распарсить как угодно (и/или дополнить выгрузкой из Букварикса), то есть, закладываем фундамент более качественной проработки семантики.


Исходные данные

Есть некая базовая фраза (называемая в некоторых кругах «маркерный запрос» или «маркер»), от которой отталкиваемся при сборе семантики. При этом, она может быть не основной (не самым высокочастотным синонимом).

Основное условие – базовая фраза не должна быть от балды, и по выдаче должно быть видно (например, здесь), что она «наша» (подходящая).


Непосредственно способ

  1. Парсинг базовой фразы против правой колонки Yandex Wordstat, Google Ads, похожих запросов, подсказок Директа;
  2. Удаление неявных дублей;
  3. Съём поисковой выдачи для подобранного;
  4. Группировка («кластеризация») в режиме hard 2 с базовой фразой в качестве «маркера».

Если без софта

Если работаем без софта (КК и кластеризатор), а только с помощью онлайн сервисов, тогда:

  1. То же самое, только ограничиться Гугл Эдс и Правой колонкой https://wordstat.yandex.ru/ (может оказаться полезным расширение https://semantica.in/tools/yandex-wordstat-assistant);
  2. Используем онлайн-кластеризатор, например, http://coolakov.ru/tools/razbivka/ – смотрим, в какие группы ушли базовые фразы, и работаем с этими группами.
Основной поставщик синонимов это Google Ads (по опыту), а обычная группировка (без «маркера») по идее должна дать +- похожий результат

Парсинг

Базовые фразы для примера:

  • ремонт турбин;
  • аудит пожарной безопасности;
  • рекламные туры;
  • невропатия лицевого нерва.

Далее рассматриваю работу через Key Collector 3-й. Итак, закидываем в КК, например, так:

добавление фраз в Key Collector

Затем парсим Эдс («широкий» регион – Россия, галки фильтрации вариантов сняты):

распределение по группам в КК
начать парсинг в Кейколлекторе

По аналогии парсим Правую колонку, также выставив «широкий» регион (Россия), похожие запросы, подсказки Директ.


Удаление неявных

Включаем режим мультигруппы для всех проработанных групп и фильтруем по источнику «добавлено вручную», и в колонку комментарий что-нибудь вписываем, например:

подготовка к удалению неявных дублей

Фильтруем по отрицанию комментария: не содержит «база» (без кавычек) – если как в примере.

Выполняем поиск неявных с такими настройками:

настройки удаления неявных дублей

Удаляем неявные. Очищаем фильтр.


Съём поисковой выдачи

Выставляем нужный регион (в примере был выставлен СПб), снимаем выдачу. Удобно с https://xmlproxy.ru/ (ставка 5 р./1000 запросов).

Если используется кластеризатор семантики, который поддерживает работу с «маркерными запросами» и сам снимает выдачу (например, KeyAssort), тогда этот шаг можно пропустить.


Группировка фраз

Выставляем в кластеризаторе hard-2 в качестве силы группировки и группируем («кластеризуем») все фразы по нашим «маркерам» (4 базовые фразы из примера).

В примерах группировка проведена кластеризатором Altblog (не бесплатной версией).


Результаты

По рекламным турам бросается в глаза слово «рекламники», поэтому возьмём его на проверку (забегая вперёд – да, это синоним), а также неплохо проверить и что за рекламный туроператор:

результат группировки другой фразы

 

Для болезни заметны слова «неврит», «нейропатия», «лицевая», и требует проверки также слово «лечение» - возможно, эта под-тема должна раскрываться на той же странице для закрытия намерения пользователя (так называемый «интент»), и фразу «лицевой нерв лечение» возможно также нужно взять в работу:

результат кластеризации одной из фраз

 

Для аудита напрашивается на проверку фраза «пожарный аудит» (независимый можно не брать, т.к. это всё выйдет при хорошем распарсе просто пожарного, если он подойдёт):

результат группировки ещё одной фразы

 

Для ремонта обращают на себя внимания слова «восстановление» и «отремонтировать», слово «турбокомпрессор» требует проверки (предположим, что мы не знаем, тот же ли это агрегат), и интересна фраза с Питером – возможно, поиск понимает по навигационному слову, что юзер имеет то же намерение, что и юзер, вбивающий «ремонт» (а может намерением является покупка новой? – надо проверить, вообщем):

результат кластеризации ещё одной фразы

Всё ?

Типа да. То есть, не особо заморачиваясь получили интересные данные, которые можем проверить по выдаче, и если подходят, то составить итоговые фразы на парсинг.

Справедливости ради, иногда по синонимам получается совсем скудный урожай (тогда, когда они есть).


Расширение подхода

Не рекомендую сильно упарываться, потому что способ хромает, и это родовые травмы

То есть, по опыту, как бы не тюнинговать методу, качество результата будет не сильно лучше (если будет лучше вообще), а времени и усилий уйдёт (значительно) больше.

Примеры тюнинга:

  • закидывать на парсинг не одну фразу, а несколько из одной недоработанной группы («кластера») – например, распарсить базовую в левой колонке Вордстата, снять выдачу и сгруппировать с силой хард-3, и всё, что уйдёт в одну группу с базовой, закинуть на поиск синонимов;
  • можно попробовать спарсить и Руки (давно это не делал, т.к. приплывало много мусора, но бывало, находилось интересное);
  • исследовать и прочие условно-тематические «кластеры», пробовать разные силы группировки.

Тэги: Семантика

Использованные картинки: 1