Пагинация

Техническое SEO ДижЫтал

Немного о пагинации, как поисковые боты её воспринимают, директивы rel=next/prev, виляние поисковиков, разные приёмы.


Основная матчасть

Здесь можно почерпнуть основное, не со всем согласен, кое-что затрону далее.


Дополнительная уникализация SEO тегов

Обычно используется подстановка в SEO теги (title, meta description, h1) основной страницы слова «страница» и номера страницы пагинации.

Как известно, для большего отличия можно для каждого SEO тега брать уникальную основу чисто для пагинации и к ней присобачивать стандартное «страница X».

Например, тайтл основной страницы «Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине». А для страниц пагинации сделали основу «Микроволновки Bosch».

И тогда вместо таких тайтлов страниц пагинации:

Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине – Страница 2
Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине – Страница 3
Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине – Страница 4

Получим:

Микроволновки Bosch – Страница 2
Микроволновки Bosch – Страница 3
Микроволновки Bosch – Страница 4

Текстовый фильтр основной страницы

Как известно, при наложении на основную страницу текстового фильтра, вместо неё может начать ранжироваться одна из страниц пагинации, спасая таким образом от весомых потерь.

В таком разрезе пагинация крайне полезна.


Полное закрытие пагинации от ботов

Несмотря на доводы против, этот вариант вполне применим (в том числе, в качестве временной меры), если открытие пагинации приводит (или прогнозируемо приведёт) к проблемам. Например:

  • «товары» в подавляющем большинстве не имеют спроса и нормально индексируются поиском (с помощью XML карты или ещё каким-то образом);
  • на сайте пагинация слишком массивна;
  • есть большое число страниц (не пагинации) без живого спроса.

Meta robots noindex, follow

Можно закрыть пагинацию с помощью meta robots noindex, follow. Это компромисс между полным закрытием пагинации от поиска – блокирование её индексации, но со скармливанием поиску ссылок на «товары». Отрицательные аспекты:

  • Яндекс будет накручивать счётчик «неработающих» внутренних ссылок сайта (наверное, логика в том, что раз страница закрыта ноиндексом, то бот на неё зря потратил ресурсы);
  • Гугл может перестать посещать страницы пагинации – из-за того, что это будут страницы, долгое время находящиеся в ноиндексе (и плевать Гуглу, что там есть и директива фолоу). Это если я не путаю, что было такое заявление гуглоидов, и что если оно соответствует действительности.

Рекомендации для интернет-магазинов

Не касаясь экзотики вроде настройки под разные регионы и под охват семантики, которая не задействована в SEO тегах основных страниц.

  1. План максимум. Если нет явных противопоказаний, можно для ряда категорий с хорошим спросом (желательно) открыть пагинацию, без каких-либо канониклов, но с правильной настройкой (цифры, отсутствие повторяющегося текста и т.д.). Желательно, чтобы пагинация была пухлая (много страниц) – усилить вероятность проблем с поиском.
  2. План умеренный. Ставить каноникл с пагинации на основную страницу категории.

И в обоих случаях смотреть на реакцию поиска (индексация страниц пагинации, изменение их статуса в базе данных поиска). Ну и за трафиком на пагинацию понаблюдать.

По итогу решить, что будет лучше в рамках всего сайта.

Если будут проблемы с поиском, и никак от них не получится избавиться, всегда можно прикрыть пагинацию нахрен – либо умеренно (meta robots noindex, follow), либо вообще (meta robots noindex, nofollow + блокировка в robots.txt).


Корень всех зол

Далее пойдут рассуждения аффтыря об отношениях поисковиков с пагинацией, и это на любителя. Я предупредил.

Всё нижеизложенное является моим личным мнением, и не является истиной в первой инстанции, бла бла бла (дисклеймер, типа).

Все проблемы при работе с пагинацией – из-за того, что поисковики (Яндекс, Гугл) не делают по каким-то неясным причинам однозначно трактуемую схему, взяв за основу директивы rel=prev/next.

Да, пагинация сильно отличается по полезности, поэтому эти директивы можно было б элементарно дополнить ещё какой-то краткой разметкой, указывающей, несёт ли пагинация ценность. Например, вебмастера для интернет-магазинов могли бы предпочесть «нет ценности», а для форумов «есть ценность».

Кому как не вебмастеру определять, полезна ли пагинация для поиска.

Сейчас же, поиск тасует пагинацию на своё усмотрение, нередко создавая проблемы вебмастерам, которых они были бы и рады избежать, но бюрократы от поиска считают, надо полагать, что такие трудности закаляют владельцев сайтов, разнообразят их серые будни.


Злоупотребление

Допустим, отсутствие нормального стандарта работы с пагинацией есть противодействие злоупотреблению схемой со стороны вебмастеров. Однако:

  • Это всё равно, что лечить головную боль гильотиной;
  • Я не вижу, как таким стандартом можно злоупотреблять;
  • Даже если есть такая возможность, это же решается элементарно с помощью штрафов в адрес «нехороших» сайтов.

Виляние Гугла

Странно воспринимается история взаимодействия Гугла с пагинацией – почему-то я до сих пор не видел ту точку зрения, о которой ниже. Может, плохо искал. Ладно, теперь поздно, уже сам изложу.

Считаю, что Гугл воспринимает вебмастеров за не очень умных людей, раз потчует их такими притчами. Либо в конторе проблема со сценаристами по увлекательным историям.


Начало

Гугл в Твиттере заявил об отказе от rel=prev/next, использую крайне странную аргументацию – мол юзерам нравится одностраничный контент, и что надо это использовать «когда возможно»... Но можно и многостраничный, и это тоже нормально:

Пришла весна для Google

Хм:

  • Раз и то, и то нормально, то зачем было выпиливать поддержку rel=prev/next, и чем она мешала?
  • Выбор в пользу использования пагинации всегда основывается на том, что без неё нельзя, поэтому «старайтесь использовать одностраничный контент» это слова того, кто неполностью понимает, что они значат в совокупности.
  • В справке про одностраничный контент гуглоиды до сих пор упоминают о необходимости… пагинации:
  • Упоминание про какие-то «исследования», которые им показали преимущество одностраничного контента это круто, ага, но ведь от пагинации нельзя отказаться, пока не придумано нечто более лучшее;
  • Отсутствие от Гугла информации о последующих «исследованиях» по итогу отказа от поддержки этой микроразметки наводит на мысли о том, что новые «исследования» чего-то не то показали или их забыли провести.

Весна, весна – чудесная пора... обострений.


Продолжение

Что за этим последовало:

То есть, спустя год после гуглоиды сами указали на то, что они… отказались от простого способа распознования пагинации (с помощью существующей микроразметки) в пользу сложного. Молодцы, чё. Непрерывное развитие ума, покой им только снится.

Далее:

Ага, спустя два года, они теперь могут определять распространенные (и только такие!) типы пагинации. Ну да, несколько лет инноваций приблизили их к тому, что обеспечивала готовая микроразметка. Ну это не срок, то ли ещё будет.


Итог

Причина отказа от спец. микроразметки видится шизофреничной, как и последующий «прогресс». Всё это прямо-таки эпично.

Пришла весна для Google

Это как на автопилотируемой машине отменить распознавание знака ПДД «пешеходный переход», в результате чего машина годами отдавливает неудачливым пешеходам ноги, а инженеры колымаги звонко рапортуют, что тюнингуют распознавание пешеходов без знака (ну конечно, нах он нужен).


Виляние Яндекса

Никогда и не было поддержки rel=prev/next, насколько знаю. И если раньше неплохо работал rel=canonical со страниц пагинации на первую (основную) страницу категории, то теперь Яндекс далеко не всегда придерживается этой схемы (возможно, начиная отсюда).

Насколько я понимаю слова их представителей – мол, можете указывать каноникл как раньше (на саму категорию), но Яндекс может проиндексировать пагинацию, если она несёт в себе «дополнительную ценность».

Ага, а если за такой индексацией последуют проблемы для сайта, то это не проблемы Яндекса.

Вообще, яндексоиды в вопросе пагинации в какой-то степени впереди гуглоидов – не объясняют, почему они игнорируют rel=prev/next (ога, объяснения для слабаков), и, само собой, не предоставляют нормальную обработку пагинации. Но и в то же время, отстают – вон у Гугла какой эпос, а у этих что-то невнятное, без огонька. Возможно не достаёт в штате хорошего сказочника.

И вишенка. По некоторым сведениям Яндекс распознаёт и учитывает настолько экзотическую микроразметку (пусть даже такая микроразметка и опосредованно влияет на распознавание пагинации):

Блин, если это так, то господа и дамы знают толк в извращениях – игнорировать rel=prev/next, но учитывать такую экзотику.

Использованные картинки: 1, 2