Немного о пагинации, как поисковые боты её воспринимают, директивы rel=next/prev, виляние поисковиков, разные приёмы.
Основная матчасть
Здесь можно почерпнуть основное, не со всем согласен, кое-что затрону далее.
Дополнительная уникализация SEO тегов
Обычно используется подстановка в SEO теги (title, meta description, h1) основной страницы слова «страница» и номера страницы пагинации.
Как известно, для большего отличия можно для каждого SEO тега брать уникальную основу чисто для пагинации и к ней присобачивать стандартное «страница X».
Например, тайтл основной страницы «Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине». А для страниц пагинации сделали основу «Микроволновки Bosch».
И тогда вместо таких тайтлов страниц пагинации:
Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине – Страница 2
Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине – Страница 3
Микроволновки Bosch – купить в Москве. Низкие цены в интернет-магазине – Страница 4
Получим:
Микроволновки Bosch – Страница 2
Микроволновки Bosch – Страница 3
Микроволновки Bosch – Страница 4
Текстовый фильтр основной страницы
Как известно, при наложении на основную страницу текстового фильтра, вместо неё может начать ранжироваться одна из страниц пагинации, спасая таким образом от весомых потерь.
В таком разрезе пагинация крайне полезна.
Полное закрытие пагинации от ботов
Несмотря на доводы против, этот вариант вполне применим (в том числе, в качестве временной меры), если открытие пагинации приводит (или прогнозируемо приведёт) к проблемам. Например:
- «товары» в подавляющем большинстве не имеют спроса и нормально индексируются поиском (с помощью XML карты или ещё каким-то образом);
- на сайте пагинация слишком массивна;
- есть большое число страниц (не пагинации) без живого спроса.
Meta robots noindex, follow
Можно закрыть пагинацию с помощью meta robots noindex, follow. Это компромисс между полным закрытием пагинации от поиска – блокирование её индексации, но со скармливанием поиску ссылок на «товары». Отрицательные аспекты:
- Яндекс будет накручивать счётчик «неработающих» внутренних ссылок сайта (наверное, логика в том, что раз страница закрыта ноиндексом, то бот на неё зря потратил ресурсы);
- Гугл может перестать посещать страницы пагинации – из-за того, что это будут страницы, долгое время находящиеся в ноиндексе (и плевать Гуглу, что там есть и директива фолоу). Это если я не путаю, что было такое заявление гуглоидов, и что если оно соответствует действительности.
Рекомендации для интернет-магазинов
Не касаясь экзотики вроде настройки под разные регионы и под охват семантики, которая не задействована в SEO тегах основных страниц.
- План максимум. Если нет явных противопоказаний, можно для ряда категорий с хорошим спросом (желательно) открыть пагинацию, без каких-либо канониклов, но с правильной настройкой (цифры, отсутствие повторяющегося текста и т.д.). Желательно, чтобы пагинация была пухлая (много страниц) – усилить вероятность проблем с поиском.
- План умеренный. Ставить каноникл с пагинации на основную страницу категории.
И в обоих случаях смотреть на реакцию поиска (индексация страниц пагинации, изменение их статуса в базе данных поиска). Ну и за трафиком на пагинацию понаблюдать.
По итогу решить, что будет лучше в рамках всего сайта.
Если будут проблемы с поиском, и никак от них не получится избавиться, всегда можно прикрыть пагинацию нахрен – либо умеренно (meta robots noindex, follow), либо вообще (meta robots noindex, nofollow + блокировка в robots.txt).
Корень всех зол
Далее пойдут рассуждения аффтыря об отношениях поисковиков с пагинацией, и это на любителя. Я предупредил.
Всё нижеизложенное является моим личным мнением, и не является истиной в первой инстанции, бла бла бла (дисклеймер, типа).
Все проблемы при работе с пагинацией – из-за того, что поисковики (Яндекс, Гугл) не делают по каким-то неясным причинам однозначно трактуемую схему, взяв за основу директивы rel=prev/next
.
Да, пагинация сильно отличается по полезности, поэтому эти директивы можно было б элементарно дополнить ещё какой-то краткой разметкой, указывающей, несёт ли пагинация ценность. Например, вебмастера для интернет-магазинов могли бы предпочесть «нет ценности», а для форумов «есть ценность».
Кому как не вебмастеру определять, полезна ли пагинация для поиска.
Сейчас же, поиск тасует пагинацию на своё усмотрение, нередко создавая проблемы вебмастерам, которых они были бы и рады избежать, но бюрократы от поиска считают, надо полагать, что такие трудности закаляют владельцев сайтов, разнообразят их серые будни.
Злоупотребление
Допустим, отсутствие нормального стандарта работы с пагинацией есть противодействие злоупотреблению схемой со стороны вебмастеров. Однако:
- Это всё равно, что лечить головную боль гильотиной;
- Я не вижу, как таким стандартом можно злоупотреблять;
- Даже если есть такая возможность, это же решается элементарно с помощью штрафов в адрес «нехороших» сайтов.
Виляние Гугла
Странно воспринимается история взаимодействия Гугла с пагинацией – почему-то я до сих пор не видел ту точку зрения, о которой ниже. Может, плохо искал. Ладно, теперь поздно, уже сам изложу.
Считаю, что Гугл воспринимает вебмастеров за не очень умных людей, раз потчует их такими притчами. Либо в конторе проблема со сценаристами по увлекательным историям.
Начало
Гугл в Твиттере заявил об отказе от rel=prev/next
, использую крайне странную аргументацию – мол юзерам нравится одностраничный контент, и что надо это использовать «когда возможно»... Но можно и многостраничный, и это тоже нормально:
Хм:
- Раз и то, и то нормально, то зачем было выпиливать поддержку rel=prev/next, и чем она мешала?
- Выбор в пользу использования пагинации всегда основывается на том, что без неё нельзя, поэтому «старайтесь использовать одностраничный контент» это слова того, кто неполностью понимает, что они значат в совокупности.
- В справке про одностраничный контент гуглоиды до сих пор упоминают о необходимости… пагинации:
- Упоминание про какие-то «исследования», которые им показали преимущество одностраничного контента это круто, ага, но ведь от пагинации нельзя отказаться, пока не придумано нечто более лучшее;
- Отсутствие от Гугла информации о последующих «исследованиях» по итогу отказа от поддержки этой микроразметки наводит на мысли о том, что новые «исследования» чего-то не то показали или их забыли провести.
Весна, весна – чудесная пора... обострений.
Продолжение
Что за этим последовало:
То есть, спустя год после гуглоиды сами указали на то, что они… отказались от простого способа распознования пагинации (с помощью существующей микроразметки) в пользу сложного. Молодцы, чё. Непрерывное развитие ума, покой им только снится.
Ага, спустя два года, они теперь могут определять распространенные (и только такие!) типы пагинации. Ну да, несколько лет инноваций приблизили их к тому, что обеспечивала готовая микроразметка. Ну это не срок, то ли ещё будет.
Итог
Причина отказа от спец. микроразметки видится шизофреничной, как и последующий «прогресс». Всё это прямо-таки эпично.
Это как на автопилотируемой машине отменить распознавание знака ПДД «пешеходный переход», в результате чего машина годами отдавливает неудачливым пешеходам ноги, а инженеры колымаги звонко рапортуют, что тюнингуют распознавание пешеходов без знака (ну конечно, нах он нужен).
Виляние Яндекса
Никогда и не было поддержки rel=prev/next, насколько знаю. И если раньше неплохо работал rel=canonical со страниц пагинации на первую (основную) страницу категории, то теперь Яндекс далеко не всегда придерживается этой схемы (возможно, начиная отсюда).
Насколько я понимаю слова их представителей – мол, можете указывать каноникл как раньше (на саму категорию), но Яндекс может проиндексировать пагинацию, если она несёт в себе «дополнительную ценность».
Ага, а если за такой индексацией последуют проблемы для сайта, то это не проблемы Яндекса.
Вообще, яндексоиды в вопросе пагинации в какой-то степени впереди гуглоидов – не объясняют, почему они игнорируют rel=prev/next (ога, объяснения для слабаков), и, само собой, не предоставляют нормальную обработку пагинации. Но и в то же время, отстают – вон у Гугла какой эпос, а у этих что-то невнятное, без огонька. Возможно не достаёт в штате хорошего сказочника.
И вишенка. По некоторым сведениям Яндекс распознаёт и учитывает настолько экзотическую микроразметку (пусть даже такая микроразметка и опосредованно влияет на распознавание пагинации):
Блин, если это так, то господа и дамы знают толк в извращениях – игнорировать rel=prev/next
, но учитывать такую экзотику.