Вступление
Дубли страниц это повторение содержимого статьи или ее части под разными URL в свободной выдаче поисковиков. Дубли страниц могут создаваться системой управления сайтом автоматически или администратором сайта вручную (чаще не преднамеренно). В этой статье мы говорим о дубле страниц в рамках одного домена.
Что такое дубли страниц
Прежде всего, давайте поймем, что такое дубли страниц.
Под дублями страниц понимается, что одну и ту же страницу ресурса или ее части можно найти по разным URL адресам.
Пойдем дальше, вспомним, как формируется контент сайта. Статья публикуется на сайте и записывается под своим URL в базу данных. Это и есть оригинал статьи с уникальным адресом URL. Нельзя сказать, что он единственный в математическом понимании. Любой SEF модуль перепишет его в SEF ссылку. Но опять-таки, эта SEF ссылка уникальна в единственном экземпляре.
В идеале, в индекс должно попадать столько URL страниц, сколько опубликовано. Это и есть золотое правило SEO — каждая страница должна быть доступна только по одному адресу. А что же происходит в реальности?
Прежде чем разобраться откуда берутся дубли страниц, поймем, почему поисковики «не любят» сайты с большим количеством дублированных страниц.
Ранжирование сайта и дубли страниц
Поисковики постоянно сканирует не закрытое от них содержание сайта. На сканирование и индексацию тратятся реальные ресурсы поисковых систем. Было бы странно, если поисковым системам нравились сайты, заполненные дублированными страницами. Ведь, по сути, получается, что поисковик листает одну и ту же страницу десятки и сотни раз.
Отсюда и появляются фильтры, накладываемые на сайты с большим количеством дублей, или сайт понижается в ранжировании (читать про ранжирование). Снижение ранжирования, отодвигает позиции в выдаче, а отсюда борьба «сеошников» с этими самыми дублями страниц. Вот такой логический цикл.
Но это не самая важная причина борьбы поисковиков с дублями страниц. Более веской причиной включения в поисковые алгоритмы санкций за дублирование страниц, стала борьба со ссылочным продвижением, когда масса ссылок разбрасывалась по сайту по одинаковым текстам (черные схемы оптимизации).
Причина появления дублей
Поняв, что такое дубли страниц сайта, давайте разберемся в причинах появления дублей страниц, в рамках одного домена. В рамках одного домена в создании дублей страниц есть следующие виновники:
- Человек (человеческий фактор);
- Традиции Интернет;
- Специфика CMS;
- Также, дубли могут появляться на сайте независимо от Вас. Ваша CMS сама «родит» дубли.
Примечание: Слышал мнение, что дубли страниц плодят SEO расширения, которые вы используете на сайте. Это не так. SEO расширения не создают дубли, они их выявляют и записывают в свою базу. От того, что в их базе появляются новые дубли, они не виноваты.
Как появляются дубли страниц
Проследим, как появляются дубли на сайте, без примеров, только общие тенденции.
- Сайт создается со своим адресом в Интернет – доменом. По сути, в интернет сразу же появляются два сайта один с доменным именем без WWW, второй с WWW. Без настроенной переадресации домена с www и без, в сети будут “гулять” дубли страниц;
- Многие CMS создают неявные дубли страниц, в разделах, в модулях, в архивах, в RSS;
- Дубли страниц появляются при неправильно настройки ссылок сайта и перестройки ссылок в процессе работы сайта, когда часть статей уже есть в индексе.
Именно по этому, после настройки всех параметров сайта по формированию URL , после настройки всех SEO расширений, установленных на сайте перестраивать ничего не нужно.
Зачем бороться с дублями страниц
Кроме опасности попасть из-за дублей страниц под поисковой фильтр, есть еще пару причин этой борьбы:
- Дубли рассеивают тИЦ страниц сайта. Поэтому очень важно избавиться от дублей перед очередным апдейтем поисковых систем.
- Чем больше дублей, тем меньше уникальность сайта, что также снижает ранжирование статей в выдаче.
Выводы
Мы разобрались, что такое дубли страниц сайта и поняли, чтобы снизить количество дублей необходимо:
- Сразу определитесь с главным доменом сайта (с и без WWW) и пропишите 301 Redirect в файле htaccess;
- Трудно вручную избавляться от дублей страниц. Поэтому лучше воспользоваться SEO расширениями доступными для вашей платформы;
- Периодически чистите базу ссылок SEO расширений от найденных дублей. Обязательно делайте это перед апдейт поисковиков;
- Более часто проверяйте дубль главной страницы;
- Решите проблему дублей feed и comments. Самое простое закройте feed сайта и комментарии к статьям сайта от индексирования в файле Robots.txt.
©Seojus.ru
Другие статьи раздела: Теория SEO
- Что такое ссылка – теория и конструкция гиперссылки
- Что такое естественная ссылка?
- SEO это не наука или почему оптимизация остается полезным набором инструментов
- Что такое дубли страниц сайта – как появляются дубли
- Ключевые слова сайта – что такое и для чего нужны ключи сайта
- Как использовать мета-теги robots – полное руководство
- Что такое CPA сети
- Дубли главной страницы вашего сайта