Как избавиться от наказания за дублированный контент

В этом видео Энди Дженкинс рассказывает, как Google вычисляет дублированный контент и что нужно изменить в сайте, чтобы поисковые системы исправно индексировали страницы и не пеналили их за неоригинальное содержание.

Борьба с дублированным контентом вкупе с удвоением поискового трафика наверняка принесет ощутимые результаты.

Сейчас вы можете даже не подозревать о том, что Google или любая другая поисковая система накладывает санкции за дублированный контент на отдельные страницы вашего сайта. И узнаете вы об этом только тогда, когда ваши позиции в выдаче начнут медленно, но уверенно сползать вниз. Более того, если вы не предпримете никаких действий, Google может вообще удалить сайт из основного поиска, так что найти его можно будет только по названию домена.

Энди считает дублированный контент одной из основных проблем, с которыми сталкиваются как новички, так и опытные вебмастера. По его словам, около 75% его клиентов так или иначе пострадали от этой проблемы.

Как раз и навсегда избавиться от дублированного контента и обезопасить свой сайт на будущее

Особой зоной риска в плане дублированного контента можно считать Интернет-магазины, на которых продаются сотни и тысячи физических или информационных товаров различных торговых марок.

Дело в том, что вы можете создавать дубликаты страниц, даже не подозревая об этом. Однако не это главное. Главное, чтобы после просмотра этого видео, вы раз и навсегда избавили свой сайт от дублирующих страниц и тем самым только увеличили свой заработок в Интернете.

В начале видео Энди поясняет некоторые основные моменты:

1. Самым опасным типом дублированного контента является тот, который находится в пределах одного сайта.

Дублированный контент в пределах одного сайта

Дубликаты с других сайтов тоже могут навредить вашему ресурсу, однако повторы внутри одного сайта обязательно сделают это.

2. Под контентом подразумевается текст, который видят посковые боты. При работе над дублированным контентом рисунки и даже текст внутри «alt»-тэга в расчет не берутся.

Текстовое наполнение страницы

3. Залогом успеха, как и в случае с любым другим аспектом SEO, является тестирование. Энди дает базу, от которой вы будете отталкиваться во время работы со своим сайтом. Однако лишь тестируя и отслеживая результаты, вы сможете выжать из сайта максимум.

Что такое дублированный контент?

Это две или больше страниц на одном сайте, которые выглядят настолько похожими для поисковых машин, что те не считают нужным индексировать их.

Дублированный контент

Поисковый бот, по мнению Энди, реагирует примерно так: «Какого черта я буду загаживать свой винт одинаковыми страницами, да еще и с одного домена?» 🙂

То, что поисковая система отказывается индексировать такие страницы, чревато для вас неприятными последствиями:

  1. Страница не может попасть в выдачу по своему ключевому слову.
  2. Страница не может увеличить ссылочный вес страниц, на которые она ссылается, независимо от того, как выглядит якорь ссылки.
  3. Страница не может поднять PageRank других страниц.

Все вместе это приводит к тому, что сайт не может подняться в выдаче по ключевым запросам. Еще хуже, если поисковая система начинает считать дубликатами половину (или больше) страниц сайта. Во многих случаях это приводит к медленной, но уверенной смерти сайта, и тогда ваш сайт можно будет найти, только набрав в строке поиска название домена.

Google Search

Волшебная пилюля

Чтобы решить проблему, нужно сначала взглянуть на нее глазами того, кто ее непосредственно создает, т.е. робота. Робот видите страницу несколько иначе, чем мы:

Страница глазами робота

(Не волнуйтесь, колдовать над кодом вам практически не придется.)

Каждая страница сайта, в частности сайта Энди состоит из основных элементов:

Структура сайта

где:

  1. Шапка сайта.
  2. Левая колонка.
  3. Правая колонка.
  4. Подвал.
  5. Наполнение («content container»).

Вместе эти элементы составляют шаблон сайта. Каждый из них, кроме наполнения, повторяется на всех страницах и практически на всех страницах они выглядят одинаково. Единственное , что отличает страницы, — это их наполнение.

Наполнение страницы

(В качестве модели для фотографии выступил сам Энди Дженкинс.)

Что видит на странице сайта человек?

Попав на сайт, мы быстро привыкаем к шаблону и после этого видим только то, что на разных страницах выглядит иначе, т.е. мы видим наполнение и не замечаем структурных элементов страницы (выделено красным).

Что видит на странице человек

Кроме всего прочего, такая особенность восприятия позволяет сконцентрировать внимание посетителя на вашем сообщении (в данном случае на описании кольчуги).

Что видит на странице сайта робот?

Поисковые боты в отличие от человека не умеют запоминать повторяющиеся элементы сайта, поэтому при оценке новой страницы на предмет дублирования контента робот учитывает текстовое содержимое всех элементов страницы.

Как видите страницу робот

Если две страницы выглядят так:

Две разных страницы

то человек сможет заметить разницу. А робот нет. Он просто примет те пару-тройку строчек текста, которые отличают страницы, за погрешность и даст новой странице однозначный диагноз: «Дублированный Контент».

Решение проблемы

Итак, мы имеем следующее:

  • робот видит всю страницу;
  • робот считает каждое слово на странице
  • Web-дизайнеры, создавая страницу, часто думают о людях и забывают о роботах

Однако именно робот решает, какое место займет страница в выдаче и будет ли она проиндексирована вообще, следовательно, вы должны дать ему то, что он от вас хочет.

Теперь по пунктам:

1. Подсчитайте количество слов в шаблоне страницы (все элементы кроме наполнения).

Для этого выделите весь текст на странице (Правка —> Выделить Все (Ctrl + A)) и скопируйте его (Правка —> Копировать (Ctrl + C)) в Word. Теперь воспользуйтесь меню Сервис —> Cтатистика и посмотрите, сколько слов содержит ваш шаблон.

Так, например, шаблон Энди содержит всего 220 с лишним слов. Как ему это удалось? Об этом немного позже.

А пока запишите или запомните цифру, которую вы только что узнали.

Количество слов

Ваша задача — создать такое текстовое наполнение, чтобы число слов в нем превышало число слов в элементах шаблона.

Кличество слов в наполнении страницы

Благодаря этому простому действию страница станет непохожей на другие, и шансы того, что поисковый робот признает ее дубликатом, снизятся до минимума.

2. Измените заголовок страницы (содержимое тэга <title>). У вас не должно быть двух страниц с одинаковыми заголовками.

Заголовки

Это единственный раз, когда вам придется немного поработать с кодом.

Важно: Как вы считаете, следующие заголовки одинаковы или нет?

Варианты заголовка

Для человека да, а вот для машины — совсем не обязательно.

В SEO есть такое понятие как стоп-слова. Это слова или короткие фразы, которые поисковые системы не принимают во внимание при определении релевантности и ранжировании страниц.

Какое это имеет отношение к вам? Если вы сделали контент страниц уникальным, но поисковик упорно отказывается индексировать страницу, проблема может заключаться в ее заголовке, а именно в стоп-словах, которые он содержит. Если заголовки страниц отличаются только стоп-словами, можете считать, что вы нашли источник своих бед. Вот их список.

Стоп-слова

Этот же список вы можете посмотреть в блоге Stompernet. Еще лучше, скопируйте его на жесткий диск и распечатайте.

3. Где это возможно, замените текст рисунком.

Вот почему у Энди так мало слов в шаблоне. Значительная часть текста изображена в виде рисунков, которые может «прочитать» человек, но не может машина. Посмотрите на рисунок.

Рисунок вместо текста

Правильно, это текст. Но Энди не может выделить его. Значит, что это? Правильно, рисунок. Вот так Энди «обманывает» поисковых роботов и уменьшает количество слов в шаблоне. Робот не может ни увидеть, ни понять, ни посчитать эти слова.

Еще один пример: сайт, посвященный жилищной ипотеке. Законодательство США требует, чтобы на каждой странице сайта компании, занимающейся ипотекой, висел огромадный дисклеймер вроде того, что на картинке.

Дисклеймер

Это 800 слов абсолютно идентичного текста на каждой странице. Естественно, его лучше заменить рисунком. Но…

Дисклеймер обязан присутствовать на сайте в виде текста, так чтобы его могли обнаружить поисковые боты, и чтобы посетитель мог при желании скопировать его себе на компьютер. В этом случае вы должны создать отдельную страничку и поместить туда текст. А чтобы этот текст нашел посетитель (бот его найдет сам), к каждому графическому изображению дисклеймера прикрепите ALT-тэг с таким содержанием.

Текст ALT-тэга

И волки сыты, и овцы целы.

SEO миф

В заключительной части видео Энди развенчивает миф о том, что вес ссылок с других сайтов, сколько-нибудь выше, чем вес ссылок с внутренних страниц сайтов.

Внешние vs. внутренние ссылки

Энди заявляет, что при прочих равных условиях их вес одинаков. (Кому-кому, а Энди верить можно. ;)) Именно поэтому вам нужно приложить максимум усилий, чтобы поисковый робот не посчитал ваши внутренние страницы дубликатами главной. Вполне вероятно, что у вас уже есть значительное количество страниц с дублированным контентом, которые можно вернуть в индекс прямо сейчас. И стоит вам это сделать, как страницы (в том числе и главная) практически сразу начнут подниматься в выдаче. А вместе с главной начнут подниматься и второстепенные (см. перевод предыдущего видео).

Оставайтесь на связи! Это далеко не последнее видео от Энди Дженкинса.

п.с. Надеюсь, вам понравилась эта статья. Если да, буду очень признателен, если вы поспособствуете ее социализации. Напишите комментарий, поставьте закладку, проголосуйте на News2.0, сообщите о статье в своем блоге, скопируйте ее к себе в блог (с сохранением ссылок).

Заранее благодарен!

Записи по теме:

Нравятся статьи? Подписывайтесь на рассылку!


156 комментариев

  1. У меня сайт рефератов. Накопилось в компе за 10 лет и решил все выложить в сеть (оригинальных там кот наплакал)! И ничего яндекс проглотил…за милую душу

  2. Спасибо, интересная информация. Если я скопирую себе в блог, как это будет выглядеть: копипаст или если ссылкой на ваш блог это будет восприниматься нормально?

  3. Бред какой-то. То что в шаблоне повторяются какие-то слова (например, та же навигация или какие-то рекламные блоки) — это настолько мизерная часть. А все остальное — это лишь HTML-разметка которая вообще не учитывается не индексируется. И достаточно всего лишь закрыть некоторые элементы повторяющегося контента тегом ноиндекс и все. А проблема дублирующегося контента связана не с шаблонами, а, например, с отображением его в блогах, где заметка может показываться на разных адресах. Вот тут проблема актуальна и тут тоже можно поюзать ноиндекс в некоторых частях шаблона.

  4. Благодарю за инфу. Наверное и всей жизни мне не хватит, чтобы освоить все seo трюки…буду учиться))))

  5. Очень полезная информация.Особенно кстати она для тех пользователей,кто не искушен в программировании.Спасибо.Будем пользоваться .

  6. да, ладно, лояльно к дубляжу …. скажу чесно, собственній опіт, http://compendium.in.ua/ база даніх лекарств, на extJS сделал натівную апликуху некой хитровімаханой фирмі, контент дублированій — pr-3 и в результате 20-30 уников в день )))

  7. Спасибо за хорошо представленную информацию, для нашего проекта это актуально… Будем примеять на практике…

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Получать новые комментарии по электронной почте. Вы можете подписатьсяi без комментирования.