18.07.2014

Полный аудит сайта. Часть 3

Часть №8 - Спам и уязвимости

Аудит сайта

8.1 Поиск генерируемого контента

Контент, сгенерированный автоматически, с высокой долей вероятности будет расценен поисковой системой как спамный. Необходимо изучить сайт на предмет такого контента:

  • ручной поиск блоков с генерированным контентом по матрице

8.2 Проверка генерируемого контента на спамность

Если при генерации контента соблюдать определенные правила, он не будет расценен как спам. Необходимо изучить технологию генерации контента:

  • изучение содержания блоков с генерируемым контентом
  • изучение генерируемого контента на вопрос решения проблем пользователей
  • запрос и изучение ТЗ от клиента, по которому реализованы модули генерации

8.3 Анализ исходящей рекламы на нарушение правил ПС

Согласно лицензии поисковой системы Яндекс, сайт, использующий рекламу, мешающую пользователю находить нужную ему информацию будет понижен в ранжировании.

  • попапы
  • тизеры
  • рич медия
  • редиректы
  • кликандеры
  • любые всплывающие окна

8.4 Анализ SEOIN/SEOOUT

При простановке ссылок важно учитывать значения SEOIN/SEOOUT, чтобы избежать фильтрации на вес входящей ссылки.

8.5 Проверка ошибок и спамности HTML заголовков

TITLE и H1, H2, …, H6 могут быть заспамлены как намеренно, так и случайно. Необходимо изучить содержание TITLE и H1 – H6 по всему сайту.

  • слишком длинные заголовки (бонус получают не все слова)
  • дублирование title, дублирование h1
  • множественный повтор ключевых слов (окна, окна, окна)
  • использование заголовков не по назначению (ссылки в меню, выделение жирным)
  • несколько h1
  • отсутствие заголовков
  • отсутствие ключевых слов в заголовках
  • отсутствие связи между текстом и заголовками
  • совпадение title и h1

8.6 Проверка страниц на наличие скрытого текста

На странице может быть спамный или важный контент в невидимой области, например скрыт при помощи CSS и javascript. В случае, к примеру, наличия скрытых спамных ссылок, сайт может быть пессимизирован.

  • HTML анализ страницы и поиск блоков скрытого текста
  • Визуальный анализ страницы и CTRL + А
  • Плагин WebDeveloper для Firefox
  • Плагин Wink показывает скрытые ссылки со страницы
  • Сервис СайтРепорт показывает все внешние ссылки с сайта

8.7 Проверка работы службы модерации контента

В результате действий модератора, систематически допускающего на сайт спамные объявления, сайт может быть пессимизирован. На моей практике был такой случай.

  • поиск по спамным словам в индексе (порно, диплом, скачать, бесплатно, виагра, adult, viagra, free, blowjob, sex, movies)
  • проверка: ручное добавление спамного контента
  • установка плагина, автоматически определяющего спамные комментарии (сервисhttp://api.yandex.ru/cleanweb/)

8.8 Проверка работы контент-менеджеров

Неподготовленный контент-менеджер может допустить серьезную ошибку. Важно изучить работу контент-менеджера и подготовить для него инструкции.

  • не копирует ли контент-менеджер из word в визуальный редактор
  • публикует ли контент-менеджер через <HTML> или через визуальный редактор
  • выдерживает ли контент-менеджер оформление текста по стандартам
  • кроссбраузерны ли опубликованные страницы
  • не создаются ли дубли контента
  • нет ли на сайте индексируемых черновиков контента
  • проверяет ли контент-менеджер поставленные ссылки
  • контент-менеджер учитывает SEO нужды

8.9 Поиск SEO-разделов, SEO-страниц и архивной версии сайта

На старых сайтах иногда можно встретить пережитки прошлого: скрытый от пользователей раздел для SEO, архивная (старая) версия сайта, на которую не стоит ссылок. Важно убедиться, что эти страницы запрещены для индексации.

  • Изучить по html карте сайта, какие есть категории, сколько там страниц, какие там урл
  • Ручное изучение списка входных страниц
  • Сравнение списка страниц в индексе со списком страниц, найденных краулером (a-parser vs xenu)

8.10 Проверка сайта на XSS-уязвимости

Если сайт имеет уязвимости, он может быть заражен вирусом, может произойти утечка персональных данных пользователей, его могут использовать для простановки спамных ссылок.

8.11 Проверка текстов на грамматические ошибки и опечатки

Наличие орфографических и грамматических ошибок снижает доверие пользователей к сайту.

8.12 Анализ сайта на клоакинг

Некоторые вебмастера всё ещё используют клоакинг с целью манипуляции поисковой системой. Необходимо проверить сайт

  • Сравнение кеша страницы с текущей версией
  • Сравнить содержание страницы с копией от СайтРепорт (по умолчанию представляется user-agent: YandexBot)
  • Поиск клоакинга в продаваемых ссылках
  • Поиск клоакинга в контенте

8.13 Изучение списка исходящих внешних ссылок

Важно убедиться, что с сайта не стоит несанкционированных ссылок и ссылок на спамные сайты, в частности, что сайт не продает ссылки через биржи.

  • получение списка ссылок на внешние сайты с помощью сервисов solomonoСайтРепорт
  • поиск спамных сайтов и несанкционированных ссылок

8.14 Проверка IP адреса хостинга на наличие спамных сайтов

На IP адресе могут располагаться спамные и забаненные сайты. Об их наличии и содержании лучше узнать сразу.

  • проверка через запрос ip:255.255.255.255 в Yahoo, где 255.255.255.255 – адрес сервера

8.15 Проверка сайта на фильтры в Яндекс, Google

Сайт может находиться под санкциями. Различают достаточно большое количество фильтров, но их можно объединить условно в 3 группы: фильтр на домен, фильтр на страницу, фильтр на ссылку.

  • Падение позиций сайта (изучение динамики изменений позиций сайта на длительном периоде)
  • Выпадение страниц из индекса (изучение динамики индексации сайта)
  • Обнуление или уменьшение значений тулбарных метрик (изучение тИЦ и PR)
  • Падение трафика (изучение данных Яндекс.Метрика, Google.Analytics)
  • Информеры ПС (изучение данных Яндекс.Вебмастер, Google.Webmaster)
  • Факт исключения или недобавления сайта в каталог Яндекса (проверка в скрытой части Яндекс.каталога через запрос http://bar-navig.yandex.ru/u?ver=2&url=http://site.ru&show=1)

8.16 Проверка страниц на фильтры в Яндекс, Google

SEO-специалист, который ранее продвигал сайт, мог перестараться с оптимизацией продвигаемых страниц.

  • Падение позиций запроса или группы запросов (изучение динамики изменений позиций по запросам и группам запросов на длительном периоде)
  • Наличие страницы в индексе

8.17 Проверка ссылочной массы на фильтры в Яндекс, Google

Ошибки SEO специалиста могли привести к тому, что закупка части ссылок приносит убытки.

  • Обнуление тИЦ
  • По купленным проиндексированным ссылкам позиции не растут
  • Позиции по запросам падают или стагнируют

8.18 Проверка ссылочной массы на спамность доноров

Проверить рабочесть конкретной ссылки невозможно, но можно исключить подозрительные сайты из ссылочной массы.

  • Трафик
  • SEOin vs SEOout
  • Отношение числа ссылок к числу страниц в индексе

8.19 Поведенческие накрутки

Важно узнать, не предпринимаются ли осознанные или не осознанные действия по накрутке поведенческих факторов.

  • Не обоснованный рост трафика по некоторым запросам, опережающий рост позиций (или вообще при отсутствии роста позиций) (сервисы Яндекс.Метрика, Google.Analytics)
  • Рост трафика при отсутствии роста конверсии (сервисы Яндекс.Метрика, Google.Analytics)

8.20 Проверка текстов на спамность ключевых слов

Страницы с заспамленными текстами могут быть пессимизированы

  • использовать любой сервис, который строит график распределения ключевые слова (функция page auditor в СайтРепорт, лексикологический анализ в СайтРепорт, )
Аудит сайтаАудит сайта

8.21 Проверка IP на наличие в спам.базах

IP адрес, на котором расположен сервер заказчика, с которого уходят уведомления о регистрациях и рассылка для пользователей, может быть в спам-листах.

8.22 Проверка на ссылочные взрывы

Неквалифицированный SEO специалист может закупить непропорционально большое количество ссылок за короткий период, вызвав эффект «ссылочного взрыва». В этом случае купленные в определенный период ссылки перестают учитываться и бюджет расходуется впустую.

 

аудит сайтааудит сайта

Часть №9 - Факторы авторитетности 

9.1 Анализ параметрических характеристик сайта

Нужно изучить косвенные показатели авторитетности и статического веса сайта и страниц, чтобы оценить начальное положение сайта и динамику его роста.

  • тИЦ (RDS Bar)
  • PR (RDS Bar)
  • AlexaRank (сервис www.alexa.com)
  • места в различных рейтингах (Liveinternet, Megaindex, SeoRate)
  • присутствие сайта в каталогах Яндекс, DMOZ, Mail.ru

9.2 Анализ узнаваемости компании в интернете

Один из показателей авторитетности проекта – активность в интернете.

  • статистика по витальным запросам (сервис wordstat.yandex.ru)
  • количество упоминаний названия компании и домена в интернете (запросы к Яндексу)
  • наличие в значимых тематических рейтингах (например для SEO – это ktoprodvinul.ruseonews.ru,cmsmagazine.ru)
  • упоминание в блогах, новостях (запросы к Яндексу)

9.3 Анализ долевого распределения трафика по разным каналам интернет-маркетинга

Необходимо изучить все источники трафика на сайт. Некоторые из этих источников можно использовать для получения ссылок. Во время анализа часто можно обнаружить ошибки вебмастеров и маркетологов, приводящие к падению конверсии.

  • анализ проводится через сервисы Яндекс.Метрика и Google.Analytics
  • изучение трафика, конверсия, сравнение между категориями сайта и разными источниками трафика

9.4 Анализ ссылочной массы на трастовые ссылки (в т.ч. каталоги ПС)

Основной параметр релевантности – TrustRank строится на ссылках с авторитетных ресурсов. Необходимо изучить сайт на наличие таких ссылок.

  • получение списка сайтов (ahrefs, majesticseo, solomono)
  • изучение площадок по выборки с высокими тИЦ, PR, в Як или DMOZ

9.5 Анализ возрастных факторов по страницам и по сайту 

Нас интересует: возраст ссылок, возраст страниц, возраст сайта.

  • Возраст сайта можно узнать через whois (http://nic.ru/whois)
  • Изучить историю домена (http://web.archive.org/)
  • Изучение истории индексации http://yandex.ru/yandsearch?text=запрос&lr=213&how=tm
  • Изучение дат последней индексации страниц со ссылками (сохраненные копии в ПС)
  • Сопоставление дат индексации страниц со ссылками и дат простановки ссылок