Xenu: проверка исходящих ссылок с сайта
Каждый вебмастер старается наполнить свой ресурс уникальными полезными статьями, часто приходится ссылаться на сторонние сайты. Спустя несколько лет, сайт может иметь несколько сотен, а то и тысячи страниц. В SEO есть понятие заспамленности ссылками. Это когда количество исходящих ссылок с сайта имеет процентное соотношение к общему количеству уникальных страниц. В статье описано как найти исходящие ссылки Xenu, посчитать их заспамленность.
Заспамленность ссылками может негативно сказаться на индексации страниц и сайта в целом, а также его ранжировании в поисковых выдачах Яндекса и Google. А это значит, что количество посетителей с поиска может резко сократиться, а то и вовсе свестись к нулю. В статье я расскажу, как найти исходящие ссылки и, посчитать их заспамленность.
Я не буду рассматривать онлайн-сервисы, так как они не сканируют сайт целиком и зачастую выдают неактуальную на сегодняшний день информацию по внешним ссылкам с сайта.
Для того чтобы определить все внешние исходящие ссылки с сайта, вам необходимо скачать и установить себе на компьютер программу Xenu Link Sleuth. Приложение в первую очередь служит для поиска битых ссылок, но мы используем его для других целей. Наша задача – найти все исходящие ссылки с вашего веб-ресурса на внешние сайты.
И так, запустите программу Xenu, если вдруг всплыло какое-либо окошко с подсказками, закройте его. Откройте с лева верхнюю вкладку File – Check URL.
В окне «Xenu’s starting point» в первой же строчке введите адрес сайта, на котором хотите посмотреть все внешние ссылки. Для правильной проверки всего ресурса, вводить URL необходимо с HTTP или HTTPS, согласно протоколу вашего сайта. Нажмите ОК, для запуска сканирования.
Процесс может занять какое-то время, все зависит от общего количества страниц, дублей, ссылок. По окончанию сканирования, программа вас уведомит всплывающим окном: «Link sleuth finished. Do you want a report?», что означает «Поиск ссылок закончен. Вам нужен отчет?». Нажмите Нет.
Теперь нам нужно сохранить данные в блокноте с табуляцией в формате TXT. Для этого нажмите File – Export TAB separated file.
Выберите расположение для экспорта, дайте любое название файлу и нажмите Сохранить.
Далее откройте программу Excel (Microsoft Office), в верхнем левом углу нажмите Файл – Открыть.
В появившемся окне во всплывающем меню вместо «Все файлы Excel», выберите «Все файлы», найдите путь сохраненного TXT-файла, загрузите его нажав кнопку Открыть.
В появившемся окошке «Мастер текстов» нажмите Далее – Далее – Готово.
Кликните по разделению между столбцами A и B, потяните в право, чтобы увидеть полностью URL-адреса, как показано на картинке ниже.
Кликните по букве A шапки первого столбца, тем самым отмечая его. В верхнем меню нажмите ДАННЫЕ, в сортировке выберите А-Я↓. Если всплывет окно, кликните кнопку Сортировка.
Теперь у вас все ссылки распределены в алфавитном порядке. Отметьте все строки с внутренними ссылками (они у вас идут подряд, обведите до конца) и удалите их, нажав правой кнопкой мыши и выбрав Удалить. Если есть ссылки на различные сервисы шрифтов гугл или аватары, тоже можете удалить.
Удерживая клавишу CTRL отметьте все строки, в котором присутствует слово «redir», все они находятся в столбце F (Title). Это новые адреса старых ссылок, то есть тех, что изменили адрес. Чтобы вам стало белее понятнее, объясню детальнее… Xenu прошла по внешней ссылке, размещенной на вашем сайте. На внешнем ресурсе эта страница когда-то изменила свой адрес, поэтому с помощью редиректа открыла другую, то есть туже страницу, но с новым адресом. Xenu определила обе внешние ссылки, но вторую (новую) пометила как «redir». Чтобы не считать одну и туже ссылку с разными адресами, вам необходимо удалить все строки со словом «redir» в столбце «Title».
Также можете удалить все строки с URL-адресами на социальные сети. Так поисковики, вроде как, перестали их брать в счет, как внешние ссылки. А можете оставить, это уже вам решать. Если все лишние строки удалены, то смотрим сколько строк осталось у вас в таблице Эксель, вычитаем минус одну строку (шапку — название столбцов). Тем самым получаем количество исходящих внешних ссылок, например – 55.
Теперь вам необходимо посмотреть сколько статей у вас размещено (но правильно было бы считать проиндексированные поисковиком), например, 320 статей.
Чтобы посчитать заспамленность внешними ссылками, нам необходимо понять сколько процентов число X составляет от числа Y? Считаем по следующей формуле:
P = (X*100)/Y
Где, X – это количество внешних ссылок, Y – количество страниц со статьями, 100 – это 100% от числа Y, P – процент ссылок от Y.
Согласно нашим цифрам, которые мы указали выше в качестве примера, получается, что X = 55 (внешние ссылки), Y = 320 (статьи). А теперь считаем по формуле:
P = (55*100)/320, ответ получается 17,18% — заспамленность ссылками.
Хорошим показателем заспамленности ссылок является до 20%.
Файл Excel со всеми внешними ссылками можете сохранить себе, если потребуется. Вся процедура заняла у меня не больше 10 минут. Но главное 100% результат обнаружения всех исходящих ссылок.
С помощью программы Xenu можно не только посмотреть все внешние ссылки с сайта, но и обнаружить скрытые или битые. Если поиск на сайте не дал результата, по введенному внешнему домену, то скорее всего ссылка спрятана в плагине или шаблоне темы.