Автоматическое удаление непроиндексированных Яндексом страниц из Sape

Filed Under (Контекстная реклама) by admin on 22-04-2008

Уже ни для кого не секрет, что продавая ссылки с внутренних страниц своих сайтов через Sape можно неплохо заработать. Некоторые товарищи пишут, что уже покупают себе квартиры. Я же пока на квартиру не заработал :-), но этот доход ежедневно растет.

Итак, теперь о моем способе удаления непроиндексированных страниц. Дело в том, что в Сапе принимают только проиндексированные Яндексом страницы, в отличие от того же Ксапа. Причем сайт может быть хорошо проиндексирован Яндексом, но робот Сапе все равно индексирует его по своему. Например, 1200 страниц одного из моих сайтов проиндексировано Яндексом.

Но при добавлении сайта в Сапе их робот "насчитал" только 650 страниц. Модератор сайт отклонил, т.к. не все страницы, проиндексированные роботом Сапе, есть в индексе Яндекса. нам нужно эти страницы удалить. Описанная ниже технология сэкономила 4-5 часов моего времени, которые я бы потратил на ручное удаление непроиндексированных ссылок. Итак, что мы делаем:

1. Качаем эту программку для проверки индексации сайтов и страниц в Яндексе
2. Экспортируем из Сапе (ссылочка внизу странички) все страницы сайта, найденные саповским роботом в txt.
3. Копируем ссылки в программку и нажимаем кнопку "Проверить". (Только не переусердствуйте! Создатели тулзы честно предупреждают, что ее использование нарушает лицензию Яндекса, который разрешает автоматизированные запросы такого рода только через XML и ваш айпишник теоретически могут забанить. Хотя я проверил 2500 страничек с нескольких сайтов за час (делал перерывы по 15 минут между каждым сайтом) и все было ок. Все же советую установить в программе задержку между запросами, благо она позволяет это сделать)
4. Копируем полученный результат назад в Excel и сортируем данные по второму столбику.
5. Загружаем Internet Explorer (в Firefox не работает, в Опере не проверял). Копируем те ссылки возле которых стоит 0 или вообще ничего не стоит из Excel в Сапе. Копируем в поле, над которым написано "Введите УРЛы страниц (с новой строки, с http://):" и нажимаем ОК. При этом, все ссылочки, которых нет в индексе Яндекса оказываются отмеченными.
6. Выбираем "Удалить страницы до переиндексации" и ждем принятия сайта модератором!

По материалам http://homelessminsk.blogspot.com/

Comments:

Post a comment