| Редактор файлов robots.txt |
|
СССР |
|||
|
Протокол ограничения поисковых роботов (Robots Exclusion Protocol) - это метод, позволяющий администраторам веб-сайтов указывать поисковым роботам, посещающим сайт, какие части их сайтов индексировать нельзя. При заходе на ваш сайт поисковый робот загружает файл robots.txt, содержащий инструкции что нужно и что не нужно индексировать.
Это текстовый ASCII файл, лежащий в корневом каталоге сайта (например, если адрес вашего сайта http://www.yoursite.com/, то файл robots.txt должен находится по адресу http://www.yoursite.com/robots.txt, в любом другом каталоге робот его просто не увидит) и содержащий имена пользовательских агентов роботов и каталоги, которые упомянутым роботам запрещено индексировать. Причины для запрета могут быть разные - от административной части до приватных каталогов, содержащих ваши или клиентские документы, не предназначенные для просмотра посторонними. Также, проблемы может возникать у пользователей, у которых установлен Google Toolbar, который фиксирует страницы, которые вы посещаете и сообщает о них роботу Google. Так в рейтинге поисковой машины моут появлятся страницы, на которые не ссылается ни одна внешняя страница. Поэтому ключом к контролированию спайдеров является файл robots.txt. Если у вас большой веб-сайт или вы часто его обновляете, создавать и редактировать файл robots.txt будет тяжелым и скучным занятием. Файл можно создать, используя простой текстовый редактор, например notepad или wordpad, но очень сложно создать такой файл вручную, не допустив где-либо ошибок. Файл robots.txt состоит из записей. Каждая запись содержит два поля: строка пользовательского агента (User-agent) и строка запрета (Disallow). Так, запрет для индексации роботом Google содержимого папки cgi–bin будет выглядеть следующим образом:
User-agent: googlebot Использование символа "*" в поле пользовательского агента будет значить, что запрет распостраняется на всех роботов:
User-agent: * В данном случае индексация папки cgi-bin запрещена для всех роботов. Используя символ "*" можно запретить также индексацию определенного типа файлов по расширениям. Так следующая запись запрещает всем роботам индексацию файлов с расширениями .doc и .pdf:
User-Agent: * Запись, начинающаяся символом "#" будет интерпретироваться как комментарий: # Generated by Page Promoter (http://www.pagepromoter.com/) Редактор файлов Robots.txt это удобный визуальный редактор, который дает возможность назначать разные указания для выбранных поисковых роботов в специфических областях сайта и легко и быстро генерировать файл robots.txt. Модуле имеет две вкладки: Список спайдеров и Запретить. Список спайдеров
Если вы щелкнете правой кнопкой в окне спайдеров, появится следующее контекстное меню:
Выберите роботов, которым вы хотите запретить индексирования вашего сайта включив флажки напротив их имени и щелкнув кнопку Дальше > чтобы перейти на вкладку Запретить.
ЗапретитьНа вкладке Запретить можно выбрать файлы и папки вашего сайта, которые вы бы хотели оставить непроиндексированными.
Вкладка имеет два окна. В первом окне отображаются спайдеры, выбранные на вкладке Список спайдеров. Вы можете группировать их по стране размещения или по основному языку, выбрав соответственное значение в «выпадающем» меню Группировать по: В другом окне отображается структурный каталог вашего сайта. После первого запуска программы папкой сайта по умолчанию является папка, где установлена программа Page Promoter.
Чтобы указать программе расположение вашего сайта, нажмите
Если корневая папка сайта установлена правильно, вы увидите ее файловое и каталожное дерево. Можно развернуть узел каталога, нажав
Можно отменить выделение папок нажав Чтобы выбрать папки, которые вы хотите оставить непроиндексированными, сделайте следующее:
Внимание: если вы хотите применить одинаковые правила для всех роботов, убедитесь, что отмечен пункт *(All Spiders), в противном случае ограничения будут применены только для выбранного робота (то есть того, что отмечен курсором)
Можно запретить доступ к файлам определенного расширения. Нажмите
В появившемся окне отображается содержимое файла robot.txt. Если результат приемлемый, можно сохранить файл нажав
По материалам: http://www.netpromoter.ru |
|||
Быстрое сообщение
Комментарии (0)
| < Пред. | След. > |
|---|
радиоуправляемый вертолет Gyro 309 Санкт-Петербург
Получить высшее образование за рубежом пропуск в мировую элиту.
Добавить в закладки
RSS
Login



СССР







