Обещанного неделями ждут :) А я все же закончу тему, начатую в посте про избежание дублирования материалов в WordPress.

Итак, вот типовое содержимое моего файла robots.txt для WordPress, который позволяет:

  1. пресечь индексирование поисковиками служебных файлов и папок вордпресса
  2. предохраниться от дублирования содержимого (ну не люблю я эту кальку “контент” ;) )

User-agent: *
Allow: /*
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /feed
Disallow: /comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /*?*
Disallow: /*?
Allow: /wp-content/uploads

Пределов совершенству нет, о чем, я не сомневаюсь, вы поведаете в комментариях :)

С праздником крещения Христова!


  1. Александр@WP-web

    кстати совсем недавно узнал, что по правильному файл robots.txt должен быть один на сайт и располагаться только в его корне. это так - заметка на полях.

  2. mekal

    http://robotstxt.org.ru/ пишет что параметра Allow в роботсе быть не может, так как роботс.тхт ничего не может разрешать, он может только запрещать

  3. Brando

    mekal
    ну вообще-то так и есть, а чт овас удивляет? Наверное автор специально выделил параметром Allow то что должен индексить бот, хоть это и не обязательно :)

  4. Domus

    что параметра Allow в роботсе быть не может

    А как тогда правильно?

  5. Александр@WP-web

    Совершенно верно: Allow в robots.txt не нужен. Вместо этого просто ничего не ставится, или идет пустая строка с
    Disallow:

    Всем спасибо - вот она сила коллективного веб авторства ака разума! :)

    а тут генератор robots.txt на EN

  6. Беганский Павел

    вот блин, а я постоянно allow’s прописывал :)))

  7. Truper

    Как можно легко управлять robots.txt в wordpress написанно здесь

  8. Truper

    Всегда пожалуйста, если нужна кака-нибудь информация по Wordpress ищите на моем сайте, или задавайте вопросы через форму обратной связи (там же) …. вот какая самореклама вышла …

  9. Stanislav

    Поставил себе вот этот плагин KB Robots.txt

    С ним можно редактировать robots.txt из админки :)

  10. Kolia Shlapak

    А что значат последние строки со знаками вопроса?

  11. Александр

    Это результаты поиска.

  12. Kolia Shlapak

    поиска по блогу? спасибо за ответ!

  13. Александр

    Да, по блогу.

  14. Kolia Shlapak

    спасибо)
    а ещё я видел такие строчки
    Disallow: /wp-register.php
    Disallow: /xmlrpc.php
    как думаете надо?

  15. Александр

    я не использую.

  16. Александр

    Кстати, по аналогии с роботс по умолчанию друпала можно и эти файлы закрыть.

постоянный адрес prodvinutyj-robotstxt-dlya-wordpress