Генератор robots.txt

Генератор robots.txt: проверьте SEO-сигналы и подготовьте следующие действия.

Запустите инструмент в браузере, получите структурированные результаты, риски и следующие шаги, затем передайте приоритеты в workflow Searvora.

Безопасные настройки по умолчаниюНастройка Allow и Disallow путейПоддержка директивы SitemapОпция Crawl-delay
Генератор robots.txt: проверьте SEO-сигналы и подготовьте следующие действия.
URL сайтаПравила ботовПути доступаПредпросмотр robots.txtПроверка внедрения

Входные данные

Используется для проверки главной страницы.
Используйте XML-карту сайта или индекс карт.
Выберите способ получения данных: URL, текст, вручную или карта сайта.
Имя краулера для проверок robots или индексации.
Опциональная задержка в секундах, от 1 до 60.

Результаты

Запустите инструмент, чтобы увидеть результаты анализа, экспорта и рекомендации здесь.

Что создает этот генератор

Читаемый проект файла на основе URL, карты сайта, имен ботов и правил. Мы выбираем простоту вместо сложных схем блокировки.

  • Создает блоки для общих или конкретных краулеров.
  • Добавляет ссылки на sitemap для упрощения индексации.
  • Соблюдает верный порядок директив allow/disallow.
  • Выдает готовый текст для копирования в файл.

Когда обновлять robots.txt

При запуске сайта, закрытии разделов от ботов, борьбе с мусорными страницами или фильтрами в интернет-магазинах.

  • Перед запуском новых доменов или поддоменов.
  • Если фильтры в каталоге создают бесконечные дубли.
  • Если в поиске мелькают ссылки на корзину или поиск.
  • При настройке доступа для новых ИИ-ботов.

Как понимать результат

Robots.txt — это просьба не заходить в раздел, а не запрет на показ в поиске. Запрещенный URL может попасть в индекс по внешним ссылкам.

  • Allow защищает важные страницы от широких запретов.
  • Disallow экономит краулинговый бюджет, убирая мусор.
  • Sitemap должен вести на актуальные рабочие файлы.
  • Crawl-delay используйте только при нагрузке на сервер.

Частые ошибки

Самое опасное — случайно закрыть весь сайт или стили/скрипты, нужные для рендеринга страниц. Одна опечатка может обрушить трафик.

  • Не прячьте в robots.txt личные данные — он публичен.
  • Не блокируйте CSS/JS, иначе Google не 'увидит' страницу корректно.
  • Не закрывайте страницы, на которых стоит noindex.
  • Не внедряйте сложные маски (*) без проверки на примерах.

Что делать дальше

Проверьте текст, протестируйте на важных URL и только потом заливайте на сервер. Лучший файл — самый простой.

  • Проверьте важные URL после деплоя тестером индексации.
  • Убедитесь, что ссылки на sitemap ведут на живые файлы.
  • Используйте Spider Analysis для поиска закрытых денег страниц.
  • Сохраняйте историю версий файла.
  • Ставьте задачи разработчикам с четким обоснованием изменений.
FAQ

Генератор robots.txt FAQ

Короткие ответы про планирование сканирования, проверку метаданных и передачу SEO-задач.

Удалит ли robots.txt страницу из Google?

Нет. Он запрещает вход боту. Чтобы убрать из индекса, используйте тег noindex на открытой для бота странице.

Нужно ли закрывать корзину и личный кабинет?

Да, для общих поисковиков это стандарт. Главное — не задеть при этом разделы с товарами или статьями.

Обязательна ли ссылка на Sitemap?

Очень полезна. Она помогает ботам находить карты сайта автоматически, особенно если их несколько.

Полезен ли Crawl-delay?

Только если сайт 'ложится' под ботами. Крупные поисковики часто игнорируют этот параметр.