Первые шаги в оптимизации сайта
 
  На Главную
   
  МЕДИЦИНА
  Alma Mater - 1ММA
  Лагерь "Сеченовец"
  Новости медицины
  Новости фармации
  Роды и беременность
  Аборт без операции
   
  ФАРМАЦИЯ
  поиск лекарств
  Интернет-аптека
  фальшивые лекарства
  льготные лекарства
  поставщики
  тендер
  забраковка
   
  ГОРОСКОП
  Зодиакальный
  Восточный
  Совместимость
   
  СОННИК
   
  DOWNLOADS
  Screensavers
  Скачать программы
  программы
  Web мастеру             
  Лучшие программы
   
  КАРАОКЕ
  скачать песни
  скачать плееры
   
  МУЗЫКА MUSIK
  Скачать клипы
  скачать МР3
  Emma Shapplin
  Sarah Brightman
  Rammstein
  Gregorian
  Queen
  ABBA
  Мобильники
  Мелодии для
  мобильников
   
  ЖИВОПИСЬ
  Art gallery
  продажа картин
  hentai
   
  ПОЭЗИЯ
  Поздравительные
  стихи
   
  Туризм
  Отдых во Франции
  Путевые заметки
  Истрия Хорватия  
  Горящие туры
   
  Гостевая книга
   
  Обратная связь
   
  Рекламодателям
   
  Обмен ссылками
   
  ФОРУМ

 

Раскрутка сайта (часть V)

  

  ВИДЕО  Video
   
  видео клипы
  видео приколы
  мультфильмы
  Home video
  ПРИКОЛЫ   Jokes
  Flash приколы
  фотоприколы
  на рабочий стол
  Игры  Games
  Классические
  Логические
  Эротические
  Спортивные
  Yetisports
  Квесты
  Драки
  Игры для PC
  Обои Wallpapers
  спортсмены
  знаменитостей
  артистов
  кинозвезд
  фотомоделей
  эротические
   
 
  Кино  Cinema
  Аngelina Jolie
  Monica Bellucci
  Sharon Stoun
  Mila Yovovich
  Том Cruse
  Liv Tayler
  Leticia Casta
  Alien Delon
  George Cluneу
  Jodie Foster
  Премия Оскар
  Новые фильмы
  Биографии
  Фото кинозвезд
   
  Scandal foto
  Monica Bellucci
  Мария Шарапова
  Жанна Фриске
  Светлана Хоркина
  Alina Kabaeva
  Мария Бутырская
  Ксения Собчак
   
  ФОТО Foto
  Фотоконкурс
  Erotic foto
  Art Gallery
   
  ОТКРЫТКИ
  анимационные
  Flash открытки
  Валентинки
  Новогодние
  Новые Flash
   
  Фарм-форум
   
  Авторы
   
  ЧАТ
   
  LiveJornal
   
  На Главную
 

 Первые шаги в оптимизации сайта

 Что сделать в первую очередь и как

 

Что такое robots.txt и для чего он нужен

Файл robots.txt размещается в корневой директории сайта и описывает исключения для поисковых ботов. Придерживающийся стандартов бот проверяет сначала url "/robots.txt", если файл существует, то бот анализирует его содержимое на предмет наличия запретов к посещению определённых частей сайта. Имя файла не должно содержать заглавных букв. Записи в файле разделяются одной или несколькими пустыми строками. Комментарии в файле robots.txt начинаются знаком “#” и заканчиваются окончанием строки (строки, содержащие только комментарии игнорируются ботами и не являются разделителями записей).

User-agent
Имя бота, к которому применяются правила исключений на сайте. Можно прописать несколько строк с User-agent, в этом случае правила, описанные в данной записи будут применяться указанными ботами. Для описывания правил ботам, для которых отдельная запись не составлена применяют следующий параметр: «*» (в файле robots.txt может быть только одна запись User-agent: *).

Disallow
В данном поле прописывается полный или частичный путь к месту на сайте, посещение которого запрещено для бота. В каждой записи должно присутствовать как минимум одно поле Disallow. Пустое поле Disallow подразумевает разрешение боту посещать все директории и файлы сайта. Не допускается использование в данном поле регулярных выражений и символов подстановки.


Примеры для http://site.ru/
(Показывает как можно сочетать директивы в файле robots.txt но не несущий смысловой нагрузки)

CODE
User-agent: Yandex
Disallow: /test/
Disallow: /print.html
# Запрещает ботам Яндекса посещать папку http://site.ru/test/
# и файл http://site.ru/print.html

User-agent: Aport
User-agent: Googlebot
Disallow: /temp/img/
# Запрещает посещение ботами Google и Апорт http://site.ru/temp/img/

User-agent: StackRambler
Disallow:
# Для бота поисковой системы Рамблер разрешено посещение всех
# страниц и папок сайта

User-Agent: *
Disallow: /lesson.php?action=test
# Запрещает посещение всеми ботами, для которых не сделана
#отдельная запись,
# динамических страниц, начинающихся с http://site.ru/lesson.php?action=test
# например: http://site.ru/lesson.php?action=test&id=13
# чувствительно к порядку переменных в ссылке


Некоторые поисковые системы поддерживают дополнительные поля в файле robots.txt. Яндексом поддерживается директива Host, служащая для назначения основного зеркала:

CODE
User-agent: Yandex
Disallow: /test/
Host: site.ru
# разрешено посещение всех страниц и папок на сайте, кроме http://site.ru/test/
# основным зеркалом назначено http://site.ru/

User-agent: *
Disallow:
# всем ботам, кроме бота Яндекса, разрешено посещение всех страниц и
# папок на сайте


Запретить сайт к индексации полностью можно с помощью такого файла robots.txt

CODE
User-agent: *
Disallow: /


Наиболее актуальные для Рунета, на мой взгляд, боты:
(думаю, даже расшифровывать не требуется)
Yandex
Googlebot
StackRambler
Aport



Рекомендации по запрету к индексации
Что не следует указывать в файле robots.txt:
- папки с административными файлами
- файлы, о которых посторонним вообще знать не стоит
Прописывание путей к данным частям сайта может породить нездоровый интерес и попытки совершения зловредных действий, рады которым Вы уж точно не будете. К тому же есть и альтернативные способы запрета посещения и индексации ботами страниц.

Стоит запретить к индексации:
- документы "для печати"
- папки со скриптами
- папки с картинками (если у Вас не предвидится целевой аудитории с поиска по картинкам)
- сервисные страницы, такие как, например, страница с формой отправки письма администрации, схема проезда

Ошибки, допускаемые при составлении robots.txt
Как не надо делать:
Имя файла содержит заглавные буквы – Robots.txt или ROBOTS.TXT
Файл robots.txt размещается не в корневой директории
Пустая строка после поля User-agent
Отсутствие директивы Disallow
Использование в поле Disallow символов подстановки или регулярных выражений, например: "?", "*"
Больше одной строки "Disallow: *"


Пример ничего не запрещающего robots.txt
(основное зеркало site.ru)

CODE
User-agent: *
Disallow:

User-agent: Yandex
Disallow:
Host: site.ru


http://mastertalk.ru/topic6726.html

Раскрутка сайта (часть I)

Поисковые системы, ключевые слова, оптимизация сайта

Раскрутка сайта (часть II)

Раскрутка сайта. Как обойти конкурентов?

Раскрутка сайта (часть III)

Site Auditor - программа для поисковой оптимизации

Раскрутка сайта (часть IV)

Что сделать в первую очередь и как

Раскрутка сайта (часть V)

Что такое robots.txt и для чего он нужен

Интернет безопасность -  обзор программ - взломщиков

Банки в которых можно обналичить чеки Google на инкассо