заработать биткоины на FreeBitco.in
размещение статей на сайте поможет заработать

Главная » Создание Wordpress блога » Продвижение (раскрутка) блога » Поисковые системы их роботы и пауки

Поисковые системы их роботы и пауки

поисковый роботКак правило, поисковая машина представляет собой сайт, специализирующийся на поиске информации, соответствующей критериям запроса пользователя. Основная задача таких сайтов заключается в упорядочивании и структурировании  информации в сети.

Большинство людей, пользуясь услугами поисковой системы, никогда не задаются вопросом как именно действует машина, отыскивая необходимую информацию из глубин Интернета.

Для рядового пользователя сети, само понятие принципов работы поисковых машин не является критичным, так как алгоритмы, которыми руководствуется система, способны удовлетворить запросы человека, который не знает как составлять оптимизированный запрос при поиске необходимой информации. Но для веб-разработчика и специалистов занимающихся оптимизацией сайтов, просто необходимо обладать, как минимум, начальными понятиями о структуре и принципах работы поисковых систем.

Каждая поисковая машина работает по точным алгоритмам, которые держатся под строжайшим секретом и известны лишь небольшому кругу сотрудников. Но при проектировании сайта или его оптимизации, обязательно нужно учитывать общие правила функционирования поисковых систем, которые рассматриваются в предлагаемой статье.

Невзирая на то, что каждая ПС имеет свою собственную структуру, после тщательного их изучения можно объединить в основные, обобщающие компоненты:

Модуль индексирования

Модуль индексирования — этот элемент включает три дополнительных компонента (программы-роботы):

1. Spider (робот-паук) — скачивает страницы, фильтрует текстовый поток извлекая из него все внутренние гиперссылки. Кроме того, Spider сохраняет дату скачивания и заголовок ответа сервера, а также URL — адрес страницы.

2. Crawler (ползающий робот-паук) — осуществляет анализ всех ссылок на странице, и на основе этого анализа, определяет какую страницу посещать, а какую не стоит. Таким же образом краулер находит новые ресурсы, которые должны быть обработаны ПС.

3. Indexer (Робот-индексатор) – занимается анализом скачанных пауком интернет-страниц. При этом сама страница разбивается на блоки и анализируется индексатором с помощью морфологических и лексических алгоритмов. Под разбор индексатора попадают различные части веб-страницы: заголовки, мета-теги, тексты и другая служебная информация.

Все документы, прошедшие обработку этим модулем, хранятся в базе данных поисковика, называемой индексом системы. Кроме самих документов, база данных содержит необходимые служебные данные – результат тщательной обработки этих документов, руководствуясь которыми, поисковая система выполняет запросы пользователя.

Поисковый сервер

Следующий, очень важный компонент системы – поисковый сервер, задача которого заключается в обработке запроса пользователя и генерации страницы результатов поиска.

Обрабатывая запрос пользователя, поисковый сервер рассчитывает рейтинг релевантности отобранных документов запросу пользователя. От этого рейтинга зависит позиция, которую займет веб-страница при выдаче поисковых результатов. Каждый документ, удовлетворяющий условиям поиска, отображается на странице выдачи результатов в виде сниппета.

Сниппет – это краткое описание страницы, включающее заголовок, ссылку, ключевые слова и краткую текстовую информацию. По сниппету пользователь может оценить релевантность отобранных поисковой машиной страниц своему запросу.

Важнейшим критерием, которым руководствуется поисковый сервер при ранжировании результатов запроса – является уже знакомый нам показатель тИЦ (тематический индекс цитирования).

Все описанные компоненты ПС требуют больших затрат и очень ресурсоемкие. Результативность поисковой системы напрямую зависит от эффективности взаимодействия этих компонентов.

 

На этом все. Если поделитесь своими  наблюдениями о ПС , буду очень признателен.
С огромным Уважением, Vladimir Zadorozhnyuk


6 комментариев к посту “Поисковые системы их роботы и пауки”

Прокомментировать (+)

  1. Hundley:

    Давно искала эту информацию, спасибо.

    Ответить
  2. Seabaugh109:

    Радует, что ваш блог постоянно развивается. Такие посты только прибавляют популярности.

    Ответить
  3. andrey16:

    Кое что понял. Вопрос, PR как-то зависит от ТИЦ?

    Ответить
    • Vladimir Zadorozhnyuk:

      Этот вопрос скорее к Гуглу или Яндексу. Я не сеошник, потому однозначно ответить не могу. В интернете есть сайты с PR 3 но ТИЦ у них нулевой. Эти показатели зависят от очень многих факторов, о влиянии которых, можно узнать только с помощью глубокого анализа подопытного сайта.

      Ответить
  4. Димон:

    Эти поисковики достали уже, постоянно какие-то приколы выкидывают, то панды, то агс, то под мобильники подстраивайся, то еще какую нибудь заподлянку придумают.Только успевай следить за всем этим. А когда с сайтом работать?

    Ответить
    • Vladimir Zadorozhnyuk:

      Увы, но правила игры они диктуют и здесь ничего не поделаешь. Но у нас всегда есть выбор, следовать этим правилам или нет.

      Ответить

Ваш комментарий (Спам не пройдет!!!)