Вы здесь:
 
 
 
 
 
 

Как работают поисковые системы

Twitter
Нравится

В современном мире, чтобы узнать какие в ближайшее время будут выставки в москве не нужно никуда идти или звонить. Достаточно внести в поисковую систему необходимый запрос и через пару секунд можно узнать всю необходимую информацию без особых усилий и траты времени.

Каким же образом работают поисковые системы, выдавая нужную информацию? Поисковая система условно делится на два этапа: индексация сайта, и выдача сайта по запросу пользователя. Сбор информации и индексация сайта происходит следующим образом: когда пользователь вводит в поисковую систему запрос, он тем самым уже заявляет о существовании нового сайта. Поисковая система, узнав о новом ресурсе, индексирует сайт и заносит в свою базу данных, придерживаясь специального формата. Чтобы проиндексировать сайт, на него заходит программа робот, которая осмотрит все страницы, как обычный пользователь.

Существует ещё один способ, с помощью которого поисковая система узнаёт о сайте. На каком-то интернет-ресурсе есть ссылка на новый сайт. После того, как поисковой системе сообщили о существовании нового ресурса, до его выдачи в системе, как правило, проходит 2-3 недели.

Для того чтобы поисковая система выдавала сайт согласно релевантности, например, если посетитель задаёт запрос «афиша москва», система поиска ищет все сайты, которые подходят по данному запросу. Найденные сайты расставляются по релевантности, которая определяется в соответствии со следующими критериями: если сайт, по мнению системы поиска, имеет существенное значение по заданному запросу; если запрос фигурирует в тексте сайта; если такой запрос есть в ссылках на других сайтах.

Система поиска работает благодаря нескольким основным составляющим. Страницы в сетке скачивает браузерная программа под названием «паук». Существует также «путешествующий» паук, основной функцией которого является автоматическое разделение страницы на составляющие и переход по ссылкам на другие сайты. Программа-индексатор способна провести анализ наполнения веб-страницы. В базе данных хранятся скачиваемые страницы. И последним звеном является система выдачи результатов, извлекающая из базы данных хранящиеся ссылки и сайты.

Комментарии:

Добавить комментарий


Защитный код
Обновить

 
 
 
 
 
 
-