Автор работы: Пользователь скрыл имя, 24 Апреля 2012 в 12:56, курсовая работа
Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это – «Яндекс», «Рамблер», «Апорт».
ВВЕДЕНИЕ
ГЛАВА 1. Поисковые системы: состав, функции, принцип работы
1.1 Понятие и функции поисковой системы
1.2 Краткая история развития поисковых систем
1.3 Состав и принципы работы поисковой системы
1.4 Модуль индексирования
1.5 База данных
1.6 Поисковый сервер
ГЛАВА 2. Что умеет Яndex
2.1 Возможности Яндекса
2.Результаты поиска
3.Поисковая форма
4.Найденный документ
2.5 Эпилог результатов поиска
Выводы
Заключение
Список литературы
СОДЕРЖАНИЕ
ВВЕДЕНИЕ…………………………………………………………
ГЛАВА
1. Поисковые системы:
состав, функции, принцип
работы………………………………………………………………
1.4
Модуль индексирования…………………..
1.5
База данных…………………….…………………………
1.6
Поисковый сервер……………………………………
2.1
Возможности Яндекса……………………………………………………………
2.5
Эпилог результатов
поиска……………………………………...…………………
Выводы…………………………………….………………………
Заключение……………………………………………………
Список
литературы……………………………………………………
ВВЕДЕНИЕ
Всемирная сеть очень важна
и полезна практически для
любого! Каждый пользователь Интернета
может найти в нем массу
разнообразной и интереснейшей
информации, а также использовать
все богатейшие возможности
Наиболее популярным и
Первоочередная задача любой
поисковой системы –
Получая результат,
ГЛАВА 1. Поисковые системы: состав, функции, принцип работы
Поисковая
система - это программно-аппаратный
комплекс, предназначенный для
Рассмотрим
подробнее понятие поискового запроса
на примере поисковой системы
«Яндекс». Поисковый запрос должен
быть сформулирован пользователем
в соответствии с тем, что он хочет
найти, максимально кратко и просто.
Допустим, мы хотим найти информацию
в «Яндексе» о том, как выбрать
автомобиль. Для этого, открываем
главную страницу «Яндекса», и вводим
текст поискового запроса «как выбрать
автомобиль». Далее, наша задача сводится
к тому, чтобы открыть предоставленные
по нашему запросу ссылки на источники
информации в Интернет. Однако, вполне
можно и не найти нужную нам
информацию. Если таковое произошло,
то либо нужно перефразировать свой
запрос, либо в базе поисковой системе
действительно нет никакой
Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.
Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?
Для
того, чтобы удовлетворить ответами
все эти вопросы, разработчики поисковых
машин постоянно совершенствуют
алгоритмы и принципы поиска, добавляют
новые функции и возможности,
всячески пытаются ускорить работу системы.
Основные характеристики поисковой системы
Опишем основные характеристики поисковых систем:
Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.
Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.
Актуальность
- не менее важная составляющая поиска,
которая характеризуется
Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.
Наглядность
представления результатов
В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.
Одним
из первых способов организации доступа
к информационным ресурсам сети стало
создание открытых каталогов сайтов,
ссылки на ресурсы в которых
Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.
Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.
В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!
В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.
В
настоящее время существуют три
основные международные поисковые
системы – Google, Yahoo и MSN, имеющих собственные
базы и алгоритмы поиска. Большинство
остальных поисковых систем (коих
насчитывается большое
В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».
Практически
все крупные поисковые системы
имеют свою собственную структуру,
отличную от других. Однако можно выделить
общие для всех поисковых машин
основные компоненты. Различия в структуре
могут быть лишь в виде реализации механизмов
взаимодействия этих компонентов.