Отечественные и зарубежные поисковые системы

Автор работы: Пользователь скрыл имя, 28 Марта 2012 в 22:49, реферат

Описание

Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса. Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу).

Содержание

Содержание
Введение
Отечественные поисковые системы.
Яндекс
Рамблер
Апорт
Зарубежные поисковые системы
Google
MSN
Заключение

Работа состоит из  1 файл

ИТ в образовании поисковики.doc

— 1.03 Мб (Скачать документ)

При желании вы можете сами руководить действиями поисковой системы. Для этого существует расширенный поиск и язык запросов, который состоит из команд-операторов. С помощью языка запросов вы можете дать поиску дополнительные указания, что и где нужно искать.

 

Рамблер

Поисковая систем Рамблер уже давно превратилась в мега-портал и имеет очень большой набор сервисов. По данным SpyLog на Рамблер приходится около 20-25% поисковых запросов в Рунете.

При поиске Рамблер учитывает морфологию русского языка. Данная поисковая машина, как и многие другие, имеет расширенный поиск, что дает возможность задавать дополнительные параметры поиска. Так же имеется язык поисковых запросов. Регистр поисковых запросов учитывается лишь в некоторых случаях. Для поиска цитат можно использовать двойные кавычки. По каждому слову запроса поиск ведется с учетом правил словоизменения соответствующего языка. Рамблер понимает и различает слова русского и английского языков - по умолчанию, поиск ведется по всем формам слова. Имеются специальные операторы которые позволяют искать страницы, на которых размещены счетчики Top100, TopShop, TopList, SpyLog, а также HotLog. В помощи Рамблера вы сможете найти подробное описание языка запросов и расширенного поиска.

Пользователям поисковой системы Рамблер доступен новый механизм ассоциаций. Набрав в поисковой строке нужное слово, вы кликаете на окно "найти". Открывается так называемая ответная страница, в которой найденные документы расположены в порядке убывания релевантности (соответствия запросу). На этой же странице в самом низу - строка "У нас также ищут". В ней приведено несколько слов и словосочетаний, тематически (ассоциативно) связанных с вашим исходным запросом.

Паук-робот Рамблера (называется StackRambler) довольно медлительный робот, ускорить движения этого робота по сайту возможно участием в ТОП100 Рамблер.

 

 

 

 

 

 

 

Апорт

Поисковая система Апорт является одной из популярных поисковых машин российского Интернета. Апорт позволяет пользователям осуществлять полнотекстовый поиск документов c учетом морфологии русского языка в запросах. Поисковая система построена на основании новейших достижений в области информационного поиска и использует уникальные алгоритмы сортировки найденных результатов. Техническая база и программное обеспечение Апорта постоянно совершенствуются, что ведет к наращиванию объема поисковой базы и обеспечению высокой частоты индексации русскоязычных ресурсов Интернета. Разнообразные специализированные поиски дают пользователям дополнительные возможности находить различную информацию в Сети. В поисковую машину интегрирован один из крупнейших в Рунете каталогов интернет-ресурсов "Апорт.Каталог".

Критерии ранжирования
Апорт применяет следующие критерии при ранжировании документов:

       частота и взаимное расположение слов запроса в тексте документа;

       размер документа;

       присутствие и взаимное расположение слов запроса в выделенном (размером шрифта или html-тегами <b>, <strong>, <h1>...<h6>) тексте;

       присутствие и расположение слов запроса в заголовке документа;

       присутствие и расположение слов запроса в мета-тегах "keywords" и "description";

       присутствие и расположение слов запроса в ссылках на ранжируемый документ и авторитетность этих ссылок;

       присутствие и взаимное расположение слов запроса в названии и описании сайта в каталоге Апорта (учитывается при вычислении веса главной страницы сайта);

       взвешенный индекс цитирования документа;

       количество страниц сайта, имеющих высокую релевантность запросу.

       Результирующий вес документа рассчитывается по специальному алгоритму, различным образом учитывающему сочетания разных критериев. 

 

Зарубежные поисковые системы

Google

Google (от Googol – число со ста нулями после единицы) – одна из самых популярных во всем мире поисковых машин. Google обеспечивает поиск по гипертекстовым документам, находящихся в любых языковых зонах - английской, русской, украинской, немецкой и др. Поисковая система Google имеет собственные поддомены для большинства стран, например, для России. Google ищет не только гипертекстовые файлы (html), но и файлы в формате PDF, DOC, PostScript, Corel WordPerfect и др.

Поисковая система Google обладает очень качественным поисковым "движком". Правильность выдачи результатов поиска в Google часто превышает качество выдачи результатов поиска у русских поисковых систем, например, у Яндекса. Именно поэтому все больше пользователей начинают переходить на Google. В своей системе Google использует механизм PageRank, изменяющий "важность" сайта при выдаче результатов поиска. PageRank зависит от количества и качества ссылок на ресурс (т. е. почти то же самое, что и индекс цитирования у Яндекса). Но в отличие от Яндекса, влияние PageRank у Google не настолько значительно, поэтому люди в Google находят именно то, что и ищут.

Все страницы Google кэширует (заносит в свою базу) и разрешает человеку, производящему поиск, смотреть документ, не открывая его в первоисточнике, а беря из кэша Google (что часто намного быстрее). Google - одна из немногих поисковых систем, которая полностью индексирует все страницы, а не только самые главные.

Поисковая система Google обладает также возможностью поиска изображений. Количество изображений огромно, потому что Google индексирует большинство сайтов в мире. Строку поиска в Google можно также использовать и как калькулятор. Google разрешает настроить каждому пользователю язык интерфейса поисковой машины, выбрать языковые зоны для поиска, количество сообщений при выдаче результатов и др.

Пользователи Microsoft Internet Explorer могут установить себе программу Google Toolbar, которая создает новую панель инструментов, позволяющую искать в Google, не заходя на сам сайт. Пользователи браузеров Opera и Firefox уже имеют подобную встроенную панель.

MSN

MSN search поддерживается Microsoft и размещается по адресу http:/ /search.msn.com. Эта поисковая система не имеет собственного паука (поискового робота) или каталога, она использует данные из Inktomi, LookSmart, Direct Hit. MSN особенно важна т.к. именно эта поисковая система по умолчанию используется, когда пользователи Internet Explorer(а) вводят в адресную строку поисковый запрос. MSN также является информационным узлом, и по данным MediaMetrix, является одним из наиболее посещаемых сайтов. 

MSN использует базу данных Inktomi, имя ее паука: Slurp, но эта база данных сейчас содержит более более 550 миллионов URL и не известно, какую часть использует MSN. Известно, что из базы данных LookSmart используется около 2 миллионов URL. MSN локализована примерно для 30 стран, таких как: Великобритания, Дания, Бельгия, Новая Зеландия, Япония и др. 

Алгоритм ранжирования результатов

Т.к. MSN использует внешние данные для обработки поисковых запросов, то можно выделить наиболее влияющие на релевантность факторы:

       Расположение ключевых слов

       Click Popularity (популярность ресурса)

       Текст ведущих на сайт, и ведущих с сайта сылок.

MSN предоставляет пользователям возможность сортировать результаты поиска: по дате, по алфавиту, по релевантности. Настроить эти опции можно в разделе Advanced.
Партнеры MSN Search: 
- LookSmart
- DirectHit
- Inktomi. 
Также имеется договоренность с RealNames, относительно ключевых слов. Т.е. если пользователь делает поисковый запрос в Internet Expolrer и в запросе содержится ключевое слово RealNames, то пользователь будет автоматически напрален на соответствующий сайт. Результатов поиска от RealNames в MSN Search, кажется не видно. 

 

Заключение

Теперь подытожим все вышесказанное. Поисковая система – необычайно сложная и закрытая структура. Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. Поисковик проводит поиск по своей базе и выдает страницы в порядке их релевантности запросу, то есть соответствия. Если пользователь ввел несколько слов, то чем ближе те слова будут друг к другу в тексте, тем релевантнее будет страница, она больше подходит к запросу.

На сегодняшний день, самой большой популярностью пользуются две поисковые системы: yandex.ru и google.com. Я же сделала свой выбор в пользу самой популярной в мире поисковой системы, Google.

11



Информация о работе Отечественные и зарубежные поисковые системы