Пошукові системи

Автор работы: Пользователь скрыл имя, 16 Декабря 2012 в 17:23, реферат

Описание

Мета визначає характеристики об'єктів пошуку, об'єм і терміни виконання роботи, перелік засобів пошуку і способи їх застосування.
Як об'єкт пошуку може розглядатися будь-яка інформація, якщо є можливість представлення її в Internet, що стосується заданої теми.

Содержание

Вступ
1. Загальне поняття про пошукові системи. Методи пошуку інформації в Інтернеті
2. ОПИС ПОШУКОВИХ СИСТЕМ
3. УКРАЇНСЬКІ ПОШУКОВІ СИСТЕМИ
Висновок
Список використаних джерел

Работа состоит из  1 файл

реферат.doc

— 123.50 Кб (Скачать документ)

МІНІСТЕРСТВО ОСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ

ДВНЗ «КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ»

імені Вадима Гетьмана

 

 

 

 

 

 

 

 

Реферат

З дисципліни: «Інтернет  технології у бізнесі»

На тему: Пошукові системи

 

 

 

 

Виконала:

Студентка ІІ курсу

6508 12 групи

Філімонова Валентина

 

Перевірив:

ас. Бойко А.С

 

 

 

 

Київ

2012

 

Вступ

 

1. Загальне поняття про пошукові системи. Методи пошуку інформації в Інтернеті

2. ОПИС ПОШУКОВИХ СИСТЕМ

3. УКРАЇНСЬКІ ПОШУКОВІ СИСТЕМИ

 

Висновок

Список використаних джерел

 

Вступ

 

Основна мета користувача  при роботі з мережею Internet – це отримання інформації, оскільки в першу чергу Internet є гігантським інформаційним ресурсом.

Завдання пошуку інформації в умовах стрімкого розвитку і  постійної зміни мережі і її інформаційного наповнення є нетривіальним!

Випадково знайти потрібну адресу в мережі можна різними способами: просто подорожуючи по вузлах, дізнатися у знайомих, побачити в рекламі і т.д. Цілеспрямований пошук явно або неявно вимагає формулювання мети пошуку, розуміння того, що є об'єктом пошуку, обґрунтованого вибору засобу пошуку і ефективної методики.

Мета визначає характеристики об'єктів пошуку, об'єм і терміни  виконання роботи, перелік засобів  пошуку і способи їх застосування.

Як об'єкт пошуку може розглядатися будь-яка інформація, якщо є можливість представлення  її в Internet, що стосується заданої теми.

Як ключові слова  в запиті використовувалися якомога  точніші слова або словосполучення, які найповніше характеризують об'єкт  пошуку.

 

1. Загальне поняття  про пошукові системи. Методи  пошуку інформації в Інтернеті

Загальні вимоги при застосуванні пошукових систем

На сьогоднішній день" всесвітнє павутиння" включає  декілька десятків (по різним оцінкам  – від 50 до 80) мільйонів серверів, на кожному з яких доступно від  декількох мегабайт до десятків гігабайт інформації. Як уже відзначалося (див. заняття 8), для пошуку незліченної інформації в Інтернеті на допомогу приходять тематичні та індексні пошукові системи.

Типовий приклад тематичного  каталогу – пошукова система Yahoo (http://www.yahoo.com). Це спеціалізований сервер WWW, на якому зберігаються списки інших серверів з їх стислими описами. Інформація згрупована за смисловими категоріями і має ієрархічну структуру; наприклад, на цьому сервері можна знайти розділи "Комп'ютери та Інтернет-мультимедіа - Журнали", "Розваги - Музика - Групи і виконавці - Елтон Джон", "Країни - Україна - Бізнес в Україні", а також безліч інших. Передбачена на сервері система шукає дані тільки в каталозі Yahoo і не заглядає на сторінки згаданих в ньому серверів. Користуватися такою системою (а також будь-якою іншою, аналогічною їй, наприклад, списком російських серверів WWW за адресою http://www.ru) надзвичайно просто. Треба знайти потрібний розділ і після цього – підходящий сервер за його стислим описом, наведеним там же. Такі каталоги мають недоліки: низька оперативність зміни інформації, відносна складність пошуку (за стислою та інколи помилковою адресою сервера), порівняно невелика "область охоплення" простору WWW[7].

Існує більш зручний і ефективний засіб пошуку необхідних відомостей. Це так звані індексні пошукові системи (пошукові механізми - search engines). Основою їх є спеціалізовані комп'ютери, що періодичні проводять індексацію документів на серверах "всесвітнього павутиння", і дозволяють шукати інформацію на цих серверах за одним або кількома ключовими словами і, можливо, за деякими додатковими ознаками.

До кінця 1997 г. в мережі Інтернет налічувалося близько двох тисяч різноманітних пошукових  серверів, які відрізняються один від одного типом, спеціалізацією, сферою охоплення (кількістю індексованих сторінок) і популярністю. Більша частина цих серверів має порівняно вузьку спеціалізацію – наприклад, пошук музики в форматі МР3 або пошук інформації на серверах у галузі молекулярної хімії. Існує декілька надзвичайно популярних універсальних пошукових серверів, призначених для пошуку за ключовими словами на якомога більшому числі сторінок системи WWW. Найбільш відомими є сервери AltaVista (http://altavista.digital/com), InfoSeek (http://www.infoseek.com), Excite (http://www.excite.com), HotBot (http://www.hotbot.com), Lycos (http://www. lycos. com).

Принцип дії більшості таких серверів простий. Для пошуку інформації використовується індекс, створений спеціальною програмою-роботом. Програма-робот періодично обходить відомі їй адреси мережі, зчитує з них сторінки, що зберігаються WWW, індексує всі слова з усіх сторінок (разом з адресами URL) і розміщує їх в загальний індекс. Для зберігання цього індексу потрібен величезний обсяг пам'яті, а для його обробки – чимала обчислювальна потужність. Наприклад, основний механізм одного з найпотужніших пошукових серверів AltaVista (повного індексу, що претендує на всю мережу Інтернет), включає 16 потужних комп'ютерів Alpha Server 8400 5/440. На кожному з цих комп'ютерів встановлено по 12 центральних процесорів, 8 гігабайт оперативної пам'яті (обсяг, еквівалентний обсягу пам'яті 500 стандартних сучасних персональних комп'ютерів) і дисковий масив RAID ємкістю 300 гігабайт. Вся ця система з'єднана з магістральною мережею Інтернет каналом зв'язку з пропускною спроможністю 100 Мбіт/с. Загальний обсяг на сервері індексних файлів, що зберігаються, в яких виробляється пошук, – понад 200 гігабайт.

Ще одна категорія  пошукових серверів – так звані "метапошукові" сервери (метасервери). Найбільш відомий з них – WebCrawler (http://www.webcrawler.com). Сервери такого типу передають отриманий від користувача запит на пошук інформації іншим пошуковим серверам, об'єднують результати пошуків і повертають результат користувачу. Застосування подібних серверів має як переваги, так і недоліки. Найцінніша перевага полягає в економії часу на однотипових запитах до різноманітних серверів. Проте, позначки в синтаксисі запитів змушують користувачів метасерверів дотримуватися найзагальнішої форми запиту, без можливості вдаватися до потужніших засобів пошуку. Незважаючи на це, метасервери – непоганий засіб оперативної оцінки того, наскільки широко представлена в системі WWW та чи інша інформація.

Підвищення ефективності пошуку інформаційних  ресурсів Інтернету

Передусім треба пам'ятати, що складання запитів на пошук інформації – це свого роду мистецтво. Ідеальний запит видасть користувачу посилання тільки на ті сторінки, що йому потрібні. Просто грамотний запит може видати користувачеві кілька десятків сторінок, пошук серед яких виявиться не таким уже й складним.

Користувачу слід мати на увазі, що жодна пошукова система  не в стані повністю індексувати  всі сторінки і документи на всіх серверах Інтернету. Кожний пошуковий  сервер проводить відбір і індексування сторінок за своїми власними правилами.

В ефективному пошуку інформаційних ресурсів Інтернету  допомагають декілька правил.

1. Грамотне використання  можливостей одного пошукового  сервера може бути ефективніше,  ніж звернення з тим самим  запитом до великої кількості  серверів.

Коли користувач вперше потрапляє на сторінки незнайомого пошукового сервера, слід в першу чергу прочитати його опис і правила користування, а також вивчити засоби і можливості пошуку. Однак не слід захоплюватися вивченням пошукових серверів; після деякої практики з'являються 2-3 улюблені сервери, що найповніше індексують сферу в Інтернеті, яка цікавить користувача.

2. У запиті слід  використовувати ті слова, що  точніше за все характеризують  тему, яка цікавить користувача.

Вибір слів може ґрунтуватися на двох різних підходах:

- можна почати із загального запиту і поступово його конкретизувати, спостерігаючи за зміною результатів пошуку;

- можна почати з  конкретного запиту і поступово  його поширювати, відштовхуючись  від найбільш важливих і специфічних  слів.

3. Для більшості пошукових серверів має значення послідовність слів у запиті, тому найбільш важливі і характерні терміни треба розміщувати на початку запиту і додавати до них менш значущі терміни.

4. Фрази і словосполучення слід  брати в лапки, оскільки в  противному разі вони будуть сприйняті пошуковим сервером просто як набір ключових слів.

5. У запиті можна зазначати  одне або кілька власних імен.

6. Рекомендується вживати синоніми  – їх використання дозволяє  не тільки поширити діапазон  пошуку, а й надає більше ваги  власне смисловій частині запиту.

7. Не рекомендується користуватися  поширеними словами типу "комп'ютер", "інформація", "дані" тощо.

8. Багато пошукових систем припускають  можливість використання в запитах  логічних операторів "І" (AND), "або" (OR), "не" (NOT). Їх грамотне використання дозволяє зробити пошук надзвичайно точним і направити його саме туди, куди потрібно.

9. Якщо серед перших 20-30 посилань, отриманих від пошукового сервера,  немає потрібного посилання, слід  подумати про те, щоб радикально  змінити набір ключових слів або скористатися іншим сервером.

10. Слід пам'ятати, що WWW-сторінка, на яку користувач потрапляє  при першому підключенні до  пошукової системи, найчастіше  являє собою спрощений бланк  запиту на пошук інформації. Щоб  отримати доступ до найбільш  потужних засобів опису, треба перейти на сторінку ускладненого пошуку (Advanced Search).

 

2. ОПИС ЗАРУБІЖНИХ ПОШУКОВИХ  СИСТЕМ

Більше як 80% всього пошуку в Інтернеті доводитися на 3 основні  системи: Google, Yahoo!, MSN.

 

 

GOOGLE - http://www.google.com

З невеликої компанії, яка заснована у вересні 1998 року Ларрі Пейджем і Сергієм Бріном, Google перетворилася на найбільший галузевий концерн, що пропонує послуги простого і швидкого пошуку інформації в Інтернеті по більш ніж 8 млрд. мережних адрес, плюс множина інших, не менш цікавих сервісів.

ПЕРЕВАГИ

  • Використання механізму PageRank, який відображає "важливість" сайту і впливає на видачу результатів пошуку. PageRank схожий на індекс цитування у Яндекса (теж залежить від кількості і якості посилань на ресурс). Але на відміну від Яндекса, вплив PageRank у Google не настільки значний, тому люди в Google знаходять саме те, що і шукають.
  • Google шукає не лише гіпертекстові файли (html), але і файли у форматі PDF, DOC, PostScript, Corel Word Perfect і ін.
  • Пошукова система Google має можливість пошуку зображень. При цьому у запиті можна вказати бажаний розмір, глибину кольору, формат файлу.
  • На відміну від багатьох пошуковиків, роботи Google індексують всі сторінки, а не лише найголовніші.
  • Всі сторінки Google кешує (заносить в свою базу), і дозволяє користувачеві переглядати документ у кеші Google, не відкриваючи його в першоджерелі (що зазвичай є набагато швидше).
  • Google дозволяє обрати мову інтерфейсу, мовні зони для пошуку, кількість повідомлень при видачі результатів та ін.
  • Користувачі Microsoft Internet Explorer, Mozilla Firefox і Opera можуть встановити собі програму Google Toolbar, яка створює нову панель інструментів, що дозволяє шукати в Google, не заходивши на сам сайт.
  • Рядок пошуку в Google можна використати і як калькулятор. Якщо ввести (48-26)*21, Google видасть правильний результат.

YAHOO - http://www.yahoo.com

Yahoo було засновано  в 1994, і на сьогоднішній день  це найстаріший і якнайповніший  каталог Інтернет-ресурсів.

Yahoo є найпопулярнішим  пошуковим засобом і секрет  його успіху Yahoo криється в людях.  Над складанням та редагуванням  вмісту каталогів Yahoo працюють  понад 150 редакторів. Yahoo має базу  даних в більш, ніж 1 млн.  проіндексованих сайтів. Також, у разі браку власної бази даних, Yahoo використовує базу даних Google (до липня 2000 року Yahoo користувався базою даних Inktomi).

 

В Рунеті основними є  пошукові системи Яndex, Rambler та Mail.ru На діаграмі представлена питома вага різних пошукових машин Рунету.

 

YANDEX.RU (Спрощено - http://ya.ru)

Yandex виконує пошук  по словяномовній частині Інтернету з урахуванням морфології словянських мов. Маючи могутній механізм підбору сайтів під запити, ця пошукова машина допомагає знайти найбільш відповідні веб-сторінки. Яндекс щодня переглядає сотні тисяч веб-сторінок у пошуках змін або нових посилань, і їх база постійно зростає.

Офіційно пошукова машина Yandex.Ru була анонсована 23 вересня 1997 року на виставці Softool. Вже тоді пошуковик  мав певні переваги - можливість перевірки документів на унікальність, облік морфології словянських мов, можливість пошуку з врахуванням відстані (наприклад, при пошуку точного словосполучення). Основною відмінною рисою Yandex є ретельно розроблений алгоритм оцінки відповідності відповіді запиту (релевантності), який враховує не лише кількість слів запиту, знайдених у тексті, але і "контрастність" слова (його відносну частоту для даного документа), відстань між словами, і положення слова в документі.

RAMBLER.RU (Спрощений - http://www.r0.ru)

Rambler постійно вдосконалює  свій пошуковий алгоритм. Проводяться  роботи по оптимізації роботи  системи для точності та актуальності  пошуку. Як і більшість російських  пошукових машин, Rambler враховує морфологію  російської мови. При видачі результатів вплив має положення сайту в рейтингу Rambler's Top100. Rambler індексує сайти в зонах ru .su, .ua, .by, .kz, .kg, .uz, .ge, а також славяномовні сайти в доменах .com, .net або .org.

На Рамблері реалізовано  розумну систему, яка виводить в  результатах пошуку слова, які є синонімами запиту. Ще однією функцією системи є видача контекстної реклами не лише за конкретними ключовими словами, але і за фразами, що тісно пов'язані з ними.

Рамблер (на відміну від  інших пошукачів) вміє витягувати гіперпосилання з об'єктів Macromedia Flash. Якщо сайт має заставку або навігаційні панелі, що виконані з використанням цієї технології, Рамблер обробляє їх, знаходить адреси всіх сторінок сайту і індексує весь сайт. Тексти flash-об'єктів не індексуються. Для сайтів, які цілком складаються з flash-об'єктів, рекомендується створити HTML-копію і зареєструвати її в пошуковій машині. Роботи Рамблера також справляються з конструкціями фреймів.

Информация о работе Пошукові системи