Типи інформаційно-пошукових систем

Автор работы: Пользователь скрыл имя, 18 Октября 2013 в 08:49, реферат

Описание

Пошук інформації - завдання, яке вирішує людство вже багато століть. У міру зростання обсягу інформаційних ресурсів, потенційно доступних одній людині (наприклад, відвідувачу бібліотеки), були вироблені все більш витончені і досконалі пошукові засоби і прийоми, що дозволяють знайти необхідний документ.
На сьогоднішній день життя сучасної людини важко уявити без Інтернету. Мережа схожа на павутину, нитки якої обплутують всю земну кулю. На наших очах завершується формування нової глобальної оболонки планети, тієї самої неосферу, ідеї якої хвилювали кращі уми людства ще на початку XX століття.

Содержание

Вступ
Поняття інформаційно-пошукової системи
Історія
Користування різними пошуковими системами
Типи пошукових систем
Характеристика пошукових систем
Підсумки
Список використаних ресурсів

Работа состоит из  1 файл

Рефарат ИНФ.doc

— 86.50 Кб (Скачать документ)

ДЕРЖАВНИЙ ВИЩИЙ НАВЧАЛЬНИЙ ЗАКЛАД

«»
МІНІСТЕРСТВА  ОСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ

КАФЕДРА ІНФОРМАЦІЙНИХ  ТЕХНОЛОГІЙ 

 

 

 

РЕФЕРАТ З ДИСЦИПЛІНИ

 «ОСНОВИ ІНФОРМАТИКИ  ТА ПРИКЛАДНОЇ ЛІНГВІСТИКИ»

ЗА ТЕМОЮ:

«Типи інформаційно-пошукових систем» 

 

 

  

Виконала ст. гр                   

 

 Перевірив                    

Запоріжжя

2012

 

Список розділів

 

  1. Вступ
  2. Поняття інформаційно-пошукової системи
  3. Історія
  4. Користування різними пошуковими системами
  5. Типи пошукових систем
  6. Характеристика пошукових систем
  7. Підсумки
  8. Список використаних ресурсів

 

Вступ

 

Пошук інформації - завдання, яке вирішує людство вже багато століть. У міру зростання обсягу інформаційних ресурсів, потенційно доступних одній людині (наприклад, відвідувачу бібліотеки), були вироблені  все більш витончені і досконалі пошукові засоби і прийоми, що дозволяють знайти необхідний документ.

На сьогоднішній день життя сучасної людини важко уявити без Інтернету. Мережа схожа на павутину, нитки якої обплутують всю земну  кулю. На наших очах завершується формування нової глобальної оболонки планети, тієї самої неосферу, ідеї якої хвилювали кращі уми людства ще на початку XX століття.

Людину, яка вперше потрапила в Інтернет, спочатку просто приголомшує безмежність океану інформації. І лише з часом приходить розуміння того, що не можна сказати про Інтернет, що «там є все». В Інтернеті дійсно є все, але тільки з того, що хтось побажав там розмістити. Однак, знайти потрібну інформацію в мережі не так легко через те, що мережа за своєю природою не має чіткої структури.

 

Поняття інформаційно-пошукової системи

 

Інформаційно-пошукова система (ІПС) - це система, що забезпечує пошук і відбір необхідних даних в спеціальній базі з описами джерел інформації (індексі) на основі інформаційно-пошукової мови і відповідних правил пошуку. Головним завданням будь ІПС є пошук інформації релевантної інформаційним потребам користувача. Дуже важливо в результаті проведеного пошуку нічого не втратити, тобто знайти всі документи, що відносяться до запиту, і не знайти нічого зайвого. Тому вводиться якісна характеристика процедури пошуку – релевантність.

Релева́нтність (англ. relevance) — міра відповідності отримуваного результату бажаному. В термінах пошуку — це міра відповідності результатів пошуку завданню поставленому в пошуковому запиті. Визначає, наскільки повно той або інший документ відповідає критеріям, вказаним в запиті користувача. Необхідно враховувати, що в кожній пошуковій системі працює власна програма (спайдер), що індексує веб-сторінки, кожна система індексує сторінки своїм особливим способом і пріоритети при пошуку за індексами теж різні. Тому запит за одними і тими ж ключовими словами в кожній з пошукових систем породжує різні результати.

Релевантність пошуку

Це є суб'єктивним поняттям, оскільки результати пошуку, які підходять  для одного користувача, можуть не підходити для іншого. Основним методом для оцінки релевантності є TF-IDF-метод, який використовується у більшості пошукових систем (як в інтернет-пошуковиках, так і у довідкових системах (MSDN). Його зміст зводиться до того, що чим більша локальна частота терміну (запиту) у документі (TF) і більша «рідкість» (тобто, чим рідше він зустрічається в інших документах) терміну у колекції (IDF), тим вище вага даного документу відносно терміну — тобто документ буде видаватись раніше у результатах пошуку за даним терміном. Автором методу є Gerard Salton.

Головним завданням  пошукової системи є здатність  надавати користувачам саме ту інформацію, яку вони шукають. А навчити користувачів робити «правильні» запити до пошукової  системи, які відповідають її принципам роботи неможливо. Тому, розробники створюють такі алгоритми і принципи роботи пошукових систем, які найкраще пристосовані до поведінки і ходу думок пересічного користувача.

Пошукова система повинна  діяти так само, як діє користувач при пошуку інформації і надавати за його запитом інформацію максимально швидко і просто. Користувач оцінює роботу системи за кількома основними критеріями. Чи знайшов він те, що шукав? Якщо не знайшов, то скільки разів йому довелося перефразувати запит, щоб знайти потрібне? Наскільки актуальною є надана інформація? Наскільки швидко пошукова машина обробляла запит? Наскільки зручно було представлено результати пошуку? Чи була потрібна інформація серед перших результатів пошуку? Як багато непотрібної інформації було знайдено нарівні з корисною?

Для того, щоб задовольнити зростаючим потребам користувачів, розробники пошукових машин постійно вдосконалюють  алгоритми і принципи пошуку, додають  нові функції і можливості, всіляко  намагаються пришвидшити роботу системи.

 

Історія

 

Одним з перших інструментів пошуку в інтернеті (до Всесвітньої  павутини) був Archie.

Першою пошуковою системою для Всесвітньої павутини був  «Wandex», вже не існуючий індекс, який створював «World Wide Web Wanderer» - бот, розроблений Метью Греєм з Массачусетського технологічного інституту в 1993. Також в 1993 році з'явилася пошукова система «Aliweb», що працює досі. Першою повнотекстової (т. зв. «Crawler-based», тобто ресурси індексуються за допомогою робота) пошуковою системою стала «WebCrawler», запущена в 1994. На відміну від своїх попередників, вона дозволяла користувачам шукати по будь ключовими словами на будь-який веб-сторінці - з тих пір це стало стандартом у всіх основних пошукових системах. Крім того, це був перший пошуковик, про який було відомо в широких колах. У 1994 був запущений «Lycos», розроблений в університеті Карнегі Мелона.

Незабаром з'явилася безліч інших конкуруючих пошукових  машин, таких як «Excite», «Infoseek», «Inktomi», «Northern Light» і «AltaVista». У певному  сенсі вони конкурували з популярними інтернет-каталогами, такими, як «Yahoo!». Пізніше каталоги з'єдналися або додали до себе пошукові машини, щоб збільшити функціональність. У 1996 році російськомовним користувачам інтернету стало доступне морфологічне розширення до пошукової машини Altavista і оригінальні російські пошукові машини «Рамблер» і «Апорт». 23 вересня 1997 була відкрита пошукова машина Яндекс.

 

Останнім часом завойовує  все більшу популярність практика застосування методів кластерного аналізу  і пошуку по метаданих. З міжнародних машин такого плану найбільшу популярність здобула «Clusty» компанії Vivísimo. У 2005 році на російських просторах при підтримці МГУ запущений пошуковик «Нігма», що підтримує автоматичну кластеризацію. У 2006 році відкрилася російська метамашіна Quintura, яка пропонує візуальну кластеризацію у вигляді хмари тегів. «Нігма» теж експериментувала  з візуальною кластеризацією.

 

Крім пошукових машин  для Всесвітньої павутини, існували і пошукачі для інших протоколів, такі як Archie для пошуку по анонімним FTP-серверів і «Veronica» для пошуку в Gopher.

 

Користування пошуковими системами

 

За даними компанії Net Applications, в листопаді 2011 року використання пошукових систем розподілялося таким чином [1]


Типи інформаційно-пошукових  систем

 

На сьогоднішній день пошукові системи можна розбити  на кілька типів:

  1. Тематичні каталоги(або предметні каталоги) - пошукова системи з класифікованими за темами списком анотацій з посиланнями на web-ресурси.
  2. Інформаційно-пошукові машини(або роботи індексів) - пошукова системи з формованої роботом базою даних, що містить інформацію про інформаційні ресурси.
  3. Системи метапошуку - це пошукова система, яка на відміну від класичних пошукових машин не має власної бази даних та власного пошукового індексу, а формує пошукову видачу за рахунок змішування і переанжирування результатів пошуку інших пошукових систем.

 

Єдиної оптимальної  схеми пошуку інформації в мережі Інтернет не існує. В залежності від  специфіки інформації можна використовувати  різні пошукові служби. Чим грамотніше підібрані пошукові служби і чим  правильніше складено запит на пошук  інформації, тим якісніше будуть результати пошуку.

 

Характеристика  пошукових систем

 

Тематичні каталоги дуже схожі на бібліотечні, інформація в них має ієрархічну структуру і класифікована за темами:

- Мистецтво,

- Наука,

- Освіта і т.п.

Каталогами користуються тоді, коли користувача цікавить не щось конкретне, а широке коло питань, але по одній вузькій темі. Їх рекомендується використовувати для реферативно-тематичних оглядів.

Каталоги є довідниками, містять списки адрес Інтернет, згруповані за певними ознаками (за тематикою). Кожна тема розгалужується на кілька підрівнів.

Особливість цих засобів  пошуку в тому, що створення структури  БД та їх постійне оновлення здійснюється «вручну» колективом редакторів і програмістів, та й сам процес пошуку вимагає  безпосередньої участі користувача, самостійно переходить від посилання до посилання.

Найбільш популярним у всі світі визнаний тематичний каталог Yahoo!(Http://www.yahoo.com). Він являє собою величезну базу даних адрес сайтів самої різної тематики.

Організація роботи з  тематичним каталогом достатня проста: ви вибираєте спочатку загальну тематику по вашому запиту, і далі конкретизуєте, слідуючи підказкам каталогу.

Аналогічний російськомовний  каталог Ау! (Http://www.au.com). Також популярний російськомовний каталог List.ru (http://www.list.ru).

Створення та підтримка  тематичних каталогів вимагає величезних витрат. Характерні особливості пошукових  систем:

- мала швидкість поповнення БД,

- порівняно невеликий обсяг,

- досить висока точність пошуку інформації.

Інформаційно-пошукові машини (роботи індексів).

До цього типу пошукових  систем слід вдаватися лише тоді, коли ключові слова точно відомі. Наприклад, прізвище людини або декілька специфічних  термінів з відповідної області.

Пошукова машина влаштована таким чином:

це сервер з величезною базою даних адрес, яка автоматично  поповнюється завдяки діям пошукового робота - спеціальної програми. Програма-робот  самостійно досліджує простір Інтернет, звертається до сторінок WWW, вивчає вміст цих сторінок, формує і прописує ключові слова з web-сторінок в свою БД, тобто індексує сторінки.

Всі номери поміщаються  в БД сервера, в якій користувачі, використовуючи ключові слова, знаходять  потрібну їм інформацію.

Т.ч. по запиту користувача програми-роботи «перериють» величезна кількість зібраних і зберігаються на сервері даних про всі ресурси Мережі: від крупних серверів до самої маленької і скромної домашньої сторінки якогось початківця користувача.

Результат пошуку складається  зі списку рекомендованих користувачеві web-сторінок (їх адрес, URL), оформлених у вигляді гіперпосилань ..

Знайдені документи  ранжуються в залежності від місця  розташування ключових слів (в заголовку, на початку тексту, в перших параграфах) і частоти їх появи в тексті.

Різні пошукові машини відрізняються  по мовам запиту, глибині пошуку усередині документа, методам ранжирування і пріоритетів.

Тому використання різних пошукових машин дає різні  результати пошуку. Найпопулярніша пошукова машина - (http://www.altavista.com).

Сервер AltaVista розташований в Кремнієвій Долині США. Містить  більше 11 мільярдів слів, витягнутих з 30 мільйонів web-сторінок. Видає найбільшу  кількість посилань. При формуванні запиту допускає введення символів кирилиці в російських словах.

З російськомовних пошукових  серверів рекомендуються:

Rambler (www.rambler.ru), Yandex (www.yandex.ru), Апорт (www.aport.ru).

Найбільш розвинений сервіс пошуку інформації представляє сервер Yandex.

 

Системи мета-пошуку.

Такими системами можна  скористатися виходячи з економії часу і грошей. Ці системи не мають  власних пошукових інструментів і власної бази даних. Їх завдання: передати запит користувача справжнім  пошуковим системам. Системи мета-пошуку дозволяють задіяти одразу кілька пошукових служб, при цьому у користувача немає необхідності підключатися до кожної з цих служб і багаторазово вводити заріс. Системою такого класу є Search.com (http://www.search.com). Російська система мета-пошуку «Слідопит»(Http://www.medialingua.ru/www/wwwsearc.htm) дуже популярна та зручна система пошуку. Працює тільки з 5-ма англомовними пошуковими машинами і однією російськомовною. Але цікавий тим, що переводить ваш російськомовний запит на англійську мову для англомовних пошукових машин.

 

Підсумки

 

Отже, здійснювати пошук  інформації за допомогою введення тільки готової адреси в адресний рядок  не представляється можливим. Тому питання пошуку інформації стають все більш актуальними і з роками проблема буде тільки ускладнюватися. Знайти потрібну інформацію вкрай непросто. Відсутність єдиного стандарту на специфікацію задачі пошуку в Мережі призводить до того, що на кожному вузлі пропонується свій власний спосіб вирішення поставленого завдання. В результаті користувач, який не має необхідних навичок у створенні синтаксичних конструкцій запитів до пошукової системи, або не повністю використовує можливості кожного порталу, або, вивчивши функції конкретного вузла, постійно звертається до одного.

Для отримання якісного результату пошуку, необхідно використовувати  можливості різних пошукових систем. Регулярне використання тільки однієї з пошукових систем може погано відбитися на результатах пошуку.

Информация о работе Типи інформаційно-пошукових систем