Информационно-поисковые системы

Автор работы: Пользователь скрыл имя, 02 Марта 2013 в 08:49, контрольная работа

Описание

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением Интернета проблема поиска становилась более актуальной.
Задача данной работы - рассмотрение работы нескольких современных систем в отдельности из результатов, которых можно сделать определённые выводы о характеристиках и особенностях построения этих систем. И дать оценку работе каждой из них.

Содержание

Введение…………………………………………………………………………...3
1. Основные принципы построения Информационно-поисковых систем…………………………………………………………4
1.1. Понятие информационно-поисковой системы……………………………..4
1.2.Процесс поиска………………………………………………………………..5
1.3. Информационный язык………………………………………………………7
2. Современные информационно-поисковые системы Интернета………………………………………………………………………9
1.1. Архитектура современных информационно-поисковых систем World Wide Web………………………………………………………………………......9
1.2.Информационные ресурсы и их представление в информационно-поисковой системе……………………………………………………………….11
1.3. Информационно-поисковый язык системы……………………………….15
1.4.Типы информационно-поисковых языков……………................................17
1.5. Информационно-поисковые языки Интернет………………......................17
1.6. Гипертекстовые ссылки…………………………………………………….20
Заключение……………………………………………………………………….23
Список литературы……………………………………………………………....24

Работа состоит из  1 файл

моя контр Альшанская.doc

— 144.50 Кб (Скачать документ)

Министерство образования  и науки Российской Федерации

Тольяттинский филиал

Московского государственного университета пищевых производств

Кафедра «Экономика и  управление качеством в пищевой  промышленности»

 

 

 

 

 

 

Контрольная работа

 

по дисциплине «ИТ  в УК и ЗИ»

по теме: «Информационно-поисковые  системы»

 

 

 

 

 

Студент группы:        УЗ-401 Лаптева Наталья

Преподаватель        Альшанская Т.В. 

 

 

 

 

 

 

 

 

Тольятти 2011г

Содержание

 

Введение…………………………………………………………………………...3

1. Основные принципы построения Информационно-поисковых систем…………………………………………………………4

1.1. Понятие информационно-поисковой системы……………………………..4

1.2.Процесс поиска………………………………………………………………..5

1.3. Информационный язык………………………………………………………7

2. Современные информационно-поисковые системы Интернета………………………………………………………………………9

1.1. Архитектура современных информационно-поисковых систем World Wide Web………………………………………………………………………......9

1.2.Информационные ресурсы и их представление в информационно-поисковой системе……………………………………………………………….11

1.3. Информационно-поисковый язык системы……………………………….15

1.4.Типы информационно-поисковых языков……………................................17

1.5. Информационно-поисковые языки Интернет………………......................17

1.6. Гипертекстовые ссылки…………………………………………………….20

Заключение……………………………………………………………………….23

Список литературы……………………………………………………………....24

 

 

 

 

 

 

 

 

 

Введение

Современный этап развития цивилизации характеризуется переходом  наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением Интернета проблема поиска становилась более актуальной.

В самом деле, если подумать то Интернет- это единая информационная среда, но с другой стороны это большое количество полезной информации, для поиска которой необходимо затратить много времени.

Да и не только Интернет стал толчком для создания Информационно-поисковых систем. Предприятия, заводы, на которых существуют огромные базы данных, так же нуждаются в Информационно-поисковых системах, но всё же в большей степени ИПС связаны с сетями.

Люди ещё издревле стремились, как-то упростить процесс  поиска. Например, библиотека – та же система, но вот только всё делается вручную, или же любую справочную службу.

В наше время существуют  большое количество систем, такие  как Archie, Goopher, современные, такие как WWW, WAIS и т.д. Без пользования услугами этих систем практически нельзя найти что-либо полезное в море информационных ресурсов сети. Но что они из себя представляют, как устроены, почему результат поиска в терабайтах информации выдается так быстро, как устроено ранжирование документов при выдаче, что из себя представляют информационные массивы этих систем - этим вопросам посвящена данная курсовая работа.

Задача данной курсовой - рассмотрение  работы нескольких современных  систем в отдельности из результатов, которых  можно  сделать определённые выводы о характеристиках и особенностях построения этих систем. И дать оценку работе каждой из них.

1. ОСНОВНЫЕ ПРИНЦИПЫ ПОСТРОЕНИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ

1.1. Понятие информационно-поисковой системы

 

Информационно-поисковая  система – это прикладная компьютерная среда для обработки, хранения, сортировки, фильтрации и поиска больших массивов структурированной информации.

Информационно-поисковая система - совокупность информационно поисковых правил перевода с естественного языка на информационно - поисковый и обратного перевода, а также критерия соответствия, предназначенного для осуществления информационного поиска. В число составных частей конкретной информационно – поисковой системы (ИПС), кроме информационно-поискового языка, правил перевода и критерия соответствия, входят также средства ее технической реализации, массив текстов (документов), в котором осуществляется информационный поиск, и люди, непосредственно участвующие в этом поиске.

Каждая ИПС предназначена  для решения определенного класса задач, для которых характерен свой набор объектов и их признаков. ИПС бывают двух типов:

1. Документографические. В таких ИПС все хранимые документы индексируются специальным образом, т. е. каждому документу присваивается индивидуальный код, составляющий поисковый образ. Поиск идет не по самим документам, а по их поисковым образам. Именно так ищут книги в больших библиотеках. Сначала отыскивают карточку в каталоге, а затем по номеру, указанному на ней, отыскивается и сама книга.

2. Фактографические. В  фактографичеких ИПС хранятся не документы, а факты, относящиеся к какой-либо предметной области. Поиск осуществляется по образцу факта.

Каждая ИПС состоит  из двух частей: базы данных (БД) и системы  управления базами данных (СУБД).

 

База данных - это поименованная  совокупность структурированных данных, относящихся к определенной предметной области.

Система управления базами данных - это комплекс программных  и языковых средств, необходимых  для создания баз данных, поддержания  их в актуальном состоянии и организации  поиска в них необходимой информации. На настоящий момент существует множество различных СУБД. Наиболее широкую известность получили такие как Dbase, Clipper, FoxPro, Paradox, Microsoft Access.

1.2.Процесс поиска

 

Информационный поиск - процесс отыскания в некотором множестве текстов (документов) всех таких, которые посвящены указанной в запросе теме (предмету) или содержат нужные потребителю факты, сведения. ИП осуществляется посредством информационно-поисковой системы и выполняется вручную либо с использованием средств механизации или автоматизации. Непременным участником ИП является человек. В зависимости от характера информации, которая содержится в выдаваемых информационно - поисковой системой (ИПС) текстах, ИП может быть документальным, в том числе библиографическим, и фактографическим. ИП нужно отличать от логической переработки информации, без которой невозможна непосредственная выдача человеку ответов на задаваемые им вопросы. При ИП отыскиваются — и могут быть найдены — такие и только такие факты или сведения, которые были введены в ИПС. Перед вводом в ИПС текста (документа) определяется его основное смысловое содержание (тема или предмет), которое затем переводится и записывается на одном из информационно-поисковых языков. Эта запись называется поисковым образом текста. Так же поступают и когда в ИПС вводят определённым образом записанные факты, сведения. Поступивший запрос также переводится на информационно-поисковый язык, образуя поисковое предписание. Поскольку поисковые образы текстов и поисковые предписания записаны на одном и том же языке, выражения на котором допускают только одно истолкование, то, возможно сравнивать их формально, не вникая в смысл. Для этого задаются определённые правила (критерии соответствия), устанавливающие, при какой степени формального совпадения поискового образа с поисковым предписанием текст следует считать отвечающим на информационный запрос и подлежащим выдаче. 

Техническая эффективность  ИП характеризуется двумя относительными показателями — коэффициентом точности (отношением числа текстов, отвечающих на информационный запрос, к общему числу текстов в данной выдаче) и коэффициентом полноты (отношением числа текстов, отвечающих на информационный запрос, к общему числу таких текстов, содержащихся в данной ИПС). Необходимые значения этих показателей зависят от специфики информационных потребностей. Например, при поиске патентных описаний с целью проведения экспертизы патентной заявки на новизну необходима 100%-ная полнота выдачи; при поиске, ориентированном на обычного исследователя или инженера, очень хорошей считается точность выдачи около 80% , полнота — около 50%.

Рисунок 1 - Процесс поиска.

ИП может быть двух типов — избирательное (или адресное) распространение информации и ретроспективный поиск. При избирательном распространении информации ИП производится по постоянным запросам некоторого числа потребителей (абонентов), осуществляется периодически (обычно один раз в неделю или в две недели) и выполняется лишь в массиве текстов, поступивших в ИПС за этот период времени. Между ИПС и потребителями (абонентами) устанавливается эффективно действующая обратная связь (абонент сообщает, в какой степени этот текст соответствует запросу и нужна ли ему копия полного текста, о степени соответствия этого текста его информационной потребности), которая позволяет уточнять потребности абонентов, своевременно реагировать на изменения этих потребностей и оптимизировать работу системы. При ретроспективном поиске ИПС отыскивает содержащие требуемую информацию тексты во всём накопленном массиве текстов по разовым запросам.

    1. Информационный язык

 

Информационно-поисковый язык - знаковая система, предназначенная для описания (путём индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска. Любой абстрактный информационно – поисковый язык (ИПЯ) состоит из алфавита (списка элементарных символов), правил образования и правил интерпретации. Правила образования устанавливают, какие комбинации элементарных символов допускаются при построении слов и выражений, а правила интерпретации - как надлежит понимать эти слова и выражения.

ИПЯ должен располагать  лексико-грамматическими средствами, необходимыми для выражения основного смыслового содержания любого текста и смысла любого информационного запроса по данной отрасли или предмету, быть недвусмысленным (допускать одно истолкование каждой записи), удобным для алгоритмического сопоставления и отождествления (полного или частичного) записей основного смыслового содержания текстов и смыслового содержания информационных запросов. При разработке конкретного ИПЯ учитываются специфика отрасли или предмета, для которой этот язык создаётся, особенности текстов, образующих поисковый массив, характер информационных потребностей, для удовлетворения которых создается данная информационно - поисковая система.  

 В большинстве ИПЯ основной  словарный состав (лексика) задаётся  его перечислением и представляет собой фрагмент лексики того или иного естественного языка. Отобранные из естественного языка слова и словосочетания, в совокупности образующие основной словарный состав, служат как бы алфавитом данного ИПЯ. Правила образования в таких ИПЯ выполняют функцию синтаксиса. В некоторых ИПЯ основной словарный состав задаётся (полностью или частично) методом порождения, который заключается в том, что для таких ИПЯ правила образования устанавливают, как из данного алфавита строить слова ИПЯ, а из этих слов — выражения (фразы) и какие из них будут правильно построенными. В середине 20 в. в качестве ИПЯ широко применяются классификации библиотечно-библиографические и языки дескрипторного типа.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. СОВРЕМЕННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА

1.1. Архитектура современных информационно-поисковых систем World Wide Web

 

Прежде чем описать  проблемы построения информационно-поисковых  систем Web и пути их решения, рассмотрим типовую схему такой системы (рисунок 2). В различных публикациях, посвященных конкретным системам, приводятся схемы, которые отличаются друг от друга только применением конкретных программных решений, но не принципом организации различных компонентов системы

 

 

Рисунок 2 - Структура ИПС для Internet.

 

На этой схеме обозначены:

client - это программа просмотра  конкретного информационного ресурса. В настоящее время наиболее популярны мультипротокольные программы типа Netscape Navigator. Такая программа обеспечивает просмотр документов World Wide Web, Gopher, Wais, FTP-архивов, почтовых списков рассылки и групп новостей Usenet. В свою очередь все эти информационные ресурсы являются объектом поиска информационно-поисковой системы.

user interface - интерфейс пользователя - это не просто программа просмотра.  В случае информационно-поисковой  системы под этим словосочетанием  понимают и способ общения пользователя с поисковым аппаратом системы, т.е. с системой формирования запросов и просмотров результатов поиска. Просмотр результатов поиска и информационных ресурсов сети - это совершенно разные вещи, на которых остановимся чуть позже.

search engine - поисковая машина служит  для трансляции запроса пользователя, который подготавливается на  информационно-поисковом языке (ИПЯ), в формальный запрос системы,  поиска ссылок на информационные  ресурсы Сети и выдачи результатов  этого поиска пользователю.

index database - индекс - это основной  массив данных информационно-поисковой  системы. Он служит для поиска  адреса информационного ресурса.  Архитектура индекса устроена  таким образом, чтобы поиск  происходил максимально быстро  и при этом можно было бы оценить ценность каждого из найденных информационных ресурсов сети.

queries - запросы пользователя сохраняются  в его личной базе данных. На  отладку каждого запроса уходит  достаточно много времени, и  поэтому чрезвычайно важно хранить  запросы, на которые система дает хорошие ответы.

index robot - робот-индексировщик служит  для сканирования Internet и поддержки  базы данных индекса в актуальном  состоянии. Эта программа является  основным источником информации  о состоянии информационных ресурсов  сети.

Информация о работе Информационно-поисковые системы