Что такое база знаний и база данных? В чем их отличие?

Автор работы: Пользователь скрыл имя, 25 Марта 2012 в 18:14, доклад

Описание

База знаний - это особого рода база данных, разработанная для оперирования знаниями (метаданными). Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации.

Работа состоит из  1 файл

4to takoye baza.docx

— 23.11 Кб (Скачать документ)

ЧТО ТАКОЕ БАЗА ЗНАНИЙ И БАЗА ДАННЫХ?

В ЧЕМ ИХ ОТЛИЧИЕ?

База знаний - это особого рода база данных, разработанная для оперирования знаниями (метаданными). Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации.

Под базами знаний понимается совокупность фактов и правил вывода, допускающих логический вывод и  осмысленную обработку информация.

Например, в языке «Пролог» базы знаний описываются в форме  конкретных фактов и правил логического  вывода над базами данных и процедурами  обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в  логической форме.

Наиболее важным свойством  информации, хранящейся в базах знаний, является достоверность конкретных и обобщенных сведений в базе данных и релевантности информации, получаемой с использованием правил вывода, заложенных в базу знаний. В ответах на простейшие запросы к базам знаний системы  логического программирования «Пролог», выдает значения «истина» и «ложь» в зависимости от наличия соответствующих  фактов.

Обобщённые сведения в  языке «Пролог» задаются с помощью правил логического вывода, выполняющих роль определения понятий, а также логических процедур, состоящих из наборов правил логического вывода. Достоверность обобщенных сведений зависит от наличия необходимых фактов и достоверности данных в базах знаний.

База  знаний - важный компонент интеллектуальной системы. Наиболее известный класс таких программ - это экспертные системы. Они предназначены для поиска способов решения проблем из некоторой предметной области, основываясь на записях БЗ и на пользовательском описании ситуации.

Простые базы знаний могут  использоваться для создания экспертных систем хранения данных в организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти уже существующее описание способа решения какой-либо проблемы.

Двумя наиболее важными требованиями к информации, хранящейся в базе знаний интеллектуальной системы, являются:

  1. достоверность конкретных и обобщённых сведений, имеющихся в базе данных, и
  2. релевантность информации, получаемой с помощью правил вывода базы знаний.

Также хочу перечислить некоторые из особенностей, которые могут (но не обязаны) быть у системы, оперирующей базами знаний:

  • Автоматическое доказательство (вывод). Способность системы выводить новые знания из старых, находить закономерности в БЗ. Часто принимается, что база знаний отличается от базы данных именно наличием механизма вывода.
  • Доказательство заключения. Способность системы после выдачи ответа «объяснить» ход её рассуждений, причем «по первому требованию».
  • Интроспекция. Нахождение противоречий, нестыковок в БЗ, контроль правильной организации БЗ.
  • Машинное обучение. Превращение БЗ в гибкую систему, адаптация к проблемной области. Аналогична человеческой способности «набирать опыт».

А теперь я хочу рассказать о базах данных.

Все знают, что такое база данных и как ими пользоваться. База данных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчетов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ). Созданы и постоянно расширяются самые разнообразные базы данных по любой тематике, от научной периодики до художественной литературы, от произведений искусства до справочников телефонных номеров.

Но это необходимое  образование постепенно начинает терять свою былую значимость. Особенно это  касается научной периодики. Главная  проблема научных баз данных - это их избыточность. Любой запрос, выполненный по ключевым поисковым словам, выдаст столь огромное количество ссылок, что их просмотр становится отдельной работой. При этом многие материалы различаются столь незначительно, что трудно оценить полезность одного из них на фоне другого.

Вариантом выхода из этой ситуации является создание баз знаний или  баз решений: систематезированной информации, которая обрабатывается по другим поисковым алгоритмам.

В чём  главное отличие баз знаний от баз данных? В базе данных идёт поиск по ключевому слову, условно говоря – это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 – 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Если ответить на вопрос “Чем БЗ отличается от БД?”, то это будет примерно звучать так: База знаний - это то, что у вас на рабочем столе (про компьютер говорится), имею ввиду вы активно можете пользоваться этом. А база данных - архив, вы можете этим воспользоваться.

Подавляющее большинство  статей – это лишь небольшие нюансы какого-либо решения. Например: закалка  металла. Решение – что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все  металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая – по способам подачи материала (насосы, окунание детали, распыление раствора), третья – по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний – это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.

Сейчас я хочу перечислить  плюсы и минусы этой системы:

Минусы:

1. Базы данных – это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов.

2. Базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Плюсы:

1. Создание базы знаний – это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленные задачи.

2. При определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка.

3. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов – до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

В завершении своего доклада (эссе) я бы хотел сделать небольшой  итог: Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.


Информация о работе Что такое база знаний и база данных? В чем их отличие?