База данных и база знаний

Автор работы: Пользователь скрыл имя, 03 Декабря 2010 в 09:44, курсовая работа

Описание

В курсовой работе описываеться база данных и база знаний, их сущность, основные понятия, классификация и т.д. Также их сходства и различия.

Содержание

Введение …….…………………………………………………….. 5
1 База Данных 6
1.1. Базы данных и системы управления базами данных...…...….. 6
1.2. Классификация БД и СУБД...…………………….…………..… 8
1.3. Состав СУБД и работа БД….……………………………………..
1.4. Свойства полей базы данных……….………………………
1.5. Типы данных……………………………………………………….
1.6. Безопасность баз данных…………………………………………..
2. База знаний
2.1. Основные понятия ………………...………………..……..…….
2.2. Классификация баз знаний………………………………………
2.3. Система управления базами данных…...…..……….….…..….
2.4. Модели представления знаний…..……….………………..…….
2.5. Применение баз знаний…..………………………………..……
ЗАКЛЮЧЕНИЕ ....................................................................................
БИБЛИОГРАФИЧЕСКИЙ СПИСОК ...............................................

приложения
приложение А1. «Классификация БД» ……………….…….…
ПРИЛОЖЕНИЕ А2. «Классификация СУБД» …………………….
ПРИЛОЖЕНИЕ А3. «Состав СУБД» ………….……………………

Работа состоит из  1 файл

курсовая.docx

— 124.20 Кб (Скачать документ)

   В обязанности АБД входит:

   1) анализ предметной области, статус  информации и пользователей;

   2) проектирование структуры и модификация  данных;

   3) задание и обеспечение целостности;

   4) загрузка и ведение БД;

   5) защита данных;

   6) обеспечение восстановления БД;

   7) сбор и статистическая обработка  обращений к БД, анализ эффективности  функционирования БД;

   8) работа с пользователем.

   Одним из важнейших инструментов АБД является словарь. 

   1.4 Свойства полей базы данных 

   Поля  базы данных не просто определяют структуру  базы – они еще определяют групповые  свойства данных, записываемых в ячейки, принадлежащие каждому из полей. Ниже перечислены основные свойства полей таблиц баз данных на примере  СУБД Microsoft Access.

  • имя поля – определяет, как следует обращаться к данным этого поля при автоматических операциях с базой (по умолчанию имена полей используются в качестве заголовков столбцов таблиц).
  • тип поля – определяет тип данных, которые могут содержаться в данном поле.
  • размер поля – определяет предельную длину (в символах) данных, которые могут размещаться в данном поле.
  • формат поля – определяет способ форматирования данных в ячейках, принадлежащих полю.
  • маска ввода – определяет форму, в которой вводятся данные а поле (средство автоматизации ввода данных).
  • подпись – определяет заголовок столбца таблицы для данного поля (если подпись не указана, то в качестве заголовка столбца используется свойство Имя поля).
  • значение по умолчанию – то значение, которое вводится в ячейки поля автоматически (средство автоматизации ввода данных).
  • условие на значение – ограничение, используемое для проверки правильности ввода данных (средство автоматизации ввода, которое используется, как правило, для данных, имеющих числовой тип, денежный тип или тип даты).
  • сообщение об ошибке – текстовое сообщение, которое выдается автоматически при попытке ввода в поле ошибочных данных.
  • обязательное поле – свойство, определяющее обязательность заполнения данного поля при наполнении базы.
  • пустые строки – свойство, разрешающее ввод пустых строковых данных (от свойства Обязательное поле отличается тем, что относится не ко всем типам данных, а лишь к некоторым, например к текстовым).
  • индексированное поле – если поле обладает этим свойством, все операции, связанные с поиском или сортировкой записей по значению, хранящемуся в данном поле, существенно ускоряются. Кроме того, для индексированных полей можно сделать так, что значение в записях будут проверяться по этому полю на наличие повторов, что позволяет автоматически исключить дублирование данных.

   Поскольку в разных полях могут содержаться  данные разного типа, то и свойства у полей могут различаться  в зависимости от типа данных. Так, например, список вышеуказанных свойств  полей относится в основном к  полям текстового типа. Поля других типов могут иметь или не иметь  эти свойства, но могут добавлять  к ним и свои. Например, для  данных, представляющих действительные числа, важным свойством является количество знаков после десятичной запятой. С  другой стороны, для полей, используемых для хранения рисунков, звукозаписей, видео клипов и других объектов OLE, большинство вышеуказанных свойств  не имеют смысла. 

   1.5 Типы данных 

   Таблицы баз данных, как правило, допускают  работу с гораздо большим количеством разных типов данных. Так, например, базы данных Microsoft Access работают со следующими типами данных.

  • текстовый – тип данных, используемый для хранения обычного неформатированного текста ограниченного размера (до 255 символов).
  • числовой – тип данных для хранения действительных чисел.
  • поле Мемо – специальный тип данных для хранения больших объемов текста (до 65 535 символов). Физически текст не хранится в поле. Он храниться в другом месте базы данных, а в поле храниться указатель на него, но для пользователя такое разделение заметно не всегда.
  • дата/время – тип данных для хранения календарных дат и текущего времени.
  • денежный - тип данных для хранения денежных сумм. Теоретически, для их записи можно было бы пользоваться и полями числового типа, но для денежных сумм есть некоторые особенности (например, связанные с правилами округления), которые делают более удобным использование специального типа данных, а не настройку числового типа.
  • счетчик – специальный тип данных для уникальных (не повторяющихся в поле) натуральных чисел с автоматическим наращиванием. Естественное использование – для порядковой нумерации записей.
  • логический - тип для хранения логических данных (могут принимать только два значения, например Да или Нет).
  • гиперссылка – специальное поле для хранения адресов URL Web-объектов Интернета. При щелчке на ссылке автоматически происходит запуск броузера и воспроизведение объекта в его окне.
  • мастер подстановок – это не специальный тип данных. Это объект, настройкой которого можно автоматизировать ввод данных в поле так, чтобы не вводить их вручную, а выбирать их из раскрывающегося списка.
 

   1.6  Безопасность баз данных 

   Базы  данных – это тоже файлы, но работа с ними отличается от работы с файлами  других типов, создаваемых прочими  приложениями. Выше мы видели, что всю  работу по обслуживанию файловой структуры  берет на себя операционная система. Для базы данных предъявляются особые требования с точки зрения безопасности, поэтому в них реализован другой подход к сохранению данных.

   Базы  данных – это особые структуры. Информация, которая в них содержится, очень  часто имеет общественную ценность. Нередко с одной и той же базой работают тысячи людей по всей стране. От информации, которая содержится в некоторых базах, может зависеть благополучие множества людей. Поэтому  целостность содержимого базы не может и не должна зависеть ни от конкретных действий некоего пользователя, забывшего сохранить файлы перед  выключением компьютера, ни от перебоев в электросети.

   Проблема  безопасности баз данных решается тем, что в СУБД  для сохранения информации используется двойной подход. В части операций, как обычно, участвует операционная система  компьютера, но некоторые операции сохранения происходят в обход операционной системы. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

   
  1. БАЗА ЗНАНИЙ
 
    1. Основные понятия

    

   База  знаний, наравне с базой данных, – необходимая составляющая программного комплекса искусственного интеллекта.

   База  знаний – совокупность систематизированных основополагающих сведений, относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём которых необходим и достаточен для решения заданного круга теоретических или практических задач. В системе управления БЗ используются методы искусственного интеллекта, специальные языки описания знаний, интеллектуальный интерфейс.

   Машины, реализующие алгоритмы искусственного интеллекта, называются машинами, основанными на знаниях, а подраздел теории искусственного интеллекта, связанный с построением экспертных систем, – инженерией знаний.

   Знания  о предметной области, ее объектах и  закономерностях описываются на некотором формальном языке, называемом языком представления знаний (ЯПЗ). При этом, ЯПЗ должен обеспечивать не только возможность формальной записи знаний, но и необходимую обработку элементов этой записи.

   Совокупность  знаний, хранящаяся во внешней памяти ЭВМ, называется системой знаний; над  ней производятся различные операции: поиск необходимой информации, ее модификация, интерпретация знаний, вывод новых знаний на основе имеющихся  и т.д. Организация интеллектуальных компьютерных систем работы со знаниями в той или иной прикладной области зависят не только от специфики самих систем, но и в существенной мере от используемых ЯПЗ и метода хранения системы знаний в ЭВМ. В современных ИИ-системах знания хранятся в специальных БД – базах знаний (БЗ).

   Существует  самая непосредственная аналогия между  понятиями модель данных, используемая в БД-технологии и понятием способ представления знаний в БЗ-технологии. Грубо говоря, можно сказать, что если БД содержит собственно данные о некоторой предметной области, то БЗ содержит как сами данные, так и описание их свойств. Однако между БД и БЗ существуют принципиальные различия, рассматриваемые ниже

   Процесс построения БЗ на основе информации эксперта состоит из трех этапов: описание предметной области, выбор способа и модели представления знаний и приобретение знаний. Сам процесс построения БЗ достаточно сложен, как правило, плохо структурирован и носит итеративный характер, заключающийся в циклической модификации БЗ на основе результатов ее тестирования. На первом шаге построения БЗ четко очерчивается предметная область, на решение задач из которой ориентируется проектируемая ЭС, т.е. инженер знаний определяет область применения будущей системы и класс решаемых ею задач. В перечень работ данного шага входят:

  • определение характера решаемых ЭС задач и основных понятий, объектов предметной области, а также отношений между ними;
  • установление специфических особенностей предметной области;
  • выбор модели представления знаний.

   После решения первых двух вопросов инженер знаний формально описывает предметную область на языке представления знаний (ЯПЗ), т.е. создает модель представления знаний. В настоящее время универсальный способ представления знаний отсутствует, поэтому инженер знаний должен максимально учитывать специфику исходной предметной области.

   Полученная  после формализации предметной области  БЗ может быть уже конкретно реализована программными средствами, например на ЯВУ таких, как Pascal,C,Prolog,Fortran,Forth и др.

       
 

   2.2 Классификация баз знаний

 

   В зависимости от уровня сложности  систем, в которых применяются  базы знаний, различают:

   1) БЗ всемирного масштаба – например, Интернет или Википедия;

   2) БЗ национальные – например, Википедия;

   3) БЗ отраслевые – например, Автомобильная энциклопедия;

   4) БЗ организаций;

   5) БЗ экспертных систем;

   6) БЗ специалистов. 

   2.3 Система управления базами знаний 

   Система управления базами знаний это объектная БД с возможностями интеллектуального поиска и автоматического переупорядочивания структуры в зависимости от действий пользователей – по сути обучение, возможно и иное с вебинтерфейсом и хорошо бы с интегрированным средством планирования/управления.

   Характерные черты:

  • иерархическая организация знаний;
  • специализированные средства для обработки конструкторских данных и знаний;
  • специализированный инструментарий для работы с деревьями составов;
  • средства реорганизации и адаптации баз знаний к специфике задач;
  • расширяемая библиотека функций и команд для разработки приложений.

   Система управления  базой знаний (СУБЗ) объектно-ориентированной  обладает следующими возможностями:

   Сохранять текущее состояние графа объектов или нейронной сети в СООБЗ  между сеансами работы с пользователем. В том числе сохраняется текущая топология сети объектов. При повторном запуске приложения не понадобится создавать сеть объектов заново. При большем количестве экземпляров объектов ограничить объем памяти, используемый графом объектов или нейронной сетью. Наиболее часто используемые объекты остаются в оперативной памяти, остальные вытесняются в файловое хранилище и загружаются в оперативную память по мере необходимости. При загрузке экземпляра в оперативную память он вытесняет другие, редко используемые объекты. Ограничение объема памяти позволяет избавиться от использования файла подкачки операционной системы, что значительно повышает производительность моделирования сетей с большим количеством экземпляров объектов (при суммарном размере всех экземпляров большем, чем размер текущей свободной памяти в системе).

Информация о работе База данных и база знаний