Принципы построения и этапы проектирования базы данных

Автор работы: Пользователь скрыл имя, 02 Октября 2011 в 10:18, контрольная работа

Описание

Автоматизированные информационно-справочные системы (АИСС) в настоящее время получили весьма широкое распространение, что связано прежде всего со сравнительной простотой их создания и исключительно высоким эффектом от внедрения. Методологической основой информационных технологий, реализуемых в АИСС, являются концепции централизованной (в рамках разработки баз и банков данных) и распределенной (в рамках создания информационных сетей) обработки информации.

В науке одним из наиболее

Содержание

Основные понятия и определения 3
Описательная модель предметной области 10
Концептуальные модели данных 16
Реляционная модель данных 20
Операции реляционной алгебры 23
Список использованной литературы

Работа состоит из  1 файл

КР ИСв экономике.docx

— 316.88 Кб (Скачать документ)

    • выделение  в предметной области сущностей;

    • введение множества атрибутов для каждой сущности и выделение из них ключевых;

    • исключение множества повторяющихся атрибутов (при необходимости);

    • формирование связей между сущностями;

    • исключение связей типа М: N (при необходимости);

    • преобразование связей в однонаправленные (по возможности).

  Помимо  модели П.Чена, существуют и другие инфологические модели. Все они представляют собой описательные (неформальные) модели, использующие различные конструктивные элементы и соглашения по их использованию  для представления в БД информации о предметной области. Иными словами, первый этап построения БД всегда связан с моделированием предметной области.

3 Концептуальные модели данных

  В отличие от инфологической модели предметной области, описывающей по некоторым правилам, сведения об объектах материального мира и связи между ними, которые следует иметь в БД, концептуальная модель описывает хранимые в ЭВМ данные и связи. В силу этого каждая модель данных неразрывно связана с языком описания данных конкретной СУБД.

  По  существу, модель данных — это совокупность трех составляющих: типов структур данных, операций над данными, ограничений целостности.

  Типы  структур данных. Среди широкого множества определений, обозначающих типы структур данных, наиболее распространена терминология CODASYL (Conference of DAta SYstems Language) — международной ассоциации по языкам систем обработки данных, созданной в 1959 г.

  В соответствии с этой терминологией  используют пять типовых структур (в  порядке усложнения):

    • элемент  данных;

    • агрегат  данных;

    • запись;

    • набор;

    • база данных.

  База  данных — поименованная совокупность экземпляров записей различного типа, содержащая ссылки между записями, представленные экземплярами наборов.

  Отметим, что структуры БД строятся на основании  следующих основных композиционных правил:

    • БД может содержать любое количество типов записей и типов наборов;

    • между  двумя типами записей может быть определено любое количество наборов;

    • тип  записи может быть владельцем и одновременно членом нескольких типов наборов.

  Следование  данным правилам позволяет моделировать данные о сколь угодно сложной  предметной области с требуемым  уровнем полноты и детализации.

  Рассмотренные типы структур данных могут быть представлены в различной форме — графовой; табличной; в виде исходного текста языка описания данных конкретной СУБД.

  Операции  над данными. Операции, реализуемые СУБД, включают селекцию (поиск) данных и действия над ними. Селекция данных выполняется с помощью критерия, основанного на использовании или логической позиции данного (элемента, агрегата, записи) или значения данного, либо связей между данными. Селекция на основе логической позиции данного базируется на упорядоченности данных в памяти системы. При этом критерии поиска могут формулироваться следующим образом:

    • найти  следующее данное (запись);

    • найти  предыдущее данное;

    • найти  п-е данное;

    • найти  первое (последнее) данное.

  Этот  тип селекции называют селекцией  посредством текущей селекции, в  качестве которой используется индикатор  текущего состояния, автоматически  поддерживаемый СУБД и, как правило, указывающий на некоторый экземпляр  записи БД.

  Критерий  селекции по значениям данных формируется  из простых или булевых условий  отбора. Примерами простых условий  поиска являются:

    • ВОЕННО-УЧЕТНАЯ  СПЕЦИАЛЬНОСТЬ = 200100;

    • ВОЗРАСТ > 20;

    • ДАТА < 19.04.2002 и т.п.

  Булево  условие отбора формируется путем  объединения простых условий  с применением логических операций, например:

    • (ДАТА_РОЖДЕНИЯ < 28.12.1963) И (СТАЖ > 10);

    • (УЧЕНОЕ_ЗВАНИЕ = ДОЦЕНТ) ИЛИ (УЧЕНОЕ ЗВАНИЕ = ПРОФЕССОР) и т.п.

  Если  модель данных, поддерживаемая некоторой  СУБД, позволяет выполнить селекцию данных по связям, то можно найти  данные, связанные с текущим значением какого-либо данного . Например, если в модели данных реализована двунаправленная связь «учится» между сущностями «студент» и «учебная группа», можно выявить учебные группы, в которых учатся юноши (если в составе описания студента входит атрибут «пол»).

  Как правило, большинство современных  СУБД позволяют осуществлять различные  комбинации описанных выше видов  селекции данных.

  Характерные примеры реализации иерархических  структур — язык COBOL и СУБД семейства IMS (создана в рамках проекта высадки  на Луну — «Аполлон») и System 2000 (S2K).

  Сетевая модель данных. В системе БД, предложенных CODASYL, за основу была взята сетевая структура. Существенное влияние на разработку этой модели оказали более ранние сетевые системы — IDS и Ассоциативный ПЛ/1. Необходимость в процессе получения одного отчета обрабатывать несколько файлов обусловила целесообразность установления перекрестных ссылок между файлами, что в конце концов и привело к сетевым структурам.

  Сетевая модель данных основана на представлении  информации в виде орграфа, в котором  в каждую вершину может входить  произвольное число дуг. Вершинам графа  сопоставлены типы записей, дугам —  связи между ними. На рис. 4 представлен пример структуры сетевой модели данных.

   

Рисунок 4 Пример сетевой модели данных 

  По  сравнению с иерархическими сетевые  модели обладают рядом существенных преимуществ: возможность отображения  практически всего многообразия взаимоотношений объектов предметной области, непосредственный доступ к  любой вершине сети (без указания других вершин), малая информационная избыточность. Вместе с тем в сетевой  модели невозможно достичь полной независимости  данных — с ростом объема информации сетевая структура становится весьма сложной для описания и анализа.

  Известно, что применение на практике иерархических  и сетевых моделей данных в  некоторых случаях требует разработки и сопровождения значительного  объема кода приложения, что иногда может вызвать перегрузку ИС.

4. Реляционная модель  данных 

  В основе реляционной модели данных лежит их представление в виде таблиц, что в значительной степени облегчает работу проектировщика БД и — в последующем — пользователя в силу привычности и распространенности такого варианта использования информации. Данная модель была предложена Э.Ф.Коддом (E.F. Codd) в начале 70-х гг. XX в., и вместе с иерархической и сетевой моделями составляет множество так называемых великих моделей. Можно сказать, что сегодня именно эта модель используется во всех наиболее распространенных СУБД.

  Определение любой модели данных требует описания трех элементов:

    • определение  типов (структур) данных;

    • определение  операций над данными;

    • определение  ограничений целостности.

  Типы  структур данных. Рассмотрение этого вопроса требует введения определений нескольких основных понятий.

  Множество возможных значений некоторой характеристики объекта называется доменом (domain):

  Например, в качестве домена можно рассматривать  такие характеристики студента, как  его фамилия, курс, рост и т.п.:

  Очевидно, что можно сопоставить понятия  «атрибут» инфологической и «домен»  реляционной моделей данных. Возможные  значения характеристик объектов могут  принимать числовые или текстовые  значения, а их множества могут  быть как конечными, так и бесконечными. Вектор размерности k, включающий в себя по одному из возможных значений k доменов, называется кортежем (tuple)

  Если  в кортеж входят значения всех характеристик  объекта предметной области (т. е. атрибутов  сущности инфологической модели), ему  можно сопоставить такую типовую  структуру данных, как запись (объектная  запись).

  Декартовым  произведением k доменов называется множество всех возможных значений кортежей. При увеличении размерности любого из доменов увеличивается и размерность их декартова произведения.

  Наконец, важнейшее определение: отношением (relation) R, определенным на множествах доменов D1, D2, ..., Dk, называют подмножество их декартова произведения.

  Элементами  отношения являются кортежи. Отношение  может моделировать множество однотипных объектов (сущностей), причем экземпляр  сущности может интерпретироваться как кортеж. С помощью отношения  можно моделировать и связи, в  которых находятся объекты предметной области (сущности в ее инфологической модели). При этом кортеж такого отношения  состоит из идентифицирующих атрибутов  связываемых сущностей.

  Таким образом, понятие «отношение» позволяет  моделировать данные и связи между  ними. В силу этого можно определить реляционную базу данных (РБД) как совокупность экземпляров конечных отношений.

  Если  учесть, что результат обработки  любого запроса к РБД также  можно интерпретировать как отношение (возможно, не содержащее ни одного кортежа), то возникает возможность построения ИС, основным инструментом которой будет алгебра отношений (реляционная алгебра). Любой запрос в такой системе может быть представлен в виде формулы, состоящей из отношений, объединенных операциями реляционной алгебры. Создав СУБД, обеспечивающую выполнение этих операций, можно разрабатывать И С, в которых любой запрос потребителя программируется формулой.

  Ограничения целостности. Отношение может быть представлено таблицей, обладающей определенными свойствами (которые, по сути, и определяют внутренние ограничения целостности данных):

    • каждая строка таблицы — кортеж;

    • порядок  строк может быть любым;

    • повторение строк не допускается;

    • порядок  столбцов в отношении фиксирован.

  Понятие «отношение» весьма схоже с понятием «файл данных». Поэтому в дальнейшем будем использовать следующую терминологию: отношение — файл; кортеж — запись; домен — поле. Идентификация конкретной записи файла осуществляется по ключу (набору полей, по значению которого можно  однозначно идентифицировать запись). В файле можно определить несколько  ключей. Один из них, включающий минимально возможное для идентификации  записи число полей, называется первичным ключом.

  Применительно к понятию «файл данных» внутренние ограничения целостности формулируются  следующим образом:

    • количество полей и их порядок в файле  должны быть фиксированными (т. е. записи файла должны иметь одинаковые длину  и формат);

    • каждое поле должно моделировать элемент данных (неделимую единицу данных фиксированного формата, к которому СУБД может адресоваться непосредственно);

    • в  файле не должно быть повторяющихся  записей.  

  СУБД, основанные на РБД, поддерживают и явные  ограничения целостности. На практике они определяются зависимостями между атрибутами.

5. Операции реляционной  алгебры 

  Операции  реляционной алгебры лежат в  основе языка манипулирования данными  СУБД, основанных на РБД. Эти операции выполняются над файлами и  в результатом их выполнения также  является файл, который в общем  случае может оказаться и пустым.

Информация о работе Принципы построения и этапы проектирования базы данных