Автор работы: Пользователь скрыл имя, 20 Марта 2012 в 23:57, доклад
Основные понятия и классификация систем управления базами данных. Модели организации данных. Реляционные базы данных.
Реляционная база данных представляет собой хранилище данных, содержащее набор двухмерных таблиц. Данные в таблицах должны удовлетворять следующим принципам.
1. Значения атрибутов должны быть атомарными (иными словами,
каждое значение, содержащееся на пересечении строки и колонки,
должно быть не расчленяемым на несколько значений).
2. Значения каждого атрибута должны принадлежать к одному и тому же типу.
3. Каждая запись в таблице уникальна.
4. Каждое поле имеет уникальное имя.
5. Последовательность полей и записей в таблице не существенна.
Отношение является важнейшим понятием и представляет собой
двумерную таблицу, содержащую некоторые данные.
Сущность есть объект любой природы, данные о котором хранятся в базе данных. Данные о сущности хранятся в отношении.
Атрибуты представляют собой свойства, характеризующие сущность. В структуре таблицы каждый атрибут именуется и ему соответствует заголовок некоторого столбца таблицы.
Ключом отношения называется совокупность его атрибутов, однозначно идентифицирующих каждый из кортежей отношения. Иными словами, множество атрибутов К, являющееся ключом отношения, обладает свойством уникальности. Следующее свойство ключа — неизбыточность. То есть никакое из собственных подмножеств множества К не обладает свойством уникальности.
Каждое отношение всегда имеет комбинацию атрибутов, которая может служить ключом. Ее существование гарантируется принципом № 3 РМД. По крайней мере, вся совокупность атрибутов обладает свойством уникальности.
Возможны случаи, когда отношение имеет несколько комбинаций атрибутов, каждая из которых однозначно определяет все кортежи отношения. Все эти комбинации атрибутов являются возможными ключами отношения. Любой из возможных ключей может быть выбран как первичный.
Ключи обычно используют для достижения следующих целей:
» исключения дублирования значений в ключевых атрибутах (остальные атрибуты в расчет не принимаются);
» упорядочения кортежей. Возможно упорядочение по возрастанию или убыванию значений всех ключевых атрибутов, а также смешанное упорядочение (по одним — возрастание, а по другим — убывание);
» организации связывания таблиц.
Важным является понятие внешнего ключа. Внешний ключ можно определить как множество атрибутов одного отношения R2, значения которых должны совпадать со значениями возможного ключа другого отношения R1.
Атрибуты отношения К2, составляющие внешний ключ, не являются ключевыми для данного отношения.
С помощью внешних ключей устанавливаются связи между отношениями.
Ограничения целостности реляционной модели можно разделить на две группы — ограничения целостности сущностей и ограничения це¬лостности ссылок.
Ограничения целостности сущностей заключаются в требовании уникальности кортежей отношения (записей таблицы). Отсюда выте¬кают следующие ограничения:
» отсутствие кортежей-дубликатов (данное требование предъявля¬ется лишь к атрибутам первичных ключей);
» отсутствие атрибутов с множественным характером значений.
Ограничения целостности ссылок заключаются в том, что для лю¬бой записи с конкретным значением внешнего ключа должна обяза¬тельно существовать запись связанной таблицы-отношения с соответ¬ствующим значением первичного ключа.
К отношениям можно применять систему операций, позволяющую получать одни отношения из других. Например, результатом запроса к реляционной БД может быть новое отношение, вычисленное на ос¬нове имеющихся отношений. Поэтому можно разделить обрабатыва¬емые данные на хранимую и вычисляемую части.
Основной единицей обработки данных в реляционных БД являет¬ся отношение, а не отдельные его кортежи (записи).
Отсутствие упорядоченности записей в таблицах усложняет поиск. На практике с целью быстрого нахождения нужной записи вводят ин-дексирование полей (обычно ключевых). Создание индексных масси¬вов заключается в построении дополнительной упорядоченной инфор¬мационной структуры для быстрого доступа к записям.
Как для самих таблиц, так и для индексных массивов применяются линейные и нелинейные структуры. В качестве линейных структур индексных массивов в большинстве случаев выступают инвертиро¬ванные списки. Инвертированный список строится по схеме таблицы с двумя колонками — «Значение индексируемого поля» и «Номера строк» рисунок.
Значение индексируемого поля («год рождения») Номера строк
1970 3
1971 5,17,123,256
1972 31,32,77
1973 11,45,58, 167,231
1974 7,8,9, 10,234,235,236
Рис. Пример инвертированного списка
Инвертированные списки чаще всего применяются для индексации полей, значения которых в разных записях могут повторяться. В этом случае количество ситуаций, при которых требуется добавление или удаление строк индекса, невелико и затраты на переупорядочение индекса при изменениях данных в базовой таблице незначительны.
Строки инвертированного списка упорядочиваются по значению индексируемого поля. Для доступа к нужной записи исходной табли¬цы сначала в упорядоченном инвертированном списке отыскивается строка с требуемым значением поля, затем считываются номера соот¬ветствующих записей основной таблицы, к которым осуществляется доступ по этим номерам.
Нелинейные структуры индексов применяются для создания ин¬дексных массивов ключевых полей или тех полей, значения по кото¬рым не повторяются. При организации индексов в таких случаях чаще всего используются древовидные иерархические структуры в ви¬де В-деревьев.
4. Проектирование реляционных баз данных
Проектирование баз данных информационных систем является до¬статочно трудоемкой задачей. Оно осуществляется на основе форма¬лизации структуры и процессов предметной области, сведения о которой предполагается хранить в БД. Различают концептуальное и схемно-структурное проектирование.
Концептуальное проектирование БД ИС является в значительной степени эвр'истическим процессом. Адекватность построенной в его рамках инфологической модели предметной области проверяется опытным путем, в процессе функционирования ИС.
Перечислим этапы концептуального проектирования:
* изучение предметной области для формирования общего пред¬ставления о ней;
* выделение и анализ функций и задач разрабатываемой ИС;
* определение основных объектов-сущностей предметной области
и отношений между ними;
* формализованное представление предметной области.
При проектировании схемы реляционной БД можно выделить сле¬дующие процедуры:
*определение перечня таблиц и связей между ними;
*определение перечня полей, типов полей, ключевых полей каж¬дой таблицы (схемы таблицы), установление связей между таб¬лицами через внешние ключи;
*установление индексирования для полей в таблицах;
* разработка списков (словарей) для полей с перечислительными
данными;
* установление ограничений целостности для таблиц и связей;
* нормализация таблиц, корректировка перечня таблиц и связей. Проектирование БД осуществляется на физическом и логическом уровнях. Проектирование на физическом уровне реализуется сред¬ствами СУБД и зачастую автоматизировано.
Логическое проектирование заключается в определении числа и структуры таблиц, разработке запросов к БД, отчетных документов, создании форм для ввода и редактирования данных в БД и т. д.
Одной из важнейших задач логического проектирования БД явля¬ется структуризация данных. Выделяют следующие подходы к проек¬тированию структур данных:
*объединение информации об объектах-сущностях в рамках одной таблицы (одного отношения) с последующей декомпозицией на несколько взаимосвязанных таблиц на основе процедуры норма¬лизации отношений;
* формулирование знаний о системе (определение типов исходных данных и взаимосвязей) и требований к обработке данных, полу¬чение с помощью СА5Е-системы готовой схемы БД или даже го¬товой прикладной информационной системы;
* осуществление системного анализа и разработка структурных моделей.
Информация о работе Базы данных и системы управления базами данных