Автор работы: Пользователь скрыл имя, 05 Сентября 2012 в 02:20, курс лекций
Банк данных – организация либо структурная единица организации, предназначенная для сбора и обработки информации о предметной области. В функции банка данных входит сбор информации о первичной области, ее обработка и хранение, а также генерация на ее основе результирующей информации. Следует отметить, что иногда технологии обработки информации, характерные для банков данных реализуются не в «чистом» виде, а как составная часть других систем, например, в задачах САПР (Систем Автоматизированного ПPоектирования).
Информация о состоянии предметной области, которая обрабатывается банком данных, накапливается и хранится в базе данных.
1.Понятия
баз данных (БД). Типология
и классификация. Информационные,
программные, технические
и организационные составляющие
БД.
Банк данных – организация либо структурная единица организации, предназначенная для сбора и обработки информации о предметной области. В функции банка данных входит сбор информации о первичной области, ее обработка и хранение, а также генерация на ее основе результирующей информации. Следует отметить, что иногда технологии обработки информации, характерные для банков данных реализуются не в «чистом» виде, а как составная часть других систем, например, в задачах САПР (Систем Автоматизированного ПPоектирования).
Информация о состоянии предметной области, которая обрабатывается банком данных, накапливается и хранится в базе данных.
База данных (далее по тексту – БД) – совокупность данных о состоянии предметной области на машинном носителе. Структуру БД, соответствующую данной предметной области, иногда называют моделью данных.
Для выполнения своих задач банку данных необходимы следующие компоненты.
2. Программное обеспечение. Для банков данных, как и вообще для программно- аппаратных комплексов подобной сложности необходимо развитое и многоуровневое ПО. Во – первых, это операционное программное обеспечение. Оно должно обеспечивать функционирование и каждого рабочего места и обмен информацией между компьютерами.
Благодаря стандартизации современных сетевых протоколов, возможно применение в рамках одной локальной сети различных операционных систем и даже различных типов компьютеров (Windows различных вариантов и NetWare, компьютеры Intel – Mackintosh – Alpha и т.д.) Как правило, для решения объемных задач характерно как раз применение нескольких операционных систем, как минимум, для рабочих станций и сервера. Во – вторых, это СУБД (системы управления базами данных), функционирующие в данной операционной среде. Возможно применение нескольких различных СУБД при условии обеспечения общего доступа к базе данных. В – третьих, приложения, разработанные для определенных СУБД и использующие их поддержку для функционирования. Как правило, в рамках одного банка данных работают несколько приложений, обрабатывающие различные аспекты информационной модели. Именно наличием большого числа ранее разработанных приложений и высокой стоимостью разработки и внедрения новых оправдывается необходимость функционирования нескольких, зачастую устаревших, СУБД в одном банке данных.
Организационное обеспечение. В общем случае персонал банка данных можно разделить на следующие группы: группа ввода информации, занимающаяся вводом первичной документации в базу данных; группа вывода, которая формирует выходную информацию и получает выходные документы для передачи их «конечным потребителям» информации; группа обслуживания, поддерживающая бесперебойное функционирование аппаратного и программного обеспечения; группа администрирования, функциями которой являются проблемы разграничения доступа, а также решение вопросов о необходимости изменений информационной модели и изменений существующих приложений либо разработки новых. В таком или почти таком «классическом» виде существовали банки данных, основой аппаратного обеспечения которых были мейнфреймы. Развитие персональных ЭВМ наложило свой отпечаток на структуру банка данных, выразившийся в полном либо частичном отказе от применения профессиональных операторов при вводе/выводе информации за счет передачи их функций конечным «потребителям» информации.
2.Системы
управления базами данных (СУБД),
классификация и критерии
их выбора.
База данных – это информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым набором свойств.
Программное обеспечение, предназначенное для работы с базами данных, называется система управления базами данных (СУБД). СУБД используются для упорядоченного хранения и обработки больших объемов информации.
СУБД организует хранение информации таким образом, чтобы ее было удобно:
просматривать, пополнять, изменять, искать нужные сведения, делать любые выборки, осуществлять сортировку в любом порядке.
Классификация СУБД
По типу управляемой базы данных СУБД разделяются на:
Иерархическая модель БД состоит из объектов с указателями от родительских объектов к потомкам, соединяя вместе связанную информацию. Иерархические БД могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй — объекты второго уровня и т. д. Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможно, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами.
К основным понятиям сетевой модели БД относятся: уровень, элемент (узел), связь. Узел — это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Сетевая СУБД, графическое представление связей В сетевой структуре каждый элемент может быть связан с любым другим элементом. Сетевые БД подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию. Если необходимо изменить структуру данных, то нужно изменить и приложение.
Реляционная база данных, по сути, представляет собой двумерную таблицу.
Столбцы таблицы называются полями: каждое поле характеризуется своим именем и топом данных. Поле БД – это столбец таблицы, содержащий значения определенного свойства.
В реляционной БД используются четыре основных типов полей:
Числовой, Символьный (слова, тексты, коды и т.д.), Дата (календарные даты в форме «день/месяц/год»), Логический (принимает два значения: «да» - «нет» или «истина» - «ложь»).
Строки таблицы являются записями об объекте. Запись БД – это строка таблицы, содержащая набор значения определенного свойства, размещенный в полях базы данных.
Системы управления базами данных позволяют объединять большие объемы информации и обрабатывать их, сортировать, делать выборки по определенным критериям и т. п. Реляционная база данных, по сути, представляет собой двумерную таблицу.
Объектно-реляционная СУБД (ОРСУБД) — реляционная СУБД (РСУБД), поддерживающая некоторые технологии, реализующие объектно-ориентированный подход.
Разница
между объектно-реляционными и объектными
СУБД: первые являют собой надстройку
над реляционной схемой, вторые же
изначально объектно-ориентированы. Главная
особенность и отличие
можно выделить несколько групп критериев:
Моделирование данных, Особенности архитектуры и функциональные возможности, Контроль работы системы, Особенности разработки приложений, Производительность, Надежность, Требования к рабочей среде, Смешанные критерии
Моделирование данных. Используемая модель данных. Существует множество моделей данных; самые распространенные - иерархическая, сетевая, реляционная, объектно-реляционная и объектная. Вопрос об использовании той или иной модели должен решаться на начальном этапе проектирования информационной системы.
Триггеры
и хранимые процедуры. Триггер - программа
базы данных, вызываемая всякий раз
при вставке, изменении или удалении
строки таблицы. Триггеры обеспечивают
проверку любых изменений на корректность,
прежде чем эти изменения будут
приняты. Хранимая процедура – программа,
которая хранится на сервере и
может вызываться клиентом. Поскольку
хранимые процедуры выполняются
непосредственно на сервере базы
данных, обеспечивается более высокое
быстродействие, нежели при выполнении
тех же операций средствами клиента
БД. В различных программных
Средства поиска.
Предусмотренные типы данных. Здесь следует учесть два фактически независимых критерия: базовые или основные типы данных, заложенные в систему, и наличие возможности расширения типов.
Реализация языка запросов. Все современные системы совместимы со стандартным языком доступа к данным SQL-92, однако многие из них реализуют те или иные расширения данного стандарта.
Особенности архитектуры и функциональные возможности.
Мобильность.
Мобильность – это
Масштабируемость. При выборе СУБД необходимо учитывать, сможет ли данная система соответствовать росту информационной системы, причем рост может проявляться в увеличении числа пользователей, объема хранимых данных и объеме обрабатываемой информации.
Распределенность. Основной причиной применения информационных систем на основе баз данных является стремление объединить взгляды на всю информацию организации.
Самый простой и надежный подход - централизация хранения и обработки данных на одном сервере. К сожалению, это не всегда возможно и приходится применять распределенные базы данных. Различные системы имеют разные возможности управления распределенными базами данных.
Сетевые возможности. Многие системы позволяют использовать широкий диапазон сетевых протоколов и служб для работы и администрирования.
Контроль работы системы
Контроль
использования памяти компьютера. Система
может иметь возможность
Автонастройка. Многие современные системы включают в себя возможности самоконфигурирования, которые, как правило, опираются на результаты работы сервисов самодиагностики производительности. Данная возможность позволяет выявить слабые места конфигурации системы и автоматически настроить ее на максимальную производительность.
Особенности разработки приложений.
Многие
производители СУБД выпускают также
средства разработки приложений для
своих систем. Как правило, эти
средства позволяют наилучшим образом
реализовать все возможности
сервера, поэтому при анализе
СУБД стоит рассмотреть также
и возможности средств
Средства проектирования. Некоторые системы имеют средства автоматического проектирования, как баз данных, так и прикладных программ. Средства проектирования различных производителей могут существенно различаться.
Многоязыковая поддержка. Поддержка большого количества национальных языков расширяет область применения системы и приложений, построенных на ее основе.
Поддерживаемые языки программирования. Широкий спектр используемых языков программирования повышает доступность системы для разработчиков, а также может существенно повлиять на быстродействие и функциональность создаваемых приложений.
Производительность.
Рейтинг TPC (Transactions per Cent). Для тестирования производительности применяются различные средства, и существует множество тестовых рейтингов. Одним из самых популярных и объективных является TPC-анализ производительности систем. Фактически TPC анализ рассматривает композицию СУБД и аппаратуры, на которой эта СУБД работает. Показатель TPC – это отношение количества запросов обрабатываемых за некий промежуток времени к стоимости всей системы.
Возможности параллельной архитектуры. Для обеспечения параллельной обработки данных существует, как минимум, два подхода: распараллеливание обработки последовательности запросов на несколько процессоров, либо использование нескольких компьютеров-клиентов, работающих с одной БД, которые объединяют в так называемый параллельный сервер.