RAID-массивов

Автор работы: Пользователь скрыл имя, 22 Ноября 2011 в 18:16, курсовая работа

Описание

В переводе с английского «RAID» (Redundant Arrays of Inexpensive Disks) означает «избыточный массив независимых дисков». Этот перевод не совсем дословный, но именно содержащийся в нем смысл является правильным. Впервые термин RAID появился в 1987 году, когда исследователям из Калифорнийского Университета в Беркли удалось создать действующий массив из нескольких жестких дисков.

Содержание

Введение 3
Глава 1. Технология формирования RAID-массивов 4
1.1 Что такое RAID 4
Рисунок 1 – Плата RAID контроллера LSI LOGIC MegaRAID 5
1.2 Пять основных принципов теории RAID 5
1.3 RAID 0 уровня «чередование» (striping) 8
1.4 RAID 1 уровня «зеркалирование» (mirroring) 9
1.5 RAID массив 3 и 4 уровня 10
1.6 RAID массив 5,6 и 7 уровня 12
1.7 Линейный RAID массив 13
1.8 Составной RAID массив 14
1.9 JBOD 16
1.10 Достоинства и недостатки RAID-массивов 16
Глава 2. Восстановление RAID массивов 19
2.1 Причины выхода RAID массивов из строя 19
2.2 Способы восстановления RAID 20
2.2.1 Программное восстановление RAID на примере массивов 0 и 5 уровней 20
2.2.2Аппаратное восстановление RAID 24
Заключение 26
Список литературы 27

Работа состоит из  1 файл

RAID-массив.doc

— 356.00 Кб (Скачать документ)

     Оглавление

 

      Введение

 

      Глава 1. Технология формирования RAID-массивов

     1.1 Что такое RAID

 

     В переводе с английского «RAID» (Redundant Arrays of Inexpensive Disks) означает «избыточный  массив независимых дисков». Этот перевод не совсем дословный, но именно содержащийся в нем смысл является правильным. Впервые термин RAID появился в 1987 году, когда исследователям из Калифорнийского Университета в Беркли удалось создать действующий массив из нескольких жестких дисков.

     Первоначальное  предназначение RAID – создание на базе нескольких винчестеров диска большого объема с увеличенной скоростью  доступа. Но затем к двум основным целям добавилась третья – сохранение данных в случае отказа части оборудования. Именно эти три кита сделали RAID-массивы столь востребованными бизнесом и военными. Впрочем, за объем, скорость и надежность пришлось платить повышением стоимости и сложности систем хранения данных.

     Сейчас  все изменилось. Концепция RAID может  и должна использоваться в персональных компьютерах. Жесткие диски с интерфейсом ATA (он же IDE) стремительно дешевеют, а производители хост-контроллеров для их подключения успешно осваивают эту технологию и выпускают недорогие интегрированные RAID-контроллеры. Эта тема определенно становится актуальней и ближе конечному пользователю. Плата RAID контроллера изображена на рисунке 1. 

     

     Рисунок 1 – Плата RAID контроллера LSI LOGIC MegaRAID

     1.2 Пять основных  принципов теории  RAID

 

     В основе теории RAID лежат пять основных принципов – пять таинственных слов. Это Массив (Array), Зеркалирование (Mirroring), Дуплекс (Duplexing), Чередование (Striping) и Четность (Parity).

     Массивом называют несколько накопителей, которые централизованно настраиваются, форматируются и управляются. Логический массив – это уже более высокий уровень представления, на котором не учитываются физические характеристики системы. Соответственно, логические диски могут по количеству и объему не совпадать с физическими. Но лучше все-таки соблюдать соответствие: физический диск – логический диск. Наконец, для операционной системы вообще весь массив является одним большим диском.

     Зеркалирование – технология, позволяющая повысить надежность системы. В RAID массиве с зеркалированием все данные одновременно пишутся не на один, а на два жестких диска. То есть создается «зеркало» данных. При выходе из строя одного из дисков вся информация остается сохраненной на втором.

     За  такую стопроцентную защиту приходится дорого платить: считайте, что один винчестер у вас работает просто так, не увеличивая доступную емкость ни на Мегабайт. При этом нет никакого выигрыша в производительности. Технология зеркалирования представлена на рисунке 2. 

     

     Рисунок 2 – Технология зеркалирования 

     Дуплекс – развитие идеи зеркалирования. В этом случае так же высок уровень надежности и требуется в два раза больше жестких дисков. Но появляются дополнительные затраты: для повышения надежности в систему устанавливаются два независимых RAID контроллера. Выход из строя одного диска или контроллера не сказывается на работоспособности системы.

     Столь дорогое решение используется только во внешних RAID-массивах, предназначенных  для ответственных приложений. Технология дуплекс представлена на рисунке 3. 

     

     Рисунок 3 – Технология дуплекс 

     Чередование – отличная возможность повысить быстродействие системы. Очевидно, если чтение и запись вести параллельно на нескольких жестких дисках, можно получить выигрыш в скорости. Записываемый файл разбивается на части определенного размера и посылается одновременно на все имеющиеся накопители. В таком фрагментированном виде файл и хранится. Считывается он тоже «по кусочкам». Размер такой части может быть минимальным – 1 байт, но чаще используют более крупное дробление – по 512 байт (размер сектора). Технология чередования представлена на рисунке 4. 

     

     Рисунок 4 – Технология чередования

     Четность является альтернативным решением, соединяющим в себе достоинства зеркалирования (высокая надежность) и чередования (высокая скорость работы). Используется тот же принцип, что и в контроле четности оперативной памяти.

     Если  имеется I блоков данных и на их основе вычисляется еще один дополнительный экстраблок, из получившихся (I+1) блоков всегда можно восстановить информацию даже при повреждении одного из них. Соответственно, для создания нормального RAID-массива в этом случае требуется (I+1) жесткий диск.

     Распределение блоков по дискам точно такое же, как при чередовании. Экстраблок может записываться на отдельный накопитель, либо раскидываться по дискам.

     Обычно  каждый бит экстраблока состоит  из суммы бит всех I блоков, точнее из результата выполнения логической операции XOR. Многие помнят со школы, что XOR – удивительный оператор, при его повторном наложении мы можем получить первоначальный результат. То есть (A XOR B) XOR B = A. Это правило распространяется на любое количество операндов.

     Плюсы четности очевидны. За счет использования  чередования повышается скорость работы. При зеркалировании надежность сохраняется, но при этом «нерабочий» объем массива заметно уменьшается, он одинаков при любом количестве дисков и составляет емкость одного диска, то есть при 5 дисках в массиве пропадает всего 20% емкости.

     Но  у четности есть весомый минус. Для формирования экстраблоков требуются вычисления. Их надо делать на лету, причем с миллионами, миллиардами бит. Если это дело поручить центральному процессору, мы получим очень медленную систему. Необходимо использовать довольно дорогие платы с RAID-контроллерами, которые «берут все вычисления на себя». В случае выхода из строя одного из дисков, процесс восстановления будет не столь быстрым, как при зеркалировании.

     1.3 RAID 0 уровня «чередование» (striping)

 

     Для меня, как для пользователя персональным компьютерм, наибольший интерес представляют первые два уровня, а также их комбинация.

     В конфигурациях RAID 0 операции чтения/записи одновременно производятся на два или несколько жестких дисков, работающих одновременно, с целью максимального увеличения производительности подсистемы хранения данных. Данные в томах RAID 0 организованы в блоки, чередующиеся между дисками, благодаря чему операции чтения и записи могут выполняться параллельно. Эта методика, также называемая «чередование», является самым быстрым из уровней RAID, особенно при последовательных операциях чтения/записи с большими файлами. Конфигурация RAID 0 может быть особенно полезна при решении таких практических задач, как загрузка больших файлов в приложения для редактирования изображений, сохранение больших файлов с фильмами в приложениях для редактирования видеоматериалов или создание образов компакт-дисков или DVD-дисков с помощью специальных пакетов приложений.

     Жесткие диски в массиве RAID 0 составляют единый том, который операционная система видит как один виртуальный жесткий диск. Например, два жестких диска размером 400 ГБ в массиве RAID для операционной системы будут выглядеть как один жесткий диск размером 800 ГБ.

     На  томах RAID 0 не хранится резервная информация. Это означает, что при сбое одного жесткого диска данные теряются на всех дисках. Отсутствие резервирования также обозначается номером уровня RAID 0, означающим отсутствие резервирования. Массивы RAID 0 не рекомендуется использовать на серверах или в других средах, где главной целью является обеспечение защиты данных.

     Минимальное количество дисков: 2.

     Преимущество: Более высокая скорость передачи.

     Отказоустойчивость: Нет – при неисправности одного диска теряются все данные.

     Сфера применения: Обычно используется в  настольных ПК и рабочих станциях для обеспечения максимальной производительности работы с временными файлами и высокой скорости чтения/записи

     1.4 RAID 1 уровня «зеркалирование» (mirroring)

 

     Массив RAID 1 состоит из двух жестких дисков, данные на которых дублируются в реальном времени. Поскольку все данные дублируются, ОС рассматривает общую емкость массива RAID 1, как максимальную емкость одного диска массива. Например, два жестких диска размером 400 ГБ в массиве RAID для операционной системы будут выглядеть как один жесткий диск размером 400 ГБ.

     Основное  преимущество зеркальных наборов RAID 1 заключается в обеспечении защиты данных при неисправности одного жесткого диска. При неисправности одного жесткого диска все данные остаются доступными с другого жесткого диска и целостность данных не нарушается. При сбое диска система остается полностью работоспособной и сохраняет продуктивность.

     Производительность  массива RAID 1 выше, чем производительность одного диска, потому что данные считываются  с нескольких дисков – исходного и зеркального – одновременно. Однако для операций записи на диск не обеспечивается такая же производительность, поскольку вначале данные должны быть записаны на один диск, и лишь затем создается их зеркальная копия на другом диске.

     Минимальное количество дисков: 2.

     Преимущество: 100% резервирование данных. При неисправности  одного диска данные остаются доступными. Для сохранения резервирования рекомендуется восстановить массив с новым диском.

     Отказоустойчивость: Зеркальный набор означает, что все данные с одного диска дублируются на другом диске.

     Сфера применения: Обычно используется в  небольших системах, где емкости  одного жесткого диска оказывается  достаточной для всех приложений, требующих непрерывной работы.

     Комбинация  двух предыдущих способов – RAID Level 0+1 – позволяет соорудить дублируемый массив объединенных в один жестких дисков. Тут уже двумя дисками не обойтись, поэтому такой вариант уже трудно назвать доступным.

     1.5 RAID массив 3 и 4 уровня

 

     Третий  уровень использует чередование и выделенный диск для контроля четности. Блоки данных обычно имеют длину меньше 1024 байт. Информация распределяется на несколько дисков, а высчитанное значение по четности сохраняется на отдельный диск.

     Данные  разбиваются на подблоки на уровне байт и записываются одновременно на все диски массива кроме одного, который используется для четности. Использование RAID 3 решает проблему большой избыточности в RAID 2. Большинство контрольных дисков, используемых в RAID уровня 2, нужны для определения положения неисправного разряда. Но в этом нет нужды, так как большинство контроллеров в состоянии определить, когда диск отказал при помощи специальных сигналов, или дополнительного кодирования информации, записанной на диск и используемой для исправления случайных сбоев.

     Все скоростные преимущества чередования  сводятся на нет необходимостью записывать контрольную сумму на выделенный диск, а больше всех страдает скорость случайной записи. К достоинствам относится возможность работы массива при отказе одного из дисков.

     RAID 4 отличается от предыдущего только  размером блока данных при  чередовании. Это несколько улучшает  работу массива при случайном  чтении, но запись все равно довольно медленная. Диск с контрольными суммами является ярко выраженным «узким местом» в системе.

     Данные  разбиваются на блочном уровне. Каждый блок данных записывается на отдельный диск и может быть прочитан отдельно. Четность для группы блоков генерируется при записи и проверяется при чтении. RAID уровня 4 повышает производительность передачи небольших объемов данных за счет параллелизма, давая возможность выполнять более одного обращения по вводу/выводу одновременно. Главное отличие между RAID 3 и 4 состоит в том, что в последнем, расслоение данных выполняется на уровне секторов, а не на уровне битов или байтов.

     Так как этот уровень является компромиссным  вариантом между RAID 3 и RAID 5, то он не нашел своего места на рынке и  редко используется. Это держит цены на соответствующие контроллеры  на высоком уровне.

Информация о работе RAID-массивов