Автор работы: Пользователь скрыл имя, 22 Ноября 2011 в 18:16, курсовая работа
В переводе с английского «RAID» (Redundant Arrays of Inexpensive Disks) означает «избыточный массив независимых дисков». Этот перевод не совсем дословный, но именно содержащийся в нем смысл является правильным. Впервые термин RAID появился в 1987 году, когда исследователям из Калифорнийского Университета в Беркли удалось создать действующий массив из нескольких жестких дисков.
Введение 3
Глава 1. Технология формирования RAID-массивов 4
1.1 Что такое RAID 4
Рисунок 1 – Плата RAID контроллера LSI LOGIC MegaRAID 5
1.2 Пять основных принципов теории RAID 5
1.3 RAID 0 уровня «чередование» (striping) 8
1.4 RAID 1 уровня «зеркалирование» (mirroring) 9
1.5 RAID массив 3 и 4 уровня 10
1.6 RAID массив 5,6 и 7 уровня 12
1.7 Линейный RAID массив 13
1.8 Составной RAID массив 14
1.9 JBOD 16
1.10 Достоинства и недостатки RAID-массивов 16
Глава 2. Восстановление RAID массивов 19
2.1 Причины выхода RAID массивов из строя 19
2.2 Способы восстановления RAID 20
2.2.1 Программное восстановление RAID на примере массивов 0 и 5 уровней 20
2.2.2Аппаратное восстановление RAID 24
Заключение 26
Список литературы 27
RAID 5 так же, как и RAID 3, математически вычисляет значение "четность" с каждых двух дисков, но делает это более эффективно. При аварии одного из дисков контрольная сумма будет использована для восстановления потерянных данных. В массиве RAID 5 хранение данных "четности" осуществляется на всех дисках. При работе с RAID 5 увеличивается емкость для хранения информации благодаря использованию всех дисков в массиве и в то же время возрастает безопасность данных. Постоянная проверка данных обеспечивает наивысшую защиту от повреждения кластеров и других помех. Требует наличия как минимум 3-х накопителей.
Наиболее распространенный в системах хранения данных – пятый уровень. Он характеризуется применением чередования и четности. В отличие от RAID 3, контрольные суммы не хранятся на одном диске, а разбрасываются по всем, что позволяет значительно поднять скорость записи. Главный принцип распределения экстраблоков: они не должны располагаться на том же диске, с которого была зашифрована информация.
Надежность и скорость работы такой системы оказываются очень даже высокими. При восстановлении информации всю работу на себя берет RAID контроллер, так что операция проходит довольно быстро.
Для
некоторых особо критичных
Используются все те же технологии чередования и четности. Но контрольная сумма вычисляется два раза и копируется на два разных диска. В итоге данные окажутся потерянными только в случае выхода из строя сразу трех жестких дисков. По сравнению с RAID 5 это более дорогое и медленное решение, которое может показать себя разве что при случайном чтении. На практике RAID 6 почти не используется, так как выход из строя сразу двух дисков – слишком редкий случай, а повысить надежность можно другими способами.
В отличие от остальных уровней, RAID 7 не является открытым стандартом, столь звучное и выгодное название выбрала для своей модификации RAID 3 компания Storage Computer Corporation. Улучшения заключаются в использовании асинхронного чередования, применении кэш-памяти и специального высокопроизводительного микропроцессора.
Обеспечивая такой же, как в RAID 3, уровень надежности, RAID 7 значительно выигрывает в скорости. Недостаток у него один, но очень серьезный– огромная цена, обусловленная монополией на изготовление контроллеров.
Линейный RAID представляет собой простое объединение дисков, создающее большой виртуальный диск. В линейном RAID, блоки выделяются сначала на одном диске, включенном в массив, затем, если этот заполнен, на другом и т.д. Такое объединение не даёт выигрыша в производительности, так как скорее всего операции ввода/вывода не будут распределены между дисками. Линейный RAID также не содержит избыточности и, в действительности, увеличивает вероятность сбоя — если откажет всего один диск, из строя выйдет весь массив. Ёмкость массива равняется суммарной ёмкости всех дисков.
Второй уровень RAID умер, так и не родившись. Все те же умельцы из Беркли предложили использовать одновременно две технологии – побитовое чередование и код Хамминга для восстановления ошибок. В теории это должен быть неплохой по надежности и рабочей емкости массив, построенный из 14 или 39 дисков (!). Часть дисков (10 или 32) используется для хранения данных с чередованием, остальные – для хранения высчитанных контрольных сумм. Реализация таких систем требовала специальных дорогостоящих контроллеров, которые так и не прижились на рынке. В итоге RAID 2 сейчас не используется. Но идея красивая.
У основных уровней RAID есть свои достоинства и недостатки. И вполне понятно, почему инженеры стали мечтать о таком RAID, который бы объединял достоинства нескольких уровней. Составной RAID массив – это чаще всего сочетание быстрого RAID 0 с надежным RAID 1, 3 или 5. Итоговый массив действительно обладает улучшенными характеристиками, но и платить за это приходится повышением стоимости и сложностью решения.
Составной
RAID строится так: сначала диски разделяются
на наборы (set). Затем на основе каждого
из наборов строятся простые массивы.
А завершается все объединением этих
массивов в один мегамассив. Запись типа
X+Y означает, что сначала диски объединены
в RAID уровня X, а затем несколько RAID X массивов
объединены в RAID уровня Y.
RAID 0+1 (01) и 1+0 (10).
RAID
0+1 часто называют «зеркалом
RAID
0+1 обладает высокой скоростью
работы и повышенной
Основной недостаток этих массивов – низкий процент использования емкости накопителей – всего 50%. Но для домашних систем именно RAID 01 или 10 может оказаться оптимальным решением.
RAID 0+3 (03) и 3+0 (30).
По идее сочетание чередования и RAID 3 дает выигрыш в скорости, но он довольно мал. Зато система заметно усложняется. Наиболее простой уровень 3+0. Из двух массивов RAID 3 строится страйп, и минимальное количество требуемых дисков – 6. Получившийся RAID 3+0 с точки зрения надежности лучше, чем 0+3.
Достоинства этих комбинаций в довольно высоком проценте использования емкости дисков и высокой скорости чтения данных. Недостатки – высокая цена, сложность системы.
RAID 0+5 (05) и 5+0 (50).
Что будет, если объединить чередование с распределенной четностью с обыкновенным чередованием? Получится быстрая и надежная система. RAID 0+5 представляет собой набор страйпов, на основе которых построен RAID 5. Такая комбинация используется редко, так как практически не дает выигрыша ни в чем. Широкое распространение получил составной RAID массив 5+0.
Чаще всего это два массива RAID 5, объединенных в страйп. Такая конфигурация позволяет получить высокую производительность при работе с файлами малого размера. Типичный пример – использование в качестве WEB-сервера.
RAID 1+5 (15) и 5+1 (51).
Этот уровень построен на сочетании зеркалирования или дуплекса и чередования с распределенной четностью. Основная цель RAID 15 и 51 – значительное повышение надежности. Массив 1+5 продолжает работать при отказе трех накопителей, а 5+1 - даже при потере пяти из восьми жестких дисков! Платить приходится большим количеством неиспользуемой емкости дисков и общим удорожанием системы.
Чаще всего для построения RAID 5+1 используют два контроллера RAID 5, которые зеркалируют на программном уровне, что позволяет снизить затраты.
Если пользователю нужен просто один логический диск гигантского размера, без зеркалирований, чередования и четности. Тогда это уже не RAID, а JBOD – Just A Bunch Of Disks. Реализовать этот режим способен простейший контроллер или даже программная реализация контроллера.
Есть ли у него преимущества, если JBOD не повышает ни быстродействия, ни надежности? Есть. По крайней мере, для работы используется все доступное пространство жестких дисков. К тому же, в случае выхода из строя одного из жестких дисков, информация на других не повреждается.
RAID-массивы обеспечивают либо отказоустойчивость, либо производительность, либо и то, и другое одновременно. Причем на дисках, поддерживающих горячую замену (она же hot-plug SCSI, SATA), выключать компьютер для смены вышедшего из строя винчестера не обязательно. Это актуально не только для серверов, но и для рабочих станций, занимающихся обработкой цифрового видео или другими продолжительными расчетами, которые затрачивают десятки часов машинного времени и не могут быть прерваны. Остановка системы означает, что все придется начинать заново и отработанные часы потрачены впустую. Также объединение нескольких дисков в одни позволяет создавать разделы большого размера. Это весьма актуально на RAID 0 при работе с морально устаревшими (следовательно, дешевыми) винчестерами на несколько Гбайт. Объединив их вместе, мы получим огромный раздел, доставшийся нам практически задаром. Вот, собственно, и все преимущества RAID-массивов.
Теперь мне бы хотелось рассмотреть недостатки этой технологии. RAID-массив страхует только от аппаратного выхода одного (реже - двух) жестких дисков из строя, он не в состоянии противостоять другим типам разрушения данных, таким как вирусы, ошибки оператора, хакерские атаки, сбои операционной системы и ее окружения. А при выходе из строя блока питания или падения компьютера со стола (например), все диски массива обычно вылетают разом. Таким образом, вне зависимости от наличия или отсутствия RAID-массивов регулярное резервирование данных все равно остается обязательным. А если есть резервная копия, тогда какая польза от этой технологии. Восстанавливать же информацию с RAID-массивов намного сложнее. Их поддерживают далеко не все лечащие утилиты, а фирмы, специализирующиеся на восстановлении, запрашивают за работу двойную-тройную цену, если вообще за нее берутся.
Причем RAID-массив может работать только с тем контроллером, которым он был создан. Контроллеры различных производителей (и даже разные модели контроллеров одного и того же производителя) несовместимы друг с другом, и если навернется контроллер, то прощай, весь дисковый массив. Хорошо, если RAID-контроллер внешний, тогда его можно будет, по крайней мере, попытаться купить (именно попытаться, так как он давно уже может быть снят с выпуска и предан забвению). А вот при выходе из строя RAID-контроллера на материнской плате (равно как и любого другого ее жизненно важного компонента), наступает точка кипения – нам придется купить точно такую же материнскую плату, при условии что их модельные ряды обновляются каждый сезон и старые модели исчезают из прайс-листов и складов со скоростью торнадо. Идея купить несколько внешних RAID-контроллеров про запас, конечно, хорошая (если не учитывать финансовую сторону дела), но глубоко неправильная, так как современные микросхемы очень часто выходят из строя из-за сложных физико-химических процессов, разрушающих их изнутри. Чего только стоит один рост кристаллов в подложке, который может привести к утечкам, вызывающим настырные сбои или даже полную неработоспособность. Причем поскольку нагрев и другие физико-механические воздействия разрушают кристаллы еще в зародыше (точнее, тормозят их развитие), то контроллер, мирно покоящийся на полке, имеет все шансы выйти из стоя раньше, чем тот, который постоянно находится в работе. Наконец, у дисков, подключенных к RAID-контроллерам, очень сложно, а иногда и вообще невозможно прочитать показания S.M.A.R.T. (системы самотестирования и мониторинга). А читать их крайне полезно, поскольку по ним можно с некоторой вероятностью предсказать, сколько еще винчестеру осталось работать, и узнать его температуру. Когда диск одни, за его температуру можно не волноваться. А вот массив из четырех тесно расположенных дисков (а по другому их расположить даже в BigTower’е никак не получается) способен нагреваться до весьма высоких температур, требующих немедленной установки дополнительных систем охлаждения.
Наиболее распространённой причиной выхода из строя дисковых массивов является халатность системных администраторов, рассчитывающих на то, что «в одну воронку бомба дважды не падает». Во время работы, например RAID 5, выходит из строя один из дисков. Массив продолжает функционировать, но уже с заметным уменьшением скорости. Системный администратор, заметив сбой в работе накопителя, не очень спешит предпринимать активные действия, т.к. рассчитывает на то, что массив в таком виде еще сможет поработать некоторое время. Это порой оказывается заблуждением.
Если у Вас выходит из строя один из дисков, лучше всего немедленно произвести резервное копирование особо важных данных и потом, заменив один из накопителей, произвести ребилд массива.
Почему пришлось отметить то, что необходимо предварительно произвести бэкап? Потому что при попытке ребилда массива, иногда случается такое, что процесс «зависает». Как правило, это происходит, если в процессе чтения\записи на одном из дисков обнаруживается бэд-блок, и контроллер не может вычитать информацию из сектора. В результате, после длительного и бесполезного ожидания, сервер перегружают. После чего выясняется, что массив полностью «развалился». Зависание в таких случаях, вероятнее всего, связано с некорректной обработкой исключительной ситуации. Как правило, описанное явление более характерно для дешевых моделей контроллеров, но встречается также и при использовании дорогого «железа».
Ещё одной распространённой причиной отказа массивов, является одновременный переход нескольких дисков в режим off-line. Как показала практика, чаще всего это происходит из-за проблем со SMART, или накопления бэд-блоков. Пока их количество не превысит определённого значения, диск работает корректно, но в один прекрасный момент массив перестает запускаться. И вроде бы все хорошо, и диск, судя по звуку, нормально стартует, и контроллером правильно определяется, но вот только непонятно, почему статус у диска off-line, массив не стартует и данные не отдает. Все из-за того, что контроллер не может считать необходимые данные с диска, либо, диагностируя SMART, определяет диск как «мертвый».
Можно привести ещё множество примеров сбоев в работе массивов, но что делать, если таки это свершилось? Информация потеряна, её необходимо восстановить.