#1
|
|
Вес репутации:
0
Регистрация: 27.02.2009
Адрес: Москва
Сообщений: 7,249
Сказал(а) спасибо: 574
Спасибок 2,673
в 1,898 сообщениях |
Ликбез по жестким дискам -
23.11.2009, 16:34
Жесткие диски ...
В понимании нынешнего человека это такая коробочка, которая вмещает в себя огромное количество информации за умеренные деньги. Лет 20 назад 8-мегабайтный HDD стоил порядка 4 000 долларов, да и то выпускался чуть ли не штучно. Жесткие диски эволюционировали наряду с CPU и GPU, расширив свои возможности для конечного пользователя. Вопрос в том что возможности современных хардов часто банально не используются или используются неправильно. В мою бытность работником ХМемори очень частой была ситуация следующего характера : Приходит человек, вычитавший на просторах Рунета тот вроде бы очевидный факт что жесткий диск Western Digital Raptor очень быстр. Так то оно так, но при цене за 300-гб модель почти в 7 000 рублей на тот момент,начинаю объяснять что собрать рейд уровня 0 на 750-гигабайтных хардах выйдет и дешевле, и быстрее, и больше по объему (почти в 5 раз)-но натыкаюсь на полное непонимание человеком «Что есть рейд и как его едят?». Поскольку такая ситуация, увы, не редка, сегодня на ваш суд я представлю свой обзор всех основополагающих параметров современных HDD. Мы узнаем насколько важен и двуличен S.M.A.R.T. , узнаем разницу между программным и аппаратным RAID-массивом, пробежимся по нюансам всех ныне известных массивов-начиная от простейшего JBOD и заканчивая монструозным RAID5, узнаем почему человека, купившего винчестер со скоростью вращения шпинделя на 15 000 оборотов в минуту под свою мать на Nforce 790i ждет горькое разочарование... В общем, как говорится-поехали! Итак, жесткие диски. Не буду вдаваться в подробности почему жесткие диски стали называть винчестерами-это долгая и романтическая история. Вместо этого лучше пробежимся по остальным параметрам современных HDD 1. Производитель. Ну что тут сказать. Есть «брендовые» производители, а есть обычные рабочие лошадки. К первым я с удовольствием отнесу компании Seagate и Western Digital-эти две компании зачастую задают тон на рынке HDD (в сегменте винчестеров для настольных ПК), и настолько наполняют свои диски всякими примбамбасами, что иногда они даже отказываются нормально работать! (Диски Seagate серии 7200.11), что, впрочем, бывает редко. Не знаю почему, но мое мнение как пользователя-на стороне Western Digital-из 11 жестких дисков в системе 10-компании WD. Ко вторым же я отнесу фирмы Hitachi и Samsung-именно харды этих марок наиболее массовы в сегменте тех, кому не нужен бренд а нужен хард. У меня были и Самсунги и Хитачи-могу сказать одно-харды как харды. Звезд с неба не хватают, но свою цену отрабатывают. 2. Линейки. Тут смогу рассмотреть исключительно WD и Seagate. У WD все крайне просто-для настольных ПК модели имеют индекс Caviar (Икра, однако), для ноутбуков-Scorpio. Для ПК есть модельные ряды WD Caviar Black, Caviar Blue, Caviar Green, в ноутбуках же-Scorpio Blue и Scorpio Black, т.е. весь модельный ряд представлен 5 линейками продуктов: WD Caviar Black-тут все просто-флагманы. Самые быстрые HDD в линейке. 32\64 мб кэша и прочие вкусности. Сюда относятся как модели со скоростью 7200 об\мин (которые так и зовутся-Caviar Black), так и более совершенные Raptor'ы, скорость вращения которых достигает 10 000 об\мин (в ущерб емкости), а так же модели, созданные специально для RAID-массивов (имеют индекс RE-Raid Edition). WD Caviar Blue-мейнстрим. Харды для всех, больше добавить нечего. Железные 7200 оборотов, почти массово-16 мб кэша. Обычная рабочая лошадка WD Caviar Green-крайне интересная линейка, созданная WD на волне модной ныне борьбы за сохранение окружающей среды. Основная «фича» данных хардов-в том что они якобы способны занижать скорость вращения в моменты простоя. Не знаю, не вскрывал и не замерял, но суть в том что даже если эта технология и работает, то хард в скорости (по сравнению с серией Blue)чтения-записи теряет крайне мало, но при этом он ест меньше энергии и гораздо тише работает, причем это факт, подтвержденный всеми. Народ, как говорится, просек, и теперь модель WD10EADS-однозначный бестселлер. WD Scorpio Blue-харды для ноутбуков линейки «для всех». Я себе такой прикупил-на 500 гб-поиграться. Могу сказать лишь одно слово-ВЕЩЬ! Работает КРАЙНЕ тихо, почти не вибрирует, а слово «нагрев» у него из прошивки вырезали при рождении. Плюс 500 гб объема...Крайне легок (около 100 грамм), так что при желании можно вместо флешки таскать. В общем для ноутбуков-очень достойный выбор. WD Scorpio Black-Аналогично с «полноразмерными» братьями, Black-это топ для ноутбуков. Как всегда,проигрывая в емкости, выигрывает в скорости. Но если для настольного компа я рекомендую брать или Caviar Black или Caviar Green, то тут все не так однозначно. Смотрите по предпочтениям-что важнее, «+30 к скорости» (Black) или «+100 к объему» (Blue). Я бы брал Blue по причине что ноут-все же автономное устройство, и время работы у него выходит на передний план, а Blue экономичнее на порядок. Перед тем как перейти к Seagate хотел бы поделиться своими взглядами на WD. Как я уже сказал, 10 из 11 хардов в моей машине-этой компании. Это 2 терабайтных топовых Caviar Black (искренне надеюсь что вы еще не запутались в индексах, но если что-Black это наикрутейшие, Blue это «для всех», Green-экономичные), 2 уже упомянутых RaidEdition третьей серии по 750 гб, 4 WD10EADS-терабайтных «гринов», упомянутый ноутбучный 500 гигабайтник и старый-добрый Raptor на 150 ГБ (как выяснилось, на него крайне классно пишутся ролики FRAPS). Могу сказать что харды имеют в некоторых случаях очень кусачую цену, однако уверяю-не жалею ни цента. Тишина,мощь и надежность-вот девизы жестких дисков WD. Крайне ими доволен и смело рекомендую вам. Прим.-насколько я знаю, другой специалист по HDD, выросший в пенатах Хмемори-Alexxx650, собрал свой монструозный 6-тидисковый кластер на основе WD RE2-дисков. Делаем выводы если думаете что я вас обманываю. Итак, с WD разобрались-теперь вы знаете чем WD Caviar Black лучше WD Caviar Green, а чем хуже. Перейдем к продукции Seagate? Итак, Seagate... Морально устаревшие модели линеек 7200.* , а так же 7200.10 мы рассматривать не будем,рассмотрим лишь флагманов нынешнего и прошлого поколений-7200.12 и 7200.11 соответственно. Начнем. В большинстве случае хард от Сигейта имеет похожую на такую маркировку: ST31000340AS Соответственно по данной надписи опытный человек поймет что это Seagate (ST) , относящийся к третьему поколению (3), имеющий емкость 1000 гб (1000) и имеющая индекс производителя 340AS. Собственно отталкиваясь от этого, можно легко подсчитать, глядя на ассортимент дисков от сигейта, что сейчас на рынке массово представлено 4 линейки-это 7200.11 *AS, 7200.11 *NS, 7200.12 *AS и 7200.12 *NS. А в чем различия спросите вы? Да собственно ни в чем, просто у Seagate была крайне неприятная ситуация с серией 7200.11, вызванная ошибкой микрокода контроллера записи у HDD, что приводило к потере данных после выключения (даже корректного) компьютера. Серия 7200.12-это серия с исправленным данным багом, то есть архитектурно харды серий 7200.11 и 7200.12- близнецы-братья, что, впрочем, не мешает мне клеймить харды серии 7200.11 как «вращающийся глюк» и крайне не рекомендовать их к покупке (у меня таких было 4-до сих пор в ящике лежат, ох я с ними намучился). Так что в сухом остатке из массовых HDD имеем у Seagate лишь 2(!) линейки 3.5-винчестеров-это 7200.12 *AS и 7200.12 *NS. Различия между ними в деталях-NS относятся к решениям для серверов начальных уровней (что выражается в большей надежности и расширенной поддержке протоколов NCQ), а AS-мейнстримовая линейка, для обычных компьютеров. То есть фактически, если вы разумный человек и вдруг решили купить Seagate, то выбор у вас ограничен лишь емкостью, т.к. модель в конечном итоге будет все равно 7200.12 *AS (ну вы же не будете брать хард с серверными примочками для обычного компа, верно?). От себя хочу сказать вот что. Серией 7200.11 компания Seagate тотально испортила себе репутацию, и отголоски этого будут звучать еще долго. Тем не менее, серия 7200.12-превосходные по ТТХ жесткие диски, которые достойны занять место внутри вашего системника. Это мое мнение. Стоит сказать пару слов и о компаниях Samsung и Hitachi. У меня был и Самсунг, вращался и Хитачи. Могу сказать откровенно-то что в моем компе вращается 10 WD-это исключительно заслуга маркетологов. Мне просто нравится иметь «зеленые» жесткие диски, успокаивает душу. Но при этом если вы простой трудяга, которому от железки нужно только одно-работоспособность, смело плюйте на тех кто говорит что Hitachi или Samsung-плохие диски. Это замечательные диски, инженеры обеих компаний сделали достойные продукты...ну а мнение о них как о «второсорте»-это лишь недочет служб маркетинга этих компаний. Диски не виноваты ведь...Большего к сожалению сказать не могу, но надеюсь что был услышан. Это-достойный товар, поверьте мне. Я, безусловно, сторонник WD до мозга костей, но это не дает мне права быть не объективным по отношению к продуктам других фирм, верно? Тем более что на примере Hitachi можно сказать про серверный сегмент-лучше них HDD со скоростью вращения 15 000 об\мин не делает никто, и это факт, а та же WD там и рядом не плавала. Итак, по фирмам прошлись, пусть и вкратце, но время идти дальше-нас ждут параметры дисков. Современный диск складывается из следующих параметров (точнее, важных параметров)-количества блинов, скорости вращения шпинделя, кэша, объема, интерфейса. Возьму на себя труд рассказать вкратце о каждом из этих параметров, со своей ремаркой конечно. Итак,по порядку. Количество блинов. Ну тут все ясно-количество внутренних блинов диска, на которые собственно и пишется информация. Скажем, у меня все мои WD10EADS-двублинные, значит каждая пластина несет на себе 500 гб информации-по 250 гб на сторону. Сейчас развернулась настоящая погоня за двублинными терабайтниками. Заявляю откровенно-это все ерунда. От большего количества блинов у вас, да, вырастет энергопотребление, и да, упадет скорость чтения-записи. Но неужели эти жалкие доли процента стоят погони за двублинником? Мне просто повезло-в ХМ завезли 5 двублинников, 4 из которых я мгновенно выкупил, вот и все. А так-смотрите чтобы у диска было не 4 блина, а вот 3 или 2-уже не играет особой разницы. Это мое мнение. Скорость вращения шпинделя. Она бывает статическая и динамическая, первая встречается чаще. Статическая-это когда жесткий диск с момента старта раскручивает диски до заданной скорости и поддерживает ее такой весь цикл работы системного блока, динамическая же скорость это если диск при старте раскручивается до «паспортной» величины, а затем, в момент простоев, снижает скорость (уже упоминалось в описании WD Caviar Green) для уменьшения шума и энергопотребления. Сейчас создаются HDD со скоростями 5400,7200,10 000,15 000,20 000 об\мин. 5400-нетрудно догадаться, ноутбучные винчестеры (а так же сниженная скорость работы Green-серии WD), 7200-мейнстримовые диски, 10 000-»полусерверные» HDD от WD (они же Raptor'ы), 15 000-уже сугубо серверные диски с интерфейсом SAS, ну а 20 000-прототипы дисков которые будут работать в системах iSCSI. Поскольку iSCSI явно выходит за рамки повествования о дисках,а про 7200 и 5400 все ясно-это стандарты де-факто индустрии, остановлюсь подробнее на дисках 10 000 и 15 000 об\мин. Прежде всего хочу отметить-скорость в данных дисках достигнута путем снижения емкости. Самый лучший Раптор (10 000) сейчас вмещает 300 гб информации, а что касается пятнадцатитысячников, то тут купить диск на 137 гб-уже большая удача,обычно приходится довольствоваться 74 гб. Далее-скорость. С «пятнашками» все ясно-серверы это двигатели индустрии, там все самое лучшее. С «десятками» все гораздо сложнее, а поскольку для домашнего пользования если берут-то их, но никак не SAS-овские винчестеры, то остановлюсь тут подробнее. У первых рапторов была проблема в виде кэша-16 мб ставили далеко не на все винчестеры, кое-где было и 8, что приводило к тормозам. То есть скорость вращения «уперлась» в кэш. Ладно, исправим-подумали в WD, и стали поголовно ставить на все новые Рапторы 16 мб кэша, которые в наш век тотальных 32 мб смотрятся минимум анахронизмом. И возникла парадоксальная ситуация-одиночный Raptor быстр, чертовски быстр, но за эту же цену можно взять 2 7200-HDD, которые в сумме его обгонят по всем параметрам (вспоминаем мое вступление). Конечно можно объединить и Рапторы, но при цене за диск порядка 7 000 рублей 2 диска-это уже 14 000! Округлим-15 000. За 15 000 мы получаем 600 гб быстрой дисковой подсистемы, но за эти же деньги можно поставить не самый плохой SSD, который в разы быстрее любого раптора. Да,жертвуем объемом, но если нужен объем-за те же 15 000 ставим 4 диска 7200 в массив, что опять же будет быстрее чем 2 раптора, а объем может достигнуть почти 3 терабайт! То есть если нужна скорость-ставим SSD, если нужен объем-ставим несколько 7200-дисков. На фоне такой простой арифметики далекое будущее Рапторов лично мне видится несколько туманным, когда уже SSD попадут в мейнстрим. Рапторы-это баланс между скоростью SSD и емкостью мейнстримовых дисков...Но вот цена... Слишком дорого за 300 гб и слишком медленно для SSD... Безусловно Рапторы найдут свою нишу. Они чертовски быстры как диски и, чего уж там греха таить, красивы, потрясающе красивы. Но одна красота не перекрывает вопросы целесообразности. Идеальным применением Рапторов я вижу долговременные серверы с высокой скоростью считывания поточных данных-SSD еще не выползли из пеленок в вопросах деградации чипов, а 4 Раптора против 4 7200-дисков в любом виде чтения или записи будут быстрее однозначно. Пусть и дороже, но кто экономит на серверах? Итак, с десятитысячниками разобрались, идем дальше. Кэш. Самый простой принцип работы кеша-это хранение данных не только запрошенного сектора, но и нескольких секторов после него. Как правило, чтение с жесткого диска происходит кластерами (де-факто-4096 единиц). Когда происходит запрос к жесткому диску, контроллер накопителя в первую очередь проверяет, находятся ли запрашиваемые данные в кеше, и, если это так, то мгновенно выдает их компьютеру, не производя физический доступ к поверхности. Таким образом помимо того что кэш-память диска просто временно хранит передаваемые на компьютер кусочки информации (схема «Блин-головка-кэш-интерфейс-материнская плата»), она еще и записывает внутрь себя какие-то фрагменты данных «спереди» и «сзади» запрошенного пользователем участка. Кстати тут мы подходим к теме дефрагментации-вот почему она так важна. Если у вас есть файл на 16 мб и он на диске расположен фрагментированно, то головки HDD ухватят сначала одну часть файла, потом другую и т.п. А если диск дефрагментирован то помимо этих 16 мб файла диск считает себе в кэш-память еще по +8 с каждой стороны трека диска (или +16 вперед-зависит от микрокода), таким образом если следующий считываемый файл будет попадать в эти 16 мб, то диск его моментально отдаст системе из кэша. Таким образом можно сделать вывод что большой кэш полезен при А) поточном чтении Б) поточной записи (впрочем непоточная запись бывает только у флэш-носителей и SSD) В)низкой степени фрагментированности поверхности диска. Вывод? Чем больше кэша-тем лучше, но без фанатизма. 16, а уж тем более 32 мегабайт сейчас-за глаза как я думаю. Зачем нужен винчестер с кэшем в 64 (есть уже такой)-непонятно. Понятно что на вырост но тем не менее... Объем дисков. Нууу... Раньше он измерялся в килобайтах, потом в мегабайтах, затем дорос до гигабайт, ну а совсем недавно (по историческим меркам) был преодолен рубеж в 1000 ГБ, что гордо назвали терабайтом (что, конечно, не совсем верно, т.к. Терабайт = 1024 гигабайт, то есть терабайтники-ни разу не терабайтники на деле). Тут все ясно-чем больше тем лучше, объема мало не бывает (допустим суммарный объем моего кластера составляет порядка 8 300 гигабайт места, почти треть которого, впрочем, я убил на автоматизированный бэкап), однако прежде чем идти далее хочу осветить один забавный момент. Все мы знаем что в Windows никогда не видна полная емкость дисков (знаю, прозвучит дико, но до сих пор приходят люди с фразой «брак» из-за этой проблемы), в связи с тем что на заводе заранее размечают некую область как системную, и Windows ее с удовольствием резервирует. Выпал bad-block? Не беда, возьмем запасной из этой области, а «плохой» сектор пометим как испорченный. И резервируемые объемы иногда достигают просто неприличных значений (допустим на терабайтниках это почти 70 ГБ), что, естественно, не очень понравилось народу, и было бы логично предположить появляение программ, убирающих данное ограничение, и представляющее пользователю весь честный объем. Данные программы доступны всем в Сети, вопрос в том-если пораскинуть мозгами то выйдет что если мы уберем резервную область, а у нас вдруг появится bad-block, то откуда системе брать резерв? С самой поверхности диска естественно, а вдруг она возьмет этот несчастный кластер из сегмента MBR? И из-за одного блока вы потеряете весь диск. Ладно, будем не брать вообще эту замену, оставим как есть. И что? Блоки посыплются один за другим. Прикинув так и эдак, я решил что ну к черту эти 70 ГБ места с диска. Спокойствие за судьбу bad-block'ов мне важнее. Чего и вам советую. Не надо подкручивать то что и так работает. Остался самый последний момент непосредственно по дискам-интерфейс, и перейдем к тонкостям RAID-массивов. Интерфейсы...Ну поскольку старичок IDE безнадежно устарел (хотя я до сих пор использую приводы IDE в связи с тем что на моей мамке они висят на отдельном чипе-можно разгрузить южник), то мы рассмотрим лишь современные и доступные всем интерфейсы-SATA и SAS. SATA. Стандарт де-факто для индустрии HDD и приводов, а с недавних пор-еще и флеш-накопителей (в виде E-Sata). Sata бывает 4 видов-SATA, SATA II, SATA III, E-Sata. Первый уже почти сошел со сцены, второй сейчас наиболее массовый, третий только разрабатывается и внедряется, ну а E-Sata -тот же USB только сбоку. HotSwap, PnP и скорость повыше, правда-значительно повыше. Стоит отметить особенность нынешних HDD-зачастую (да почти всегда) скорость чтения с поверхности даже близко не приближается к скорости передачи данных интерфейсом. Таким образом для каких HDD разрабатывают SATA III-непонятно. Видимо для SSD нового поколения. SAS-а вот на нем остановимся поподробнее...Расшифровывается данная «спецназовская» аббревиатура всего лишь как «Serial Attached SCSI». Несмотря на кажущуюся похожесть, SAS в SATA не воткнуть, поэтому человек который купил SAS-винчестер в обычную десктопную мать ее не воткнет (исключение смотрим далее). SAS-логическое развитие параллельного SCSI до последовательного SAS. С почина компании ASUSTek (привет P6T Deluxe) SAS-контроллеры теперь лепятся и на мейнстримовые матери. Резон? Да никакого резона в политике ASUSTek я не вижу. Стоимость HDD на основе SAS просто неприличная, объемы скромные, правда скорость-уже упомянутые 15 000 об\мин. Вывод? SAS-винчестеры это строго серверная игрушка, но покажите мне человека который будет собирать сервер на основе P6T Deluxe? На столь багованной (для сервера) материнской плате собирать сервер-чистое самоубийство, обычный пользователь себе «Гепарда» (название линейки 15 000-оборотников от Hitachi) не поставит, так что зачем нам, широким слоям пользователей, SAS-непонятно. Точнее, зачем он нам на материнской плате... Я специально сделал такую ремарку про материнскую плату, поскольку сейчас мы завершаем наше путешествие в мир непосредственно HDD и переходим в иное измерение-измерение применения этих самых хардов. Сейчас мы поговорим о мощных и загадочных RAID-массивах-крайне гибком инструменте, который может стать как и благословением так и проклятием. А поскольку любой рейд-массив базируется на контроллере,сейчас мы их-то, контроллеры, и рассмотрим. И те которые бывают на материнских платах, и те которые представляют собой платы расширения... Начнем пожалуй с основы основ-что есть RAID? RAID это аббревиатура, расшифровывается как Redundant Array of Independent Disks, что можно перевести как «избыточный массив независимых дисков». Причем вначале, в конце 80-ых, когда технология и зародилась, вместо слова Independent значилось слово Inexpensive-Недорогих. Но со временем для создания массивов стали использовать отнюдь не дешевое оборудование, произошла подмена. Так что в нынешнем понимании RAID-это избыточный массив независимых дисков. Уровни рейд-массивов мы рассмотрим чуть позже, а сначала поговорим о контроллерах как я и обещал. Контроллер-устройство, обеспечивающее функционал рейд-массива. Контроллеры бывают программные, аппаратные и полуаппаратные. Начнем с аппаратных-это отдельная плата расширения, под слот PCI\PCI-E (у меня как раз такой) или PCI-X, зачастую имеющая свое резервное питание,и всегда-свой чип. В зависимости от сложности и «престижности» чипы могут стоять разные-на моем допустим стоит двуядерный чип с частотой 1.2 ггц, а на обычном дешевом под PCI стоит марвелловский чип с частотой 66 мгц. В общем с аппаратными все понятно-специализированные и как правило очень дорогие устройства, обеспечивающие функционал, не сравнимые с возможностями программного или полуаппаратного контроллера. Но именно на них стоит заострить внимание. Термин «программный» контроллер подразумевает что создание массива идет силами ОС (Буквально через «Панель управления»). Но тем не менее какой-то определенный чип для этого требуется (скажем если вы создаете массив на ядре Линукса, то вам помимо нормально компилированного ядра понадобится чип не младше ICH5, а для системы на базе ОС WinXP-ICH7). Полуаппаратный же рейд значит что вы задаете массив через BIOS и формируете его на этапе, предшествующем загрузке ОС (Наверняка так делали все кто знаком с рейдами). Абсолютное большинство домашних массивов так и создано, однако тут есть нюанс. Поскольку полуаппаратный рейд и программный по схеме работы схожи (нет отдельного устройства со своим BIOS, не привязанном к системе как в случае с аппаратным), то в последнее время любой рейд, собранный на встроенном южном мосту, стали называть программным. Это не совсем корректно, зато удобно-нет путаницы с полуаппаратным. У меня, допустим, 2 рейд-массива-аппаратный (на контроллере с двуядерным процессором) и программный (созданный на ICH10), уровней 5 и 0 соответственно. Просто если где услышите-имейте в виду. Я буду писать тут по всей науке-полуаппаратный. О,уровни 5 и 0. Вот они и проявились. Теперь, осталась самая малость-рассказать вам о нюансах контроллеров-и вперед, разбираться в тонкостях уровней массивов! Итак, контроллеры. Теперь вы знаете что есть аппаратный рейд и что есть полуаппаратный\программный рейд. Осталось рассмотреть плюсы и минусы всех вариантов сборки массива. А вариантов у нас, собственно, 4:
Вариант 3-сборка массива средствами ЮМ. Ну, тут все просто. Заходите в биос, выставляете (на примере ICH10) режим работы RAID, жмете определенную комбинацию клавиш после инициализации BIOS (как правило CTRL+I) материнки-вуаля, мы в меню создания массива. Весь процесс занимает от силы 10 минут. Ну про уровни расскажу чуть позже, а вот с таким животрепещущим параметром как «размер кластера» надо разобраться. В инете есть буквально тонны работ и исследований на тему «какой размер кластера лучше?» Не хочу показаться грубым, но я сделал умнее-залез на форумы техподдержки. Массивы падают, сыпятся, ведут себя нестабильно, харды отваливаются...Просто трагедия. А знаете что помогает? Реформинг рейд-массива с дефолтными(!) настройками контроллера. Объяснение очень простое-рейд штука капризная, и программисты фирм прежде всего затачивают микрокоды контроллеров под дефолтное значение кластера. Вывод парадоксален-дефолты the best! Так что оставляйте дефолтным (как правило это 64 или 128 КБ) этот несчастный кластер, мое мнение-овчинка не стоит выделки. У данного созданного массива есть лишь одно ограничение-чип на котором он создан. Если у вас, не дай бог, накроется материнка, то чтобы поднять рейд-массив вам потребуется мать с АБСОЛЮТНО таким же южником. То есть поднять массив, накрывшийся на X58-матери на материнке с nforce не выйдет. Се Ля Ви. Ну и последний пункт, пункт 4-программный рейд. Если вкратце-кажущаяся простота на деле оборачивается просто огромным объемом геморроя с данным массивом. Не буду все расписывать скажу лишь что данное изобретение человечества на фоне материнок которые поддерживают полуаппаратный рейд, выглядит дико. Таким образом, в сухом остатке мы имеем 2 возможных пути создания НОРМАЛЬНОГО массива-это полуаппаратный и аппаратный массивы. Итак, аппаратный рейд (будем рассматривать полноценный контроллер а не простейший за тысячу рублей с двумя уровнями массивов). Плюсы:
Полуаппаратный рейд. Плюсы
Итак. Что позади? Позади-разбор современных HDD на примере производителей, краткий ликбез по основным ТТХ дисков и осознание того факта что «программный рейд-это бяка». Впереди же нас ждет финальное приключение-мир уровней RAID-массивов... Итак,поехали! На данный момент существуют следующие уровни рейд-массивов: Raid 0, Raid 1, Raid 1E,Raid 2, Raid 3,Raid 4, Raid 5, Raid 5E, Raid 5EE, Raid 6, Raid 7, JBOD и MatrixRAID и комбинированные уровни. Обо всем по порядку. Прим.-дошел до уровня 5 и вспомнил-для ЛЮБОГО рейда ВСЕГДА ставьте одинаковые диски. Абсолютно одинаковые, даже прошивка, даже количество блинов должно быть одинаковым! Мой дружеский совет. Raid0. Простой как веник массив, он же-Stripe. Объединяет диски и их емкость и в системе видится как 1 диск (вне зависимости от физического количества дисков).Количество дисков не важно, может быть нечетное. Предположим у вас есть 2 винчестера по 500 ГБ. Объединив их в R0 вы получите в Моем Компьютере 1 диск на терабайт. Данные на такой диск пишутся поочередно. Пусть нам нужно записать код A0A1A2A3A4A5A6. На первый диск уйдет A0A2A4A6,на второй-A1A3A5. Плюсы:
Плюсы:
Плюсы:
Массив основанный на коррекции данных сплит-кодом Хэмминга. Да, я с вами разговариваю :-) Если не вдаваться в подробности то алгоритм записи примерно схож с уровнем 0, однако при этом идет не чередование а просто запись подряд. Допустим есть слово на 4 бита, 1-ый бит пойдет на диск 1, второй-на диск 2 и т.п. Причем декодирование идет по количеству дисков, то есть сколько дисков стольким количеством бит и кодируется слово. Казалось бы-в чем разница? А разница в том что при побитовом разбиении есть возможность применить сплит-код Хэмминга. Убей не пойму как эта штука работает, но она вычисляет контрольные суммы, что позволяет адресовать под бэкап не 50% емкости как в R1 а лишь 1 диск. Фактически Raid 2-это предтеча Raid 3 и 5, жутко сложная в организации штука, однако одна из немногих, позволяющих делать двойную коррекцию данным (на примере-если есть цифра 8, то она мало того что продублирована на синхронном диске, там еще и записана на третьем в видео контрольной суммы. Убить такой массив, особенно если дисков там много, крайне трудно, разве что намеренно) Плюсы:
Логическое развитие Raid 2 и предтеча Raid 5. Основное отличие-в параллельных запросах на диск + выделении отдельного диска под контрольную сумму (кодируемую по тому же коду Хэмминга). За счет улучшенных алгоритмов и отказа от двойного синхронизации (сплита) массив менее надежен чем Raid 2, но при этом в разы быстрее. Единственное что его может убить (при использовании скажем 6 дисков)-это отказ блока чтения контрольной суммы (XOR), что приведет к нехорошим последствиям Плюсы:
Боже, когда же эти «недомассивы» кончатся?! R4 это близнец R3, лишь с той разницей что изменен размер блока и политика чтения-можно одновременно читать данные с разных «кусков» диска-на R3 подобное привело бы к порче контрольной суммы. Плюсы:
Мой любимец. Наверное потому что это единственный массив из уровней 2,3,4,5 который я понимаю как работает, хоть и убил на это неделю :-) Итак, встречайте-массив, вобравший в себя все лучшее от массивов 1-4 уровней-RAID5! Проблемой массивов 2,3 и 4 является невозможность многопоточной записи + выделение отдельного (или отдельных) дисков под хранение контрольной суммы. Если данный хард (конкретно физическое устройство) накроется, то на вычисление новых контрольных сумм уйдут часы, за которое если помрет еще один диск-пиши пропало (в случае, конечно, если контрольные суммы не продублированы сплитом как в Raid2) В рейде уровня 5 же все диски (которых может быть не менее 3) равнозначны в политике приоритетов контроллера, поэтому он пишет блоки данных на все диски, и на все же диски пишет контрольную сумму. Предположим у нас есть A0A1A2A3A4A5A6A7, а контрольная сумма для него (условно)-ABCDEFGH. Сначала на первый диск пишется A0, для него контрольная сумма, вычисленная по коду Хэмминга-A. Она пишется на диск 2,туда же пишется A1, а его контрольная сумма-B-пишется на диск 3, после чего пишется следующий символ-A2 и так далее. То есть если у нас массив из 4 дисков то получается: Диск 1-A0 D A4 H Диск 2-A A1 E A5 Диск 3-B A2 F A6 Диск 4-C A3 G A7 Да, я хочу чтобы вы это поняли :-) на первый взгляд-чушь, но если вникнуть и потратить 5 минут на прорисовку на бумажке-уверяю, будете щелкать такое разбиение с первого взгляда. Таким образом в R5 получается что каждый диск есть избыточный и несущий кусок контрольной суммы. Таким образом R5 не боится вылета лишь 1 диска из массива, зато-любого, в отличие от массивов 2,3,4-которые боятся вылета диска с контрольной суммой (а если подсчитать что именно он эксплуатируется при ЛЮБОМ доступе к массиву, легко прикинуть что статистически он первым и откажет) + износ дисков идет равномерно. Емкость же такого массива равна -1 диск. Скажем если у вас в R5 массиве 4 одинаковых терабайтника,то будет видеться системой лишь 3 ТБ Плюсы:
Достаточно банальная модификация «пятого». Берется еще один диск, и сразу встраивается в массив, причем на него ничего не пишется. При вылете диска контроллер автоматически «подключит» этот резервный диск в логику массива и начнет восстановление массива-админу не надо ехать через полгорода чтобы вытащить из ящика диск и воткнуть его взамен умершего. Это 5Е. 5ЕЕ же заключается в том что данные пишутся на этот диск, но строго-контроля четности, и когда диск вылетает, данные просто «распаковываются», что занимает гораздо меньше времени. Вот и вся разница Плюсы:
Брат-близнец «пятого», за исключением того что данные контроля четности еще и сами дублируются друг с другом. Таким образом массив способен пережить падение 2 хардов, а минимальное их количество теперь-4. Плюсы:
Клон Raid 5 и 6, но с парочкой важнейших отличий-изначально завязан на мощном контроллере, в отличие от R5 который можно собрать и на мейнстримовой МП. Со своими алгоритмами чтения и вычисления контрольных сумм, данный массив кое-где быстрее исходного Raid5 в 5 раз! Однако есть и ложка дегтя-массив до одури боится фокусов электросети. Пропадет электричество во время записи блока четности-накроется весь массив. Плюсы:
Just а Bunch Of Disks-вроде так эта штука расшифровывается. Дословно-»просто куча дисков». Суть проста-диски видится единым диском в системе, но данные пишутся просто последовательно на все диски. Есть 10 дисков по 100 ГБ. У нас есть архив на 150. Первые 100 запишутся на диск 1, оставшиеся 50-на диск 2. Скорость как у одиночного диска. Плюсы:
Имеются в наличии два диска по 160 ГБ. Каждый диск разбивается на тома по 60 и по 100 ГБ, затем 100-гигабайтные тома объединяются в скоростной массив RAID 0, а 60-гигабайтные — в массив повышенной надежности RAID 1. В массиве RAID 1 можно разместить операционную систему, рабочие документы, фото- и видеоархивы, коллекцию музыки и прочие важные данные, а своп-файл, временные файлы и игры в массиве RAID 0. В результате получается весьма рациональное сочетание повышенной производительности и надежности хранения данных. Плюсы:
существуют комбинированные уровни RAID 1+0, RAID 3+0, RAID 5+0, RAID 1+5, которые различные производители интерпретируют каждый по-своему. Комбинированные уровни наследуют как преимущества, так и недостатки своих «родителей»: появление чередования в уровне RAID 5+0 нисколько не добавляет ему надёжности, но зато положительно отражается на производительности. Уровень RAID 1+5, наверное, очень надёжный, но не самый быстрый и, к тому же, крайне неэкономичный: полезная ёмкость тома меньше половины суммарной ёмкости дисков… Плюсы:
Статья получилась не совсем маленького размера, а в больших статьях всегда подводят итоги. Итого что мы узнали? А мы узнали что отсутствие маркетинга у некоторых HDD вовсе не делает их плохими, узнали что такое рейд, какие бывают уровни и контроллеры, в общем-узнали массу всего жутко полезного. В заключение хотелось бы сказать по рейдам. Все эти уровни-2,3,4,7-это, я считаю, ерунда. Нам,домашним пользователям, хватит уровней 0,1 и 5. Рекомендую ставить под систему Raid0 а под файловое хранилище-Raid5 или же 1. Искренне надеюсь что столь огромная статья написана легким языком и что вам было приятно, а главное-понятно и интересно ее читать. Искренне ваш Dr.Freeman - Источник |
#2
|
|
Вес репутации:
0
Регистрация: 27.02.2009
Адрес: Москва
Сообщений: 7,249
Сказал(а) спасибо: 574
Спасибок 2,673
в 1,898 сообщениях |
16.12.2009, 10:36
Почему RAID5 — «must have»? Ниже я произведу простейший расчёт надёжности RAID0+1 и RAID5 и сравнение их характеристик, а также укажу на некоторые принципиальные недостатки RAID1 и RAID0+1.Небольшой, но, надеюсь, обоснованный ответ на топик Почему RAID-5 — «mustdie»?. Небольшая вводная: Рассматривать мы будем простейшие случаи — RAID0+1 из 4-х дисков и RAID5 из 3-х дисков. Все диски в системе примем одинаковыми. Пусть n — вероятность отказа одного диска; Итак — RAID0+1: Кол-во дисков в массиве — 4; Цена массива равна стоимости четырёх дисков; Ёмкость массива будет равна удвоенной ёмкости используемых дисков (одного диска); Максимальная скорость чтения данных равна удвоенной скорости одного диска; Вероятность отказа массива для самого лучшего случая (когда контроллер реализует RAID1+0 как единую матрицу и умеет комбинировать накопители произвольным образом) — 4n^2+3n^3+n^4; Отдельно замечу, что большинство контроллеров не умеют комбинировать накопители, а значит отказ двух любых накопителей ведёт к потере данных, и надёжность массива в целом получается значительно ниже. Однако, мы сделаем поблажку и будем считать, что администратор не лыком шит и в случае отказа двух дисков хранящих разные данные сумеет вручную собрать из них RAID0 и восстановить данные. RAID5: Кол-во дисков в массиве — 3; Цена массива равно стоимости трёх дисков; Ёмкость массива равна ёмкости двух дисков; максимальная скорость чтения равна полуторной скорости чтения одного диска; Вероятность отказа массива равна вероятности отказа двух дисков в нём — 3n^2+n^3; Выводы: Начнём конечно же с вероятности отказа — отнимем вероятность отказа RAID5 от вероятности отказа RAID0+1: P(RAID10)-P(RAID5)=4n^2+3n^3+n^4-(3n^2+n^3)=n^2+2n^3+n^4 -> P(RAID10)-P(RAID5)>0 Не трудно видеть, что получилось положительно число, а значит вероятность отказа RAID0+1 однозначно (и заметно) выше вероятности отказа RAID5. Соотношение цен: RAID5 в 1.333 раза дешевле. Соотношение скоростей: RAID5 в 1.333 раза медленнее чем RAID0+1, но при этом в полтора раза быстрее одиночного накопителя. Внимание вопрос какой вариант лучше? Тот, который дороже и менее надёжен, хоть и немного быстрее. Или тот, что дешевле и надёжнее? Лично моё мнение склоняется в сторону более надёжного и дешёвого RAID5. Дополнение: В комментариях уважаемый track аргументировано указал, что в некоторых случаях RAID-5 может оказаться намного медленнее RAID1. По моему скромному мнению это должны быть очень и очень специфичные случаи, но иметь в виду следует. Всякого рода замечания: Время восстановления: Восстановление RAID0+1 в идеале равно времени копирования всего объёма данных. Для RAID5 ситуация сложнее, так как требуется восстановление данных по кодам коррекции. При программной реализации время восстановления RAID5 будет определяться быстродействием процессора. При аппаратной реализации время восстановления RAID5 равно времени восстановления RAID0+1. Учитывая, что современные процессоры без проблем справляются с потоком данных порядка 100МБ/с (приблизительная пиковая скорость чтения современных накопителей) можно утверждать, что при правильной реализации программный RAID5 будет не намного медленнее RADI0+1. Про надёжность во время восстановления. Для рассматриваемого случая об этого говорить вообще не приходится — резервные копии делать нужно! В общем же случае следует принимать во внимание, что на момент восстановления количество дисков в RAID0+1 больше, чем в RAID5, а значит вероятность отказа выше, и нельзя говорить о том, что на время восстановления RAID0+1 однозначно надёжнее. Дополнение: Если используется RAID-5EE, то в случае первого отказа он «сжимается» в RAID-5, что может занять очень длительное время. Однако, следует учитывать, что в результате получается полноценный RAID-5, который устойчив к одиночным отказам, т.е. фактически (при некоторых ограничениях) система может пережить два отказа подряд. Загрузка процессора: Программная реализация RAID5 нагружает процессор. Для современных процессоров, это как правило не критично, но для быстрых накопителей нужно иметь в виду, что чем быстрее накопитель, тем сильнее нагрузка на процессор. И снова надёжность — последний гвоздь в крышку гроба: Почему-то при разговоре о RAID0+1 и особенно о RAID1 все упускают из вида один очень важный момент. Да, в случае физического отказа накопителя он обеспечивет восстановление данных из копии, но что будет, если накопители вернут разные данные? Ведь в RAID1 нет способа узнать какие данные верны! Можно попытаться определить достоверность данных по их содержанию, но это не тривиальная задача, которая может быть выполнена только вручную, причём, далеко не всегда. Именно по этой причине я вообще не рассматриваю здесь RAID1 — он не обеспечивает механизма контроля достоверности данных. И RAID0+1 в общем случае тоже. А RAID5 (6?) в общем случае очень даже обеспечивает — если один из трёх накопителей вернёт неверные данные, то будет однозначно известно, что они не достоверны. Как такое (недостоверность данных) может случиться? Проблемы с перегревом дисков. Проблемы с питанием. Проблемы с прошивкой дисков. Масса вариантов! Вплоть до полного выгорания электроники в результате выхода их строя компьютерного источника питания. В таком случае диски можно попытаться оживить, поставив платы с аналогичных устройств, но не будет гарантии, что все данные на дисках достоверны. И ещё один гвоздик туда же. В топике с которого всё началось много расписано про BER (bit error rates). Не вдаваясь в подробности лишь замечу что, во-первых, для жёстких дисков все же принято больше говорить о MTBF (mean time between failures), во-вторых, если и говорить о BER, то о UBER (uncorrectable bit error rates), а, в-третьих, это будет аргумент в пользу RAID5 — если накопители вернут искажённые данные (которые прошли через все процедуры коррекции), то как узнать какому накопителю верить? Дополнение: Вики говорит обратное — информация для восстановления не используется до тех пор, пока один из дисков не выйдет из строя. Жизненный опыт, правда, говорит иначе, но это было давно и я даже не помню на каком контроллере (возможно это был один нестандартных уровней RAID). Так что однозначно о достоверности данных можно говорить лишь для ZFS/RAID-6. Вердикт: Вердикт прост — если не нужны лишние проблемы на ровном месте, то не нужно городить ни RAID1 ни RAID0+1 — нужно смотреть в сторону RAID5, 5E, 6, ZFS |
Ответить |
Опции темы | |
Опции просмотра | |
|
|