Обновленная Hewlett-Packard (http://www.hp.com) имеет весьма широкий портфель предложений в области систем хранения данных. Продукты этой компании способны обеспечить централизованное хранение и управление пользовательскими данными. Немаловажно и то, что компания остается последовательным приверженцем открытых технологий и стандартов. Решения, предлагаемые на базе продуктов HP, способны работать в неоднородной среде с серверами и системами различных фирм-производителей, обеспечивая эффективное и надежное хранение данных в средах HP-UX, Solaris, AIX, Windows NT, 2000 и т. д. Компоненты таких систем обычно взаимозаменяемы, а линейка продуктов предоставляет возможность модернизации до более старших моделей с сохранением всех инвестиций. Хорошо известно, что построение корпоративной системы хранения данных на продуктах от одного производителя несет в себе неоспоримые преимущества, обусловленные совместимостью, простотой интегрирования и администрирования, а также возможностью получения технической поддержки в едином центре.
В ближайшее время Hewlett-Packard намеревается объединить и упорядочить ассортимент дисковых массивов, а также сосредоточить усилия на сближении систем NAS/SAN. А пока в качестве решения начального и среднего класса компания продолжит продвигать массивы HP VA (Virtual Array) 7000 для систем, основанных на HP-UX. Как известно, дисковые массивы данного класса масштабируются до нескольких терабайт, имеют встроенные средства обеспечения отказоустойчивости и виртуализации данных. Такие массивы применяются, как правило, для создания централизованных систем хранения данных средних предприятий или отделов крупных компаний.
Основные требования к системе хранения
Обеспечение непрерывающегося доступа к данным требует внимания к двум важнейшим аспектам функционирования системы, а именно высокой готовности и производительности оборудования. Понятие готовности в отношении устройств хранения подразумевает всего два состояния — устройство или функционирует нормально и обеспечивает доступ к данным, или оно неисправно. Средства обеспечения гарантированного доступа к данным часто реализуются посредством использования различных отказоустойчивых механизмов. Производительность также оказывает влияние на доступность данных, но она обычно не рассматривается как двоичное (да или нет) условие. Недостаточная производительность выступает серьезным фактором, ограничивающим доступ к данным, а неприемлемый уровень быстродействия системы хранения данных может иметь для бизнеса такие же последствия, как и полный отказ оборудования.
Как мы видим, для обеспечения непрерывного доступа к данным в устройствах оперативного хранения равно важны как отказоустойчивость, так и использование высокопроизводительной архитектуры. Однако при том, что защита данных и непрерывный доступ остаются первостепенными требованиями к системам хранения, в последнее время приобрел вес еще один критерий эффективности системы — экономический. Снижение стоимости базовых систем хранения и нужды повышения конкурентоспособности бизнеса привели к экспоненциальному росту всевозможных изменений в архитектуре центров данных. Затраты на администрирование этих изменений выливаются для ИТ-менеджеров в значительные суммы, резервируемые в бюджете. Дополняет требования к планированию и выполнению изменений нехватка опытных администраторов систем хранения данных.
Итак, современный ИТ-центр требует рентабельных устройств хранения, характеризующихся высокими готовностью и целостностью данных, отличной производительностью и сравнительно небольшими затратами на управление. Технологии, снижающие время внедрения новых приложений и текущие расходы на управление, могут стать ключом к поддержанию конкурентоспособности в современной экономической и деловой среде. В настоящее время Hewlett-Packard располагает полной линейкой систем хранения, предоставляющей все эти преимущества.
Целостность данных и высокая готовность
Сердцевина массива HP VA — заказная специализированная микросхема (ASIC), разработанная компанией Hewlett-Packard. Этот чип играет ключевую роль в обеспечении высокого быстродействия, защите данных и снижении затрат в пределах единой архитектуры. Аппаратная архитектура виртуального массива HP VA имеет следующие важнейшие характеристики:
- избыточность — сдвоенные контроллеры, блоки питания, вентиляторы и зеркалированный буфер записи со встроенной батареей;
- защита данных — ECC и зеркальная кэш-память, сквозная защита данных и RAID 5 DP (с двойным контролем по четности);
- производительность — 800 Mбайт/с, архитектура массива с тесной взаимосвязью, несколькими независимыми путями данных и высокопроизводительным контроллером на основе PowerPC.
Сквозная защита данных
Сквозная защита данных — это аппаратно реализованный процесс, гарантирующий, что сервер прочитывает именно те данные, что были записаны. В массивах HP VA эта защита реализована непосредственно в специализированном процессоре DFP (Data Flow Processor). По мере записи данных в массив микросхема немедленно инкапсулирует каждый сектор при помощи дополнительного проверочного слова, использующегося для обнаружения ошибок. Проверочное слово сопровождает данные по мере их перемещения через контроллер на жесткий диск, а на финальной стадии — в момент считывания данных сервером — контроллер должен сверить корректность этого слова. Если обнаружена ошибка, то контроллер не позволит серверу использовать неверные данные.
Проверочные слова формируются как на основе самих данных, так и с использованием информации об адресе, что защищает систему от ошибок, возникших не только на диске, но и в контроллере массива. Диски выполняют проверку соответствия считанных битов тому, что было записано в сектор, однако имеется небольшая, но реально существующая вероятность того, что непредвиденная комбинация обстоятельств приведет к выдаче информации из неверного сектора.
Как правило, в обычных компьютерах на четность проверяется только память, в ПК-серверах уже предусматриваются базовые средства коррекции ошибок, а ответственные серверы, на которых работают базы данных всей компании, имеют несколько различных средств коррекции ошибок. Чем более ответственная роль возлагается на компьютерную систему, тем важнее становится необходимость использования нескольких схем проверки целостности. Все это относится и к дисковым массивам: диск в обычном ПК выполняет только самопроверку, а скромная дисковая подсистема для некритичных данных обеспечивает защиту от отказа дисков на основе RAID. Однако массивы для ответственных деловых приложений требуют использования нескольких схем защиты данных и поддержания их целостности.
Соответствующие возможности имеются в массивах верхнего ценового диапазона и лишь в некоторых массивах среднего уровня. Дисковые массивы без этих возможностей имеют низкий класс целостности данных, при этом контроллер массива может вернуть ошибочные данные серверу без какого-либо о том уведомления, и в этом случае ошибка не будет распознана приложением. Хотя вероятность этого очень невелика, воздействие на работу приложения может быть разрушительным: следствием такой ошибки обычно бывает необъяснимый отказ системы или повреждение базы данных. Сквозная защита данных является ключом к обеспечению целостности данных для наиболее важных деловых приложений.
Технология RAID 5DP
RAID 5DP — это еще один механизм защиты, используемый в массивах HP VA. Основное отличие этой технологии от стандартного уровня RAID 5 заключается в дополнительной схеме защиты на основе двойной проверки четности (dual parity protection scheme). Дело в том, что каждый блок данных в RAID 5DP имеет не один, а два блока связанной с ним избыточной информации. Новая схема обеспечивает более высокую защиту данных по сравнению со стандартными массивами RAID 5, к тому же в равной конфигурации эффективность систем с использованием RAID 5DP в среднем на 10% выше, чем у аналогов с RAID 5. Кроме того, RAID 5DP обеспечивает массиву HP VA устойчивость почти ко всем типам одновременного отказа двух дисков при любой конфигурации массива. Поясним этот второй механизм более подробно.
Независимо от числа дисков или конфигурации массива в момент отказа первого диска массив имеет только один или два других критичных диска. Это означает, что любой из других некритичных дисков может отказать одновременно с первым, а массив будет продолжать функционировать без потерь данных. Заметим, что отказ критичного диска вызовет утрату данных.
Теперь рассмотрим возможности технологии на примере типичной конфигурации из 45 дисков. После отказа первого диска имеется один или два диска (из остающихся 44), отказ которых привел бы к потере данных. Отказ любого из других 42 дисков не окажет воздействия на готовность данных. И хотя такой массив можно сравнить с другими массивами, сконфигурированными в структуру RAID 1+0, его возможности превышают возможности любой иной RAID-системы, сконфигурированной в традиционный RAID уровня 5. Как известно, в последнем случае глубина чередования определяет оставшиеся критичные диски в системе после первоначального отказа диска. Например, в типичной конфигурации 5+1 диск для RAID 5 в системе после первоначального отказа имеется пять критичных дисков.
Логика, реализованная в контроллере массива VA, расширяет эту способность еще дальше. Каждый контроллер обладает информацией о том, какие данные подверглись воздействию при одновременном отказе второго диска, и контроллер будет восстанавливать эти данные в первую очередь, перед восстановлением двойной избыточности в данных массива RAID 5DP. Инженеры Hewlett-Packard считают, что если сквозная защита данных — это особенность, которая отвечает возможностям массивов высокого класса, то RAID 5DP — функциональность, превышающая возможности высококлассных массивов.
Модульный дизайн
Модульные массивы позволяют администраторам достичь большей гибкости в начальных конфигурациях, а также легко расширять систему после ее первоначальной установки. Модульные массивы являются практичным компонентом сетей хранения данных SAN, использующих Fibre Channel. Малый объем, занимаемый массивом этого типа, и соответствующая конструкция высокой плотности позволяют, используя технологию SAN, обеспечить эффективное масштабирование. Такая архитектура приводит к снижению затрат и обеспечивает возможность инвестировать в инфраструктуру по мере ее развития — выгодное отличие в сравнении с так называемыми монолитными архитектурами.
Виртуальные технологии, использованные в массиве HP VA, придают дополнительную ценность и гибкость модульным решениям. Вот лишь некоторые черты, характеризующие возможности развития данных виртуальных массивов: быстрое расширение доступной емкости, использование любой конфигурации поддерживаемых дисков, гибкость в размещении дополнительных устройств, совместимость со всей линейкой продукции, поддержка большого числа ОС.
Увеличение емкости
Одно из знаменательных отличий между массивами серии HP VA и традиционными системами хранения — это начальная емкость при покупке. В традиционной технологии построения дисковых массивов диски должны приобретаться группами в соответствии с требуемой конфигурацией RAID-массива. Первоначальная конфигурация традиционного дискового массива обычно представляет собой статический компромисс между производительностью, емкостью хранения и степенью готовности.
Для массивов серии HP VA нет нужды в приобретении дисков группами для конфигураций RAID 1+0 или RAID 5DP. Виртуализация накопителей отменяет это требование: все имеющиеся диски рассматриваются как общий пул доступной емкости хранения. Добавление дисков просто увеличивает емкость этого пула. Кроме того, компания предлагает интуитивный инструмент планирования емкости системы хранения, который показывает минимальное число дисков, необходимое для удовлетворения требований к емкости. Соединение виртуализации системы хранения с инструментом планирования его емкости для системы HP VA существенно облегчает решение вопросов приобретения требуемого количества дисков.
Теперь сравним подходы к росту и развитию системы хранения. Преимущество модульной системы состоит в том, что она позволяет реализовать модель оплаты по мере роста. При этом традиционные массивы после расширения оказываются ограниченными либо в гибкости конечной конфигурации, либо в ее производительности. Как и при начальном конфигурировании, традиционные массивы требуют, чтобы диски приобретались группами, отражая структуру уровня RAID и размер блока (stripe size). Практика модернизации традиционных массивов требует, чтобы эти диски устанавливались в виде островков, изолированных и независимых от других дисков массива. Эта изоляция приводит к низкой эффективности использования емкости и ограничивает использование потенциала быстродействия этих дополнительных дисков.
При использовании технологии HP VA рост может быть достигнут при любых емкости и числе дисков, поэтому можно приобретать только реально требуемое количество дисков. Новые диски можно установить и сконфигурировать за несколько минут, а не часов, как в случае с традиционными массивами. После установки дисков контроллер будет реорганизовывать данные в фоновом режиме для эффективного включения новых дисков в работу, обеспечивая максимальную эффективность использования доступной емкости и производительности накопителей.
Эти отличия не только минимизируют затраты на приобретение дискового массива, но и сокращают время, которое требуется для внедрения решения и управления им.
Характеристики производительности
Производительность дискового массива может быть таким же критичным фактором для бизнеса, использующего накопители для оперативного хранения данных, как и отказоустойчивость. Медлительная система хранения данных является потенциальным источником упущенной выгоды или неудовлетворенности пользователей. Ключом к успешному внедрению решения является корректная оптимизация систем хранения. К сожалению, отказоустойчивые дисковые массивы являются весьма сложными устройствами, и успешная настройка параметров быстродействия может оказаться непростой задачей. Дополняют трудности в достижении этой цели и любые предстоящие изменения требований к устройствам хранения данных. По мере развития приложений или расширения емкости массива перенастройка подчас просто не производится из-за ограничения времени, отпущенного на управление.
Массивы серии HP VA характеризуются рядом возможностей и параметров, которые снижают сложность настройки системы на оптимальную производительность и повышают вероятность поддержания ее на высоком уровне. Эти характеристики, основанные на хорошо известных нормах для систем хранения, серверов и баз данных, являются следствием принципов, заложенных в систему с момента ее разработки. Основные особенности массивов HP VA, отмечаемые разработчиками, — это время отклика буфера записи, производительность дисков массива и эффективный размер блоков.
Рентабельность
Решить, какая система хранения данных наиболее эффективно удовлетворяет требованиям работы приложений, не так-то просто. Как правило, для выбора имеется множество альтернатив, каждая из которых характеризуется уникальной комбинацией возможностей. Для аналитика процесс выбора обычно сводится к сравнению спецификаций — больших таблиц из множества рядов и колонок с параметрами продуктов. К сожалению, наиболее важные с точки зрения производительности критерии в них часто отсутствуют. Соотношение цена/качество должно рассматриваться наряду с базовыми характеристиками компонентов и «чистой» производительностью. В то время как абсолютные значения производительности могут быть показателем возможностей архитектуры массива, соотношение цена/качество и удельная стоимость в долл./Mбайт служат для бизнеса показателем быстродействия устройства хранения.
В сравнительный анализ обычно включаются такие параметры, как долл./Гбайт, долл./IOP и долл./Mбайт/с. Тем не менее использование этих критериев может привести к неочевидным выводам. Например, устройство начального уровня VA7100 предлагает меньшее значение абсолютного быстродействия, чем система среднего уровня VA7400. Многие заказчики выбрали бы VA7400, поскольку этот массив обеспечивает наивысшую производительность. Однако если анализ включает конкретные цены приложений и их требования к емкости хранения, то наилучшим выбором может стать как раз система VA7100. В частности, компании, ведущие торговлю через Интернет, выбирают VA7100 для организации информационных хранилищ, т. к. для их бизнеса наибольшую ценность представляет соотношение цена/качество данного решения, а не абсолютное значение производительности отдельного дискового массива.
ПО управления
Управление устройствами — ключ к достижению долговременной отдачи от использования дискового массива и обеспечивает также разрешение проблем постоянного расширения емкости хранения в центрах данных. Наряду с управлением отдельными устройствами, массивы HP VA интегрируются с рядом программных продуктов семейства OpenView для формирования корпоративных систем управления.
ПО Command View SDM характеризуется набором различных интерфейсов и рабочих топологий, которые при объединении обеспечивают хорошие возможности достижения гибкости и простоты использования. Имеется выбор из трех интерфейсов взаимодействия с массивом: графический интерфейс, командная строка и командное меню. Реальная гибкость топологии проистекает из способности выполнять любые из перечисленных интерфейсов как на сервере, непосредственно подключенном к массиву, так и на выделенной рабочей станции или с любого компьютера сети. Дополнительно гибкость характеризуется простотой использования графического интерфейса непосредственно из любого браузера в сети без установки на данном компьютере какого бы то ни было специального ПО.
Основную часть времени при настройке массива занимает его физическая установка и подключение кабелей. После подачи питания любая описанная в сценарии конфигурация может быть реализована в течение пяти минут. Сюда входит установка ПО Command View SDM, конфигурирование номеров LUN, установка ПО Secure Manager VA и Business Copy VA. Экономия времени и средств достигается не только при начальной установке, но и во время восстановления системы после аварийного сбоя, когда простой может обойтись в десятки тысяч долларов в час. Это значительное усовершенствование в сравнении с традиционными дисковыми массивами.
Как известно, оптимизация работы системы, приложения и самого массива может быть весьма трудоемкой задачей. Массивы серии VA предлагают два практичных решения: одна конфигурация для группы, где все решает производительность, а вторая — для группы, где нужна максимально возможная производительность, но с учетом ограниченного бюджета. Имеются еще несколько дополнительных конфигураций, направляющих администраторов массивов серии HP VA в выработке решения относительно баланса производительности и целостности данных. Базовой конфигурацией для группы, где все решает производительность, является уровень RAID 1+0. Он обеспечивает максимально возможную производительность почти для всех приложений, но обладает при этом самой низкой эффективностью использования доступной емкости и к тому же является одним из самых дорогостоящих решений по критерию долл./Mбайт. Для второй группы массивы HP VA обеспечивают опцию самоуправления — AutoRAID, которая контролирует использование хранимых в массиве данных и определяет наилучший уровень RAID.