Рост объемов данных, расширение спектра задач, связанных с их обработкой, критичность доступа к данным для бизнеса приводят к необходимости говорить именно о системах хранения данных. Система хранения — нечто большее, чем просто набор дисков, подключенный к серверу. Сегодня это комплекс средств, предоставляющий высокоуровневый доступ к данным, обеспечивающий их постоянную готовность, защиту от сбоев и катастроф, мониторинг и управление использованием дискового пространства, автоматическое архивирование и прозрачное восстановление.
По мнению большинства экспертов, корпоративные системы хранения можно рассматривать как ресурс, стоящий в одном ряду с такими корпоративными ресурсами, как коммуникационная инфраструктура, аппаратные серверы уровня предприятия и прикладные программы. Для эффективного использования любого ресурса желательно, чтобы он мог быть консолидирован, — это обеспечивает целый ряд экономических преимуществ. Важнейшие из них — экономия на администрировании, возможность перераспределения резервов памяти, сокращение непроизводительных ИТ-затрат (например, на множество локальных решений для резервного копирования и последующую их эксплуатацию). Кроме того, консолидация памяти открывает путь к сокращению сроков разработки и внедрения систем.
Во многих компаниях информационные системы содержат несколько «островков» хранения данных, как правило, реализованных на отдельных машинах. Чтобы идти в ногу с требованиями заказчиков и достижениями конкурентов, бизнесу конкретной компании требуются мультиплатформные, масштабируемые базы данных, способные справиться с интенсивными выборками данных, их репликацией, ведением журнала и восстановлением данных. Обычно такие БД нельзя эффективно реализовать на основе изолированных систем хранения.
Объединив данные от нескольких серверов в единую, централизованную и масштабируемую систему хранения с очень высокой готовностью, можно упростить среду хранения и одновременно повысить скорость обработки данных и их доступности для пользователей. Кроме того, это даст экономию занимаемой площади, повышение уровня сервиса и снижение затрат на среду.
Потребность в консолидации
Понятие консолидации систем хранения данных появилось как исключительно эффективный способ не только организации эффективного хранения данных, но и работы многих приложений, зависящих от подсистем хранения. Он также обеспечивает для этих ресурсов снижение совокупной стоимости владения (TCO). Попробуем разобраться, что же такое консолидация систем хранения данных и в чем ее отличие от консолидации иных типов ресурсов центра данных.
Не секрет, что организация информационных хранилищ (Data Warehousing) сейчас стала основным способом повышения конкурентоспособности компаний, обрабатывающих аналитические и маркетинговые данные. Самый важный параметр таких хранилищ — обеспечение мгновенного доступа к данным, поскольку сводные таблицы баз данных и индексы занимают намного больше места, чем сами детализированные данные, а более 90% запросов многомерны и включают тот или иной уровень агрегирования данных.
Поскольку современные центры данных выполняют весьма ответственные приложения, сегодня простои измеряются секундами, а издержки от простоев включают снижение дохода, упущенные возможности сбыта, потерю доверия клиентов. Чаще всего причиной простоя хранилища становятся системы хранения данных: это может быть отказ компонентов, длительное время загрузки и сильно растянутые процедуры резервного копирования, которые интерферируют с производственной деятельностью.
Среда современного бизнеса требует круглосуточной работы информационного центра с возможностью доступа в режиме реального времени, но такие центры исторически были рассчитаны на низкую загрузку днем и обновление систем по ночам. Однако потребность в доступе к данным в реальном времени диктует применение динамических баз данных, информацию из которых можно быстро извлечь в любое время. Размеры баз данных растут быстро, и их резервирование для обеспечения защиты данных и поддержания их целостности стало еще одной важной проблемой, с которой сегодня сталкиваются системные администраторы.
Ведение бизнеса в Интернете также требует постоянной доступности и готовности используемых СУБД. Известно, что обычно размер СУБД удваивается каждый год, и эта проблема со временем будет только острее.
В зависимости от обстоятельств и требований к ИС применяются различные схемы консолидации, но основных из них три:
- объединение систем хранения, находящихся на нескольких серверах, в пределах единого сервера;
- непосредственное подключение нескольких разнородных серверов к единой системе хранения данных;
- объединение системы хранения на основе архитектуры SAN (сетей хранения данных).
Актуальность консолидации
До прихода эры Интернета компаниям обычно приходилось искать компромисс между быстродействием и готовностью данных. Сегодняшние, основанные на сетях технологии хранения данных наконец делают консолидацию систем хранения практичной.
Выгоды стратегии консолидации становятся более очевидны, если бизнес компании использует Интернет. Традиционные методы распределенной системы хранения просто не работают при развертывании электронных инициатив. По мнению большинства экспертов, стратегия консолидированной системы хранения, основанная на современных передовых технологиях, приведет к значительному снижению затрат, совершенствованию контроля и управления, повышению эффективности и производительности, улучшению «подвижности» бизнеса и, что особенно важно, к повышению готовности, надежности и производительности.
Еще два года назад эти выгоды были недостижимы, но с появлением новейших технологий хранения данных многие компании, уже развернувшие консолидацию, сегодня могут в полной мере воспользоваться ее плодами.
Преимущества для бизнеса
Чего можно ожидать от консолидации данных на одной общей платформе для хранения данных? Прежде всего емкость системы будет расти быстрее, этот процесс окажется рентабельнее, и управлять им можно будет эффективнее. Будут устранены узкие места, компания повысит свою эффективность и производительность благодаря непрерывной высокой готовности, которая, в свою очередь, увеличит доходность, поддерживая конкурентоспособность. Благодаря автоматизации задач управления ИТ-специалисты компании будут освобождены для работы над другими проектами, более отвечающими их опыту. Можно будет достичь более высокого уровня эффективности эксплуатации при меньших капиталовложениях.
Отдельно стоит упомянуть о производительности. Объединение всех данных на общей платформе означает, что существует вероятность столкнуться с большим числом узких мест, если к этому заранее не подготовиться. В частности, запросы при анализе данных в информационном хранилище или совокупности хранилищ требуют очень высокой степени (более 90%) мгновенного онлайнового многомерного доступа.
При консолидации систем хранения вероятность уменьшения производительности — весьма реальный риск. Заказчики, которые намеревались лишь избежать проблем, связанных с простоями, часто наталкиваются на проблемы ограничения полосы ввода-вывода, что в действительности также является проблемой готовности, но на ином уровне. Рассмотрим эффект часового простоя, вызванного не отказом компонента, но перегрузкой системы. Корпорация теряет целый час деловых транзакций — и потенциальных заказчиков, которые пытались получить доступ к Web-сайту во время его бездействия. Вряд ли многие из них повторят эту попытку — скорее всего, они просто обратятся на сайт конкурирующей компании. Потери дохода, связанные с такими простоями, трудно оценить; причем чем более загружен сайт, тем существеннее потери.
Должным образом реализованная консолидация системы хранения данных может обеспечить бизнесу повышение доходности за счет:
- улучшения уровней непрерывной работоспособности;
- сокращения времени восстановления после катастрофического отказа;
- уменьшения времени восстановления;
- более высокого качества обслуживания и повышения удовлетворенности заказчиков;
- значительного снижения объема инвестирования, требуемого для выполнения специфических задач;
- снижения сетевого трафика путем уменьшения числа репликаций системы;
- снижения затрат на приобретение, профилактику, обслуживание и поддержку;
- повышения эксплуатационной эффективности;
- повышения производительности труда работающего.
Планирование инфраструктуры
Для успешного ведения традиционного и нового электронного бизнеса компании, как правило, требуется соответствующая инфраструктура с возможностями восстановления после катастрофических разрушений, процедурами резервного копирования и восстановления, а также репликации данных вне центра. Если отказ электронных компонентов может вызвать остановку одного сервера, то наводнение, пожар, торнадо или землетрясение уже могут привести к остановке всего вычислительного центра, а неисправность единой энергосистемы — к отключению потребителей целого города.
Создавая инфраструктуру, обязательно следует внимательно рассматривать такие ее элементы, как собственно сеть, серверы и система хранения данных. Кроме того, следует учитывать требования рабочей нагрузки используемых приложений (производительность) и критичность данных (готовность).
Немаловажные факторы — отдача капиталовложений (ROI) и размеры издержек электронного бизнеса в сравнении с ростом доходов от повышения производительности и эффективности. Разумеется, реклама новых электронных услуг должна обеспечить отдачу, но коммерческий сайт компании, вероятно, станет своего рода мишенью. Первая проверка на прочность может иметь место со стороны пользователей, а за ней последуют иные. Поэтому инфраструктура системы хранения должна быть готовой справляться с растущими нагрузками.
Как отразится запуск новой системы на бизнес-данных корпорации? Не стоит удивляться, если объем данных будет расти экспоненциально. Современные базы данных требуют гибкой, недеструктивно масштабируемой инфраструктуры хранения данных. По мере построения БД сами данные накапливаются на большом числе различных платформ, разумеется, оставаясь важными для бизнеса компании и ценными для заказчиков, нуждающихся в быстром их обновлении без перебоев в обслуживании. Именно поэтому инфраструктура системы хранения данных корпорации потребует внедрения методов управления, свойственных большим вычислительным центрам.
После того как данные объединены в пределах централизованной среды, нужно защитить их от катастроф, искажений и ошибок, а для этого потребуется реализовать инфраструктуру хранения с возможностью резервирования и быстрого извлечения, удаленной репликации и быстрого восстановления после катастрофы.
Если речь идет о крупной корпорации, то, скорее всего, инвестиции в традиционные системы и базы данных уже давно сделаны. Эти унаследованные данные — ценный актив, который должен будет найти свое место в новой среде электронного бизнеса. Разумеется, унаследованные данные уже находятся в работе, поддерживая существующие бизнес-процессы, поэтому обычно ИТ-отдел стоит перед выбором — прервать нормальную обработку информации, чтобы дать возможность новым приложениям воспринять унаследованные данные, или задержать развитие новых приложений в ожидании момента, когда унаследованные данные станут доступны. Но такая проблема не стоит, если выбрать систему хранения данных, предназначенную для неразрушительной передачи данных между различными системами и обеспечивающую развитие и тестирование приложений, не сказываясь негативно на рабочем процессе.
Предложения Sun Microsystems
Компания Sun Microsystems (http://www.sun.com) представляет на рынке семейство систем хранения данных класса high-end под названием Sun StorEdge 9900, включающее комплексы Hitachi Freedom Storage Lightning 9900. Это стало возможным благодаря соглашению между Sun Microsystems, Hitachi и Hitachi Data Systems, которое направлено на выведение на рынок усовершенствованных продуктов и услуг для исключительно требовательных корпоративных клиентов.
Эти системы разработаны с учетом всех требований классического вычислительного центра, сложность функционирования которого скрыта от пользователя. Системы поддерживают гетерогенность (в том числе возможность подсоединения мэйнфреймов), консолидацию накопителей данных и функции высокого уровня готовности.
Продукты Sun StorEdge 9900 представляют собой развитие существующей линии продуктов Sun StorEdge, в которую, в частности, входят популярные массивы StorEdge T3. Исключительно важно и наличие сервисных центров, в которых работают специалисты обеих компаний и которые проводят обслуживание на месте эксплуатации этих систем хранения. Таким образом, клиенты в ответ на запрос могут получить оперативную помощь и сервисное обслуживание. Используя кластеризацию систем Sun StorEdge 9900 в среде SAN, можно обеспечить фактически безграничное масштабирование для самых крупных корпоративных приложений. Линия продуктов Sun StorEdge 9900 создана специально для обеспечения максимальной готовности и производительности в средах высокой гетерогенности. По мнению разработчиков, Sun StorEdge 9900 превосходит конкурентов благодаря преимуществам архитектуры и современным разработкам.
Семейство Sun StorEdge 6900 представляет собой альтернативу для высокопроизводительной консолидации. Входящие в нее системы со встроенной виртуализацией оптимизированы для консолидации серверов и систем хранения данных в компаниях среднего размера и корпоративных центрах данных и сочетают простоту консолидации систем хранения с хорошо прогнозируемой структурой затрат.
Системы этой серии очень просто ввести в эксплуатацию, дальнейшее управление ими не вызывает затруднений. Sun StorEdge 6900 позволяет снизить общую стоимость владения благодаря оптимальному распределению нагрузки по дисковым массивам и возможности управления большим количеством систем хранения данных с помощью меньшего объема ресурсов.
Системы Sun StorEdge 6900, разработанные для работы с интенсивными потоками информации, — это мультиплатформное решение SAN, оптимизированное по производительности сетей. Системы обладают встроенными сервисными функциями, они полностью интегрированы, протестированы и поддерживают непрерывную четкую работу.
Пакет программ Sun StorEdge Resource Management Suite предназначен для анализа данных и выработки решений в проектах консолидации. Это ПО позволяет руководителям ИТ-служб централизовать и упростить администрирование и обслуживание инфраструктуры систем хранения данных, снизить совокупную стоимость владения (TCO), оптимизировать использование ресурсов, повысить готовность, задействуя при этом накопленный ранее опыт.
Пакет Sun StorEdge Utilization Suite обеспечивает управление файлами, интеллектуальные сервисы архивирования и восстановления. Он предоставляет средства защиты данных и быстрый доступ к большим объемам корпоративных онлайновых систем хранения. Пакет предусматривает копирование данных для одновременного считывания со многих распределенных устройств на скоростях, близких к максимальным. Utilization Suite автоматически создает резервные копии текущей работы и дуплицирует архивированные файлы и файловые системы на нескольких серверах.
С помощью менеджера трафика Sun StorEdge Traffic Manager администраторы систем хранения могут выделить полосу по требованию, обеспечить динамическое выравнивание нагрузки в масштабах SAN и интегрированный маршрут восстановления. Таким образом, Traffic Manager повышает готовность и производительность при выполнении сервисов, основанных на работе с данными. Пакет оптимизирует производительность труда администратора систем хранения данных, поскольку предусматривает автоматическое управление характеристиками системы в пределах всей сети SAN.