Яков Шпунт
В последнее время виртуализация систем хранения данных вышла за пределы простой агрегации ресурсов и базовых средств управления томами. Программно-определяемые системы (или SDS в англоязычной аббревиатуре) ставят своей целью предоставление ресурсов хранения в виде сервиса.
Программно-определяемое хранение добавляет такие мощные возможности, как защита данных, автоматическая организация многоуровневого хранения данных и обеспечение эффективности хранения. И, наконец, оно предоставляет возможность для таких расширений функционала, как объектное хранение.
Программно-определяемые среды хранения последнего поколения освобождают центр обработки данных от привязки к одному поставщику аппаратных и программных средств. Однако при этом выбор ПО может быть ограничен. По этой причине ЦОДами следует выбирать для поддержки сервисов данных единое мощное решение.
Изолированные зоны хранения — основная проблема традиционной виртуализации СХД
Большинство систем хранения спроектированы для работы с определенными нагрузками. Одни подходят для баз данных, другие для систем аналитики, третьи — для вычислительных задач, четвертые — для резервного копирования. Существуют и универсальные СХД, которые могут работать с разными типами нагрузок, но их цену вряд ли назовешь низкой. В итоге для разных задач экономически выгоднее приобретать разные комплексы.
В итоге быстро разрастаются изолированные зоны хранения в ЦОД. К тому же каждая из этих систем имеет свою консоль управления и применяет свои методы для распределения томов и для защиты данных.
Также организация становится зависимой от возможностей каждого поставщика по предоставлению необходимого набора базовых сервисов. На заре совместного использования систем хранения это приводило к тому, что некоторые поставщики позднее других предоставляли такие возможности, как моментальные снимки и экономное выделение ресурсов (thin provisioning). Кроме того, у каждого поставщика имелись собственные технологии со своими компромиссами с точки зрения их эффективности и влияния на производительность.
Такие изолированные зоны, которые по-прежнему являются широко распространенным явлением в центрах обработки данных, существенно снижают уровень гибкости при эксплуатации инфраструктуры хранения. Например, если одно приложение исчерпывает ресурсы хранения или нуждается в доступе к более производительной системе, переход к ней может оказаться непростым мероприятием.
От традиционной виртуализации к программно-определяемым системам
Виртуализация СХД позволяет объединить ресурсы хранения под единым интерфейсом управления, а также заимствовать ресурсы у других массивов или направлять задания на системы с большой свободной емкостью или быстродействием тогда, когда в этом возникает необходимость. Известно, что разные дисковые массивы даже в линейке одного поставщика хорошо подходят для определенных категорий задач и не очень — для других. И применение инструментов виртуализации существенно облегчает работу по проектированию комплексов хранения данных и их обслуживания в дальнейшем.
По мере развития и распространения технологий виртуализации серверов оказались востребованными такие функции, как моментальные снимки и репликация. Часто эти функции реализовывались, что называется, «из коробки». И это тоже оказалось востребованным, так как снижало затраты. Это позволяло задействовать собственные возможности виртуализации аппаратно-программных комплексов и платформ хранения. Также упростилась задача размещения редко используемых или некритичных данных на низкоскоростных, но зато дешевых дисковых массивах.
Одна из самых сложных задач, с которыми сталкивается администратор систем хранения данных — это перенос данных из старого массива на новый, или, по-другому, миграция данных. Усовершенствованные технологии виртуализации хранения (например, от IBM) допускают «живую» миграцию данных посредством переноса данных в новый массив хранения без прерывания обслуживания запросов приложений на ввод/вывод. Виртуальные комплексы способны напрямую отображать запросы данных на соответствующие физические системы хранения. После завершения переноса данных старый массив может быть выведен из эксплуатации или переориентирован на использование в качестве носителя данных при репликации или резервном копировании.
Следующее поколение средств виртуализации ресурсов хранения получило новое наименование — «программно-определяемые СХД». Это дальнейшее абстрагирование сервисов хранения данных от физических аппаратных средств.
Традиционная виртуализация СХД требовала, чтобы все сервисы данных предоставлялись одним поставщиком, использующим собственную платформу в виде «устройства» (appliance). При этом в пул можно было объединить только аппаратные средства. Программно-определяемая СХД позволяет сочетать сервисы данных от нескольких поставщиков, а также различные аппаратные устройства хранения.
Это концепция сводится к тому, что поставщики перемещают сервисы хранения со своих СХД на базе специфичных аппаратных средств к своим решениям, определяемым программным обеспечением. Другими словами, эти сервисы были абстрагированы от аппаратных средств и начали определять все возможности решения для виртуализации хранения.
До сих пор эти модульные дополнительные сервисы были направлены на повышение емкости и производительности. К примеру, IBM добавила к своей платформе Storwize поддержку технологий Realtime Compression и Easy Tier. Real-time Compression (сжатие в реальном времени) позволяет увеличит объем дисковых ресурсов без значительного снижения производительности в среднем вдвое. Технология Easy Tier ранее поддерживалась только на старших системах IBM DS8000, однако после реализации этой технологии на решениях семейства Storwize ее возможности — посредством виртуализации ресурсов хранения — стали доступными различным другим системам, в том числе устройствам, использующим только флэш-память. Это позволяет IBM демонстрировать, что платформа Storwize превратилась в программно-определяемое решение.
SSD и другие новшества
Несмотря на то, что благодаря своей высокой производительности устройства на основе флэш-памяти привлекают внимание многочисленных создателей центров обработки данных, их внедрение было довольно медленным. Среди их, недостатков, например, отсутствие ряда функций, высокая стоимость единицы хранения и трудности при выявлении данных, подлежащих перемещению на эти устройства. В результате флэш-систем использование было ограничено преимущественно крупными базами данных и инфраструктурой VDI.
Концепция программно-определяемого хранения способна значительно ускорить внедрение флэш-технологий. Она позволяет интегрировать устройства на основе флэш-памяти в существующую архитектуру хранения без необходимости замены каких либо активов. Она также помогает снизить стоимость единицы хранения, обеспечивая эффективный коэффициент сжатия 2:1 (и даже больше), и допускает перемещение данных между устройствами в автоматическом режиме. Ведь не все данные используются одинаково часто, а значит, требуют для работы производительности SSD-диска. К тому же со временем необходимо освобождать дефицитные ресурсы от данных, чья актуальность снизилась.
Программно-определяемое хранение повышает ценность SSD ресурсов посредством поддержки стандартных сервисов, таких как снимки и репликация данных на флэш-массивы. Эти возможности весьма важны для того, чтобы сделать флэш-системы более привлекательными для применения в интересах массовых приложений в ЦОД. Кроме того, потребители смогут опереться на хорошо изученные сервисы от поставщиков систем хранения корпоративного класса, а не продукцию малоизвестных компаний-стартапов.
Хотя возможности программно-определяемых систем хранения первого поколения увеличивают функциональность всех типов систем хранения, их потенциальное влияние является наиболее значимым для систем хранения на базе флэш-памяти. По существу SDS первого поколения сделают возможным широкое внедрение флэш-ресурсов с целью преодоления известных проблем производительности при хранении данных в центрах обработки данных. Они разовьют преимущества флэш-систем посредством поддержки для этих устройствах обширного набора хорошо протестированных сервисов данных.
Следует, однако, отметить, что ценность программно-определяемого хранения данных не ограничивается использованием флэш-памяти. При появлении очередного нового аппаратного средства хранения предприятия захотят внедрить его быстрее, чем поставщики смогут предложить соответствующее пакетное решение. По существу концепция программно-определяемого хранения позволяет поставщикам аппаратных средств сосредоточиться на своих аппаратных средствах и подключать их к существующей архитектуре хранения. А значит, потребители реализуют преимущества новых технологий быстрее и с минимальными отрицательными последствиями.
Становление сервисной платформы управления данными
Обычно какая либо новая функция доступна только на совершенно новой платформе. Для систем хранения данных такая ситуация возникает особенно часто. Но для потребителя выгоднее и удобнее, когда ему достаточно добавить эту новую функцию к существующей у него платформе хранения, когда он избавлен от необходимости настройки другого устройства или установки новой системы хранения.
Следующий шаг в развитии программно-определяемого хранения данных состоит в интеграции программно-определяемых решений для хранения данных в платформу для сервисов данных всех типов. Конечная цель должна состоять в создании системы для ЦОД, которое позволяла бы выбирать сервисы данных от различных поставщиков в зависимости от конкретного сценария.
Но это потребует от SDS-поставщиков готовности к открытию своих платформ, чтобы другие поставщики смогли подключаться к ним свои новые сервисы. А для этого вендоры должны избавиться от отрицательного отношения к «чужим» изобретениям, которое сегодня превалирует.
Но положительные примеры тому уже появляются. Так, корпорация IBM осуществила миграцию сервисов, поддерживаемых на других платформах хранения, и их интеграцию в платформу Storwize. Это не только позволило развернуть на конкретной платформе хранения хорошо исследованные сервисы данных, но и обеспечило IBM стратегическое преимущество. Хорошим примером в этой области также является компания Bridgeworks, разработчик WAN-акселератора SANSlide. Этот акселератор оптимизирует протокол передачи вместо сжатия данных «на лету», что существенно повышает производительность при IP-репликации на большом расстоянии.
В прошлом применение акселератора SANSlide требовало развертывания дополнительной пары устройств, теперь же он встроен в платформу Storwize. Это позволяет предприятию сократить расходы за счет уменьшения количества или снижения скорости соединений, необходимых для репликации, или ускорить цикл репликации и, соответственно, восстановления. Поскольку соответствующая функциональность является интегрированной, каждая из этих целей может быть достигнута без использования дополнительной консоли управления.
Следующий шаг состоит в дальнейшем «открытии» программно-определяемой системы хранения и в превращении её в истинную платформу. Фактически речь идет о разрешении многочисленным независимым разработчикам программного обеспечения интегрировать свои приложения в данную SDS-платформу.
Предоставление такой компании разрешения на добавление ее сервисов к исходной платформе устранит возможные последствия, порождаемые добавлением новой системы хранения. Кроме того, это стимулирует дальнейшее инновации, поскольку нет необходимости повторно изобретать всю функциональность.
Еще один полезный момент для предприятия состоит в возможности добавления новых функций по мере необходимости к существующим средствам хранения без развертывания еще одной консоли управления. Это снижает потребности центра обработки данных в полезной площади и сокращает затраты времени на обучение персонала.