Еще несколько лет назад было установлено, что каждые два года объем информации во всем мире увеличивается вдвое, обгоняя закон Мура (исследование Цифровой вселенной «Extracting Value from Chaos», проведенное IDC по заказу EMC). При этом 80% ответственности за хранение генерируемой информации ложится на корпоративный сектор. Вместе с обеспечением требуемого количества ячеек памяти перед компаниями встает еще два вопроса: доступность данных и их защищенность. ИТ-рынок предлагает массу ответов-решений от моно-сервера с ограниченным набором ресурсов до масштабируемых инфраструктурных комплексов. К слову, в своем недавнем исследовании аналитики IDC зафиксировали рост продаж СХД в России на 35,3% (в гигабайтах).
Традиционно, корпоративный сектор предъявляет самые жесткие требования к системам хранения данных (СХД) как с технической, так и с финансовой стороны. Решения с наивысшими показателями доступности, защищенности, долговечности, масштабируемости и других параметров обладают также и высокой стоимостью, следовательно, сильно бьют по ИТ-бюджету компании или вовсе недоступны. Поэтому у ИТ-директоров средних и крупных предприятий существует четкое разделение между горячим, теплым и холодным уровнями хранения информации. Соответственно, горячие данные – наиболее востребованные, хранятся на высокопроизводительных носителях с онлайн-доступом и минимальным временем отклика, теплые данные – запрашиваемые регулярно, но не часто – на более медленных носителях, соответственно, холодные данные – как правило, архивная информация – на носителях, обладающих значительным жизненным циклом и низкой стоимостью. Комбинирование различных носителей под хранение различных по «температуре» данных позволяет существенно сократить расходы на приобретение и обслуживание системы.
Если говорить о небольшой компании, малом бизнесе, то ее потребности в СХД не столь велики, чтобы почувствовать разницу от разделения своей виртуальной информации на уровни. Здесь определяющую роль играют стоимость решения и простота его установки, использования и обслуживания. Причем готовые, коробочные, системы продолжают набирать популярность на российском рынке. К таким системам относятся обычные дисковые серверы и простейшие NAS-накопители. Важно и то, насколько легко сохранять при этом мобильность данных – отличительная черта малых предприятий. Одновременно с СХД используются также и обычные флеш-накопители, и портативные жесткие диски. Что касается основного пула производителей, то простейшие СХД представлены такими вендорами, как Dell, HP, IBM, NetApp и WD, тогда как портативные средства хранения данных – Leef, Kingston, Samsung, SanDisk, Seagate, Transcend и Verbatim.
Коробочные решения больше всего подходят компаниям, не имеющим филиалов и удаленных подразделений: маленьким офисам продаж, небольшим компаниям в сфере обслуживания, маленьким торговым организациям и организациям общественного питания. Этот рынок обширен и не удивительно, что он становится привлекателен для компаний, специализирующихся на производстве не только корпоративных, но и SOHO-систем. Достаточно вспомнить целый парад премьер сетевых накопителей серии My Cloud от WD.
Однако в этом списке особняком стоят компании, для которых важна скорость обработки данных и время отклика. К ним относятся предприятия, специализирующиеся на обработке видео, графики высокого разрешения и других емких данных. Для организаций этого типа простейшие СХД уже не подходят, хотя стоимость остается одним из главных приоритетов при выборе решения. Поэтому фаворитом являются дисковые полки (DAS), подключаемые к серверу по высокоскоростным каналам. Это достаточно производительные и простые в управлении решения, обладающие низкой стоимостью. Основным их недостатком является невозможность подключения к нескольким серверам, поэтому в DAS-системах масштабируемость практически недоступна. Но в отличие от простейших вариантов СХД технология DAS по умолчанию реализует принципы защищенности и целостности информации (первые уровни RAID).
Когда к вопросу о высокой производительности примыкают вопросы о сильной степени защищенности, масштабируемости и доступности данных, но ИТ-бюджет все еще не позволяет перейти к полноценной сети хранения данных (SAN), то единственное верное решение – построить разделяемую СХД (Shared DAS). Более того, разделяемая СХД является также важным шагом к правильной, четко выстроенной SAN в долгосрочной перспективе. Это промежуточное решение популярно среди компаний, у которых высока стоимость простоя: онлайн-сервисов, серверов продаж, биржевиков и т.п.
Сетевая инфраструктура Shared DAS позволяет использовать сразу несколько серверов, но при этом надо понимать, что масштабирование ограничено количеством портов в системе. Она отказоустойчива за счет дублирования каналов и ячеек памяти, но при этом дорогая в приобретении. Причем под покупкой разделяемой СХД подразумевается уже не только оборудование, но и ряд лицензий ПО. Тем не менее при наличии ограниченного круга бизнес-приложений, нуждающихся в серьезных ИТ-ресурсах, Shared DAS – самое эффективное капиталовложение.
Разделяемая СХД по сравнению с обычной дисковой полкой обладает еще одним весомым преимуществом – возможностью обслуживать территориально-распределенные подразделения компании в единой информационной среде. Т.е. удаленный офис получает непрерывный онлайн-доступ к СХД головной компании: бизнес-приложениям, базе данных, системе электронного документооборота, архиву. Таким образом, инфраструктура компании более прозрачна в управлении и инвестиционных расчетах.
Однако существует целый ряд компаний, кому не хватает возможностей Shared DAS. Это онлайн-биллинг больших публичных компаний, биллинговые системы телеком-компаний, крупные предприятия, биржи, большие торговые площадки и все крупные сетевые ресурсы хранения данных. Перед ИТ-директорами таких предприятий в отношении хранения данных встают сразу несколько вопросов, одинаковых по важности: обеспечение целостности, доступности и непрерывности информации, масштабируемости, прогнозируемости, управляемости, отказоустойчивости, производительности. Такой пул требований способна удовлетворить только сеть хранения данных (storage area network). Лидерами рынка СХД являются компании EMC, HP, Hitachi Data Systems и IBM, контролирующие более 80% рынка.
Сети хранения данных отличаются уникальной архитектурой в отношении к каждой конкретной компании. Однако все это многообразие построено по одним и тем же принципам: дублирование каналов передачи данных и дублирование систем хранения данных. Таким образом, вся инфраструктура разделяется как минимум на две идентичные по ресурсам фабрики. Каждая такая фабрика включает и сеть, и серверы, и СХД. При этом для нивелирования рисков простоя при стихийных бедствиях и подобных форс-мажорах зачастую элементы СХД устанавливаются на значительном расстоянии друг от друга.
С распределенностью SAN возникает потребность в высокоскоростных каналах передачи данных. Ранее был только один интерфейс, способный удовлетворить требования по скорости – Fibre Channel. Однако он обладает рядом ограничений, связанных со стоимостью приобретения и необходимостью создания отдельной сети для организации систем хранения. Хотя FC, с его производительностью (8 Гбит/с), и остается наиболее популярным в современных SAN, в дополнение к нему используется интерфейс iSCSI (IP SAN) и FCoE (FC over Ethernet).
Интерфейс iSCSI был разработан для того, чтобы упростить, и вместе с тем удешевить, включение оборудования в фабрику. Если в случае с FC требуется специализированное аппаратное обеспечение, а транспортные протоколы отличны от TCP/IP, то инкапсулированный SCSI (iSCSI) использует стандартные протоколы TCP/IP, широко распространенные карты GbE и обычные LAN-коммутаторы. Кстати, именно за счет полной Ethernet-совместимости iSCSI подходит еще и для использования с базами данных. Таким образом, стоимость SAN, построенной на iSCSI, существенно ниже, чем полностью на FC. Вместе с тем iSCSI не обладает столь высокой пропускной способностью полезных данных. Если гигабитный FC – это в худшем случае 90 Мбайт/сек, то iSCSI – в лучшем случае 50-80. Поэтому iSCSI используется в основном в небольших сетях хранения данных и под выполнение нетребовательных процессов.
С FCoE дело обстоит сложнее. Интерфейс, как и FC, требует производительных коммутаторов, т.к. работает в среде 10 Гбит/сек, но вместе с тем генерирует транспортные протоколы TCP/IP, т.е. совместим с Ethernet-системами, и позволяет избежать покупки нового оборудования. Главное преимущество FCoE – единая аппаратная платформа для систем хранения и клиентских устройств. Стоимость строительства SAN на основе FCoE соразмерна со стандартной FC SAN. Поэтому такой вариант подключения подойдет только крупным сетям хранения данных.
Набирающие популярность технологии облачных вычислений готовы составить конкуренцию всем вариантам СХД инхаус – и малым, и средним, и большим. В зависимости от вычислительных потребностей бизнеса возможны различные варианты предоставления информационных ресурсов как услуги – Iaas (инфраструктура как услуга), SaaS (программное обеспечение как услуга), PaaS (платформа как услуга). Если полноценная SAN может выступать в качестве частного облака, собственности компании, то значительно дешевле варианты гибридного облака, где часть в собственности и часть на аутсорсинге, и публичного облака, когда процесс полностью вынесен за пределы инфраструктуры компании. Возможно, в скором времени облачные вычисления смогут заметно потеснить привычные ИТ-директорам СХД и существенно расширить возможности бизнеса по обработке и хранению цифровой информации, объемы которой растут невероятными темпами.