В кризис и посткризисное время основной задачей является снижение затрат. Об этом говорят все, и мы в том числе. Однако снижение затрат, и это тоже всем очевидно, не должно проводиться в ущерб интересам бизнеса. И надежность функционирования систем — один из важнейших, если не самый важный параметр, характеризующий работу ИТ. Тем более что данные показатели рассчитываются, и можно относительно легко договориться с бизнесом о том, ниже какого уровня надежности опускаться нельзя и сколько денежных средств для этого необходимо.
Для того чтобы количественно оценить уровень отказоустойчивости центров обработки данных, существуют стандарты — национальные, международные, отраслевые. Однако они регламентируют требования отнюдь не к серверам, системам хранения, активному сетевому оборудованию и прочему, что относится к епархии ИТ‑службы. Ведь ЦОД делают таковым инженерная инфраструктура и помещения, соответствующие определенным стандартам. Точно так же, как лес — это отнюдь не только одни деревья, это обширная и сложная экосистема, куда, наряду с деревьями, причем разными, входят еще подлесок, подстилка, насекомые, другие животные и много чего еще.
Вместе с тем, эти затраты очень часто не включаются в ИТ-бюджет. Это относится даже к затратам на электроэнергию, без которой ИТ‑системы будут неработоспособны. То же самое относится и к подготовке помещений или даже строительству отдельного здания. Это, к слову, дополнительный повод для диалога с бизнесом, поскольку такие затраты в ИТ-бюджет не входят.
Наиболее комплексным из этих стандартов считается американский ANSI/TIA-942, последняя редакция которого принята в 2005г. Существует его неофициальный перевод на русский язык (http://www.rvip.ru/files/1078/Standart_TIA_942_ЦОД. rar), причем не один. Похоже, что свой вариант перевода есть у каждого из ведущих интеграторов, которые занимаются созданием ЦОД. Кроме того, многие учебные пособия по проектированию дата-центров представляют собой все тот же перевод текста данного стандарта с комментариями. С большой долей вероятности, именно ANSI/TIA-942 станет основой для международного стандарта ISO. В стадии разработки также находится европейский EN 50173‑5, который, в свою очередь, должен стать основой для российского ГОСТа. Хотя сейчас действуют отечественные СНИП, регламентирующие целый ряд требований к помещениям, предназначенным для размещения ИТ-оборудования.
Согласно ANSI/TIA-942, устанавливается четыре уровня отказоустойчивости ЦОД. Базовые требования, необходимые для соответствия им, приведены в таблице. Как видно, инженерная инфраструктура ЦОД уровня TIER 1 ориентирована только для удовлетворения текущих потребностей, без резервирования и избыточных ресурсов. В ЦОД уровня TIER 4 реализовано дублирование всех систем с учетом того, что в каждой системе и ее «резервной копии» будет находиться еще как минимум один дополнительный компонент, обеспечивающий резервирование по схеме как минимум «N + 1». Это позволяет сохранять работоспособность систем в любом случае. Однако создание такого ЦОД — дело весьма дорогостоящее и долгое. В результате дата-центров, чей уровень соответствует TIER 4, существует лишь два во всем мире. Хотя и это не предел, и в новых версиях стандарта, как полагают некоторые эксперты, будет введен новый уровень, где требования будут еще более жесткими. Однако у этих стандартов есть один, но очень существенный недостаток: на настоящий момент не существует органа, который бы проводил независимую проверку на соответствие ЦОД тому или иному уровню надежности. Эту функцию берет на себя Uptime Institute — авторитетная международная организация, занимающаяся вопросами обеспечения отказоустойчивой работы компьютерных систем.
Стандарт ANSI/TIA-942 во многом является результатом работы специалистов именно Uptime Institute, так что требования к ЦОД на их соответствие тому или иному уровню TIER в целом те же. Существует лишь два отличия между уровнями надежности согласно ANSI/TIA-942 и Uptime Institute, но они крайне важны:
- уровни TIER, подтвержденные Uptime Institute, есть результат внешнего аудита, а не самопроверки;
- сертификация на уровни TIER 3 и TIER 4 требует обязательного анализа проекта.
Кроме того, в отчете, который производится по результатам аудита, обязательно указываются такие факторы, как наличие в непосредственной близости от аттестуемого объекта источников потенциального риска. В таком качестве выступают военные объекты, производства, где используются агрессивные субстанции или взрывоопасные изделия (химические, нефтеперерабатывающие, предприятия по производству и утилизации боеприпасов), шоссейные и железные дороги, по которым перевозятся горюче‑смазочные материалы и взрывоопасные грузы, гидротехнические сооружения. Играет роль и нахождение объекта в зоне, подверженной высокому риску опасных природных явлений (наводнений, оползней, лавин, селей, ураганов, землетрясений и т.д.). Вместе с тем, данные факторы напрямую не влияют на сертификацию. Не регламентируются детально и параметры такой важной системы, как средства пожаротушения. Однако это сделано намеренно, поскольку требования к ним в разных странах существенно отличаются.
Важно отметить, что определение класса, соответствующего тому или иному уровню надежности, выставляется по параметрам наименее защищенного компонента. Так что слова о том, что уровень ЦОД будет соответствовать «TIER 2+» или «почти TIER 4», — маркетинговые заклинания чистой воды, а значит, с вами играют не очень честно. С другой стороны, наличие у интегратора специалистов, имеющих сертификаты Uptime Institute, может служить одной из гарантий профессионализма. Главным критерием для оценки уровня TIER должно стать время, на которое могут быть остановлены сервисы без значительного ущерба для бизнеса. А оно может очень сильно различаться даже в пределах одной компании. Например, у оператора связи простой биллинговых систем даже в течение минут приводит к огромным убыткам, в то время как для остальных ИТ‑сервисов некритичным может быть их отсутствие в течение часов, а то и дней.
Так что следует осознавать, что далеко не всегда будет целесообразным строить ЦОД слишком высокого уровня надежности. Прежде всего, это дорого. Так, для соответствия TIER 3 и выше нужно строить для ЦОД отдельное здание, да и общие затраты времени на создание дата-центра «с нуля» составляют около полутора лет. Плюс ко всему, требования высоких уровней TIER могут быть трудновыполнимыми и по ряду других причин. Например, для достижения TIER 3 необходимо иметь полноценную энергоустановку, что не всегда удается согласовать с контролирующими органами. ЦОД такого уровня, чье соответствие подтверждено сертификатов Uptime Institute, в России просто нет. По крайней мере, на момент написания этих строк. Так что одним из антикризисных решений стало появление так называемых треш-дата-центров. Это площадки максимально бюджетного класса, расположенные в ангаре или складском помещении. Размещение оборудования там стоит в три раза дешевле, чем в полноценном ЦОД класса TIER 2. В них инженерные системы сведены к минимуму: климатические системы отсутствуют, охлаждение происходит за счет естественной конвекции, системы бесперебойного электропитания, если они нужны, потребитель устанавливает за свой счет. Причем услуги таких ЦОД пользуются стабильным спросом. Хотя, конечно, высококритичные приложения на таких площадках тоже не размещают.
Но все же истина находится где‑то между этими двумя полюсами. Соответствие уровням TIER 1 или 2 будет оправданным для большинства компаний.