Один из крупнейших банков страны заказал услугу аудита у сервисного подразделения концерна Schneider Electric. Целью мероприятия стала проверка эффективности работы инфраструктуры дата-центра и нескольких серверных залов.
Цели обследования
Инфраструктура дата-центра — это комплекс систем, в который постоянно вносятся изменения. Их суммарное наложение способно привести к накопительным ошибкам и нежелательным последствиям, о которых до некоторой поры владельцы и не догадываются.
Обследование инфраструктуры дата-центра позволяет вскрыть проблемные зоны и предложить способ их устранения. Такой аудит помогает снизить риски, повысить доступность оборудования, может быть, даже продлить срок эксплуатации, а также снизить капитальные затраты на этапе строительства новых площадок.
Для того чтобы быть уверенным, что инфраструктура дата-центра соответствует тем требованиям отказоустойчивости, которые были заложены для данного объекта на этапе проектирования, необходимо время от времени проводить ее обследование.
Банковские инициативы
В 2011 году в банке, являющемся одним из крупнейших финансовых учреждений страны, по факту исчерпания имеющейся мощности дата-центра было запланировано строительство двух новых площадок. Одна из них в ближайшее время будет запущена в эксплуатацию, а вторая — отведена под создание нового крупного ЦОДа. Параллельно с этими проектами в 2012м в банке начался аудит инфраструктуры нескольких уже эксплуатируемых серверных залов и ЦОДа с целью повышения надежности, оптимизации и изыскания дополнительных резервов вычислительной мощности.
К моменту аудита действующий в банке дата-центр, запущенный в эксплуатацию еще в 2008 году, вышел на режим полной загрузки — все устройства, функционирующие в нем, включая системы электропитания и охлаждения, работали практически на полную мощность.
Пробный шар
Руководство ИТ-подразделения банка провело мониторинг доступных на российском рынке методик аудита инфраструктуры дата-центров и остановило свой выбор на сервисном подразделении корпорации Schneider Electric. Перед специалистами этой компании была поставлена задача обследовать имеющуюся инфраструктуру, выявить точки возможной оптимизации и выработать рекомендации по повышению отказоустойчивости всех инспектируемых площадок.
Сначала банк заключил с Schneider Electric договор на обследование одного помещения и после успешного его выполнения работы были расширены на остальные серверные помещения и ЦОД. График обследования был согласован с эксплуатационной службой банка. Специалисты Schneider Electric пришли на объект со своим измерительным оборудованием, пробовали его работу в разных режимах, производили отключения и переключения различных зон в дата¬центре. Проведение тестов и измерений совмещалось с регламентными работами либо шло под наблюдением сотрудников ИТ¬подразделения банка. Активная фаза аудита каждого помещения заняла дветри недели, а затем еще некоторое время ушло на уточнения и подготовку отчетов.
Результаты аудита
В результате аудита по каждому из серверных помещений и ЦОДу были сделаны подробные заключения и даны предварительные рекомендации — специальное резюме для руководства банка с изложением необходимого комплекса мер. Отдельные рекомендации даны службе эксплуатации, субподрядчику и ИТдепартаменту.
Полученный заказчиком отчет представляет собой наглядный и хорошо структурированный документ, в котором четко изложено, что нужно делать и что можно получить в результате этих действий. Все работы, связанные с крупной модернизацией, отмечены особо. В каждой рекомендации указан приоритет. Документ снабжен чертежами, рисунками, диаграммами, схемами и текстовыми пояснениями к ним. К бумажной копии прилагается диск с отчетом и презентацией.
Задача достичь максимальной энергоэффективности инфраструктуры специально не ставилась, но решалась попутно. По результатам аудита состоялось совместное заседание подразделения ИТ, службы эксплуатации и исполнителей, в ходе которого был выработан план проведения работ.
Программа модернизации
Важным результатом аудита стала разработка программы модернизации, которая реализуется в настоящее время. В рамках этой программы предусмотрены краткосрочные и долгосрочные мероприятия.
Краткосрочная программа — это перечень меро¬приятий, которые сотрудники банка смогли выполнить сразу, без согласования с другими подразделениями и без какихлибо закупок. Большинство предложенных рекомендаций было реализовано сравнительно легко, в рамках небольшого бюджета, и эти затраты окупились практически мгновенно. В результате оптимизации инженерной и ИТ¬инфраструктуры дата¬центра и серверных помещений удалось высвободить дополнительные ресурсы и привлечь их к выполнению бизнес¬задач на протяжении всего срока строительства и введения в эксплуатацию нового ЦОДа.
Долговременная программа требует мероприятий по проектированию, закупке оборудования и рассчитана не на один год.
Сложность выполнения рекомендаций заключалась в том, что в действующем ЦОДе реализовать программу модернизации трудно, так как некоторые банковские системы, обеспечивающие основные сервисы, категорически не допускают остановки. По словам руководителей ИТ¬подразделения банка, самая большая проблема — выбрать тот момент, когда это можно сделать. Как только новый ЦОД будет сдан, начнется перенос систем, и программу долгосрочной модернизации старых помещений можно будет реализовывать дальше. Работу команды Scnheider Electric заказчик оценивает положительно, а методику проведения аудита считает эффективной.
Параллельно с подготовкой к принятию программы модернизации существующей инфраструктуры возникла задача повышения операционной устойчивости ЦОДа и серверных помещений. Речь идет об эксплуатации — правильном исполнении регламентов, точном следовании расписанию, оптимизации арсенала запасных частей и вспомогательных инструментов и проч. Исполнение этих рекомендаций позволит повысить уровень отказоустойчивости дата¬центра и снизить время простоя площадки.
От обследования к уверенности
Мария Мартынова, руководитель отдела по продаже сервиса компании Schneider Electric
Суть профессионального аудита в том, чтобы оценить проблемные точки и указать владельцу дата-центра, какие элементы нуждаются в модернизации.
С момента запуска услуги аудита дата-центров в компании Schneider Electric ею уже охвачено более двадцати серверных помещений и ЦОДов. Максимальный эффект при ее оказании достигается в случае обследования крупных дата-центров, построенных четыре-пять лет тому назад. Это связано с тем, что сам дата-центр по мере эксплуатации проходит эволюционное развитие. К тому же с течением времени задачи и объем бизнеса начинают меняться, соответственно меняются цели использования дата-центра и нагрузка на него. Задача аудита — скорректировать инфраструктуру ЦОДа, подогнать ее к реальным задачам бизнеса.
Не так давно в состав концерна Schneider Electric была включена компания Lee Technologies, которая специализируется на эксплуатации дата-центров. Одно из направлений деятельности этой структуры — оказание услуги аутсорсинга по операционной работе ЦОДов. С нынешнего года услугу аудита операционной устойчивости дата-центров, который затрагивает все стороны их эксплуатации, Schneider Electric предлагает и в России.
Почему это важно? Анализ критических событий в дата-центрах показывает, что причиной 80 % инцидентов является человеческий фактор. И практически все человеческие ошибки — это результат неправильно организованных процессов эксплуатации. Это значит, что либо отсутствуют процедуры ежедневной работы, либо некорректно организована процедура эскалации процессов, либо плохо продуман план Disaster Recovery, не проработана должным образом стратегия Business Continuity. Еще одна причина — плохое ведение документации.
Услуга, связанная с операционным аудитом, — это попытка приблизиться к идеалу устойчивого функционирования ЦОДа. Несмотря на то что для российского рынка это новое направление, интерес к услуге огромен.