Одна из тенденций 2007 года — повышение внимания к вопросам обеспечения непрерывности. В последнее время для российских компаний заметно выросла стоимость простоя основного бизнеса. Как обезопасить себя от непредвиденных происшествий? Как защититься от аварий и катастроф? Данные вопросы обсуждались на семинаре по обеспечению непрерывности бизнеса, организованном компаниями «Ай-Теко», Microsoft и HP.
Основным докладчиком на мероприятии был Пол Хони — известный на Западе как «ликвидатор» последствий терактов 11 сентября 2001 года. В 1997—2003 годах он, как первый вице-президент финансовой корпорации Merrill Lynch & Co, отвечал за глобальное планирование на случаи нештатных ситуаций и программы по обеспечению непрерывности бизнеса. Meryll Lynch была крупнейшим арендатором площадей в одной из «башен-близнецов» в Нью-Йорке, разрушенных в результате террористической атаки 11 сентября. Кроме того, он являлся руководителем комитета по планированию непрерывности бизнеса (BCP) Ассоциации индустрии безопасности США, а в 2002 году был избран в Зал славы планирования бесперебойности бизнеса (Contingency Planning Hall of Fame). Пол Хони рассказал, чтó предпринималось в экстраординарном случае атаки на башни-близнецы и как восстанавливалось функционирование корпорации.
То, что российской аудитории впервые было представлено видение практика бесперебойности бизнеса, позволило привлечь к семинару внимание более 60 представителей крупных российских компаний, преимущественно банковских и телекоммуникационных. Столь высокую востребованность темы бесперебойности бизнеса сложно было ожидать даже пару лет назад. Однако после американских терактов 11 сентября 2001 года и особенно после московских терактов и энергетических аварий руководители компаний всё чаще стали задумываться о необходимости защиты бизнеса от непредвиденных критических ситуаций.
Катастрофа
Первая тревожная информация поступила утром. «Сначала мы не могли понять, как большой коммерческий лайнер мог взять и врезаться в башню Всемирного торгового центра, мы думали, что это какой-то маленький самолетик типа Sesna, — вспоминает Пол Хони. — Штаб-квартиры многих фирм, центры обработки данных, основные и резервные центры оказались вне доступа сотрудников, вся территория, а это около тридцати улиц, была оцеплена, и никто не мог пройти туда, чтобы посмотреть, что происходит, и тем более воспользоваться какими-то ресурсами». Потом все пришли в себя, и появилась телевизионная картинка с места катастрофы. Естественно, было объявлено чрезвычайное положение, авиакомпании перестали работать, а CNN вела постоянное вещание с места события.
«Через семь-восемь минут мы поняли, что же произошло в действительности, и наш командный центр начал предпринимать определенные действия, — продолжает рассказ Пол Хони. — Прежде всего нужно было любыми способами наладить связь. У нас были открытые конференц-линии, и медленно, но очень верно люди начали подсоединяться к ним и сообщать о своих проблемах. К 9:25 моя группа по обеспечению бесперебойности бизнеса организовала единую точку контакта, которая очень быстро стала главным центром сбора и обмена информации. В 9:59 упала первая башня, и хотя мы были в ста ярдах от нее, мы испытали настоящий шок». Тем не менее стали организовывать разные центры управления — по работе с полицией, с людьми и т. д. К 10:30 люди окончательно поняли, чтó произошло, и начали смиряться с этой катастрофой.
Масштаб разрушений был огромен. Наверное, все еще помнят эти кадры, когда рушились одна за другой «башни-близнецы». Погибло огромное количество народа, в том числе около девяти тысяч сотрудников Meryll Lynch из корпоративных, финансовых и кадровых служб, а также три тысячи торговых агентов. Сразу прекратили существование все типы коммуникаций, они просто расплавились. Но основной офис Meryll Lynch напрямую от террористической атаки не пострадал.
«Примерно в 11:00 мы организовали кризисный Web-сайт, который одновременно стал еще одним источником информации и коммуникационным каналом. Мы начали рассылать сообщения сотрудникам не только по Америке, но и по всему миру, чтобы они получали информацию из первых рук, и приглашали их обращаться в наш командный центр».
Поиски людей
На следующее утро командный центр Meryll Lynch из-за угрозы взрыва вынужден был переместиться в резервное здание. «Во время этой эвакуации пятьдесят главных человек компании в течение получаса руководили глобальной империей Meryll Lynch прямо c улицы, — говорит Пол Хони. — Мне пришлось отправиться в альтернативный ЦОД, а это чуть меньше трёх миль по пыли, пеплу и страшной жаре. Когда я наконец прибежал, на меня, наверное, было страшно смотреть: весь потный и покрытый коркой грязи. Во второй половине дня мы приступили к восстановлению связей со всеми нашими отделениями по всему миру и одновременно начали искать своих сотрудников».
Прежде чем заниматься ИТ и системами резервирования, надо было создать команду, без неё никакая технология обеспечения бесперебойности работать не будет. Воздействие катастрофы на людей было чрезвычайно сильным, многие выпрыгивали из окон, а уцелевшие остатки башен какое-то время были заняты под морг… «Там не было целых тел, а только фрагменты, и запах смерти распространялся по всей территории и висел над ней ещё очень долго, — рассказывал Пол Хони. — Многие сотрудники центрального офиса пропали: пережив столь сильный шок, они уехали из Нью-Йорка, и их пришлось выслеживать по кредитным картам». Даже вывести людей из здания — это сложная комплексная проблема. Ведь при катастрофе такого масштаба люди не просто выходят из здания, они бегут, и потом приходится искать их. Тем более, что там не осталось свободного места, всё было завалено обломками. Только к вечеру руководители Meryll Lynch восстановили связь с сотрудниками через их домашние компьютеры и стали привлекать их к работе.
«Мы столкнулись еще с одной большой проблемой: кто несет основную ответственность за действия в катастрофической ситуации? — рассуждает Пол Хони. — Нужно иметь все необходимые разрешающие документы, особенно если в ликвидации последствий катастрофы принимает участие армия. Меня, например, чуть не застрелили, когда я пытался попасть в свой офис. Все эти вопросы вы должны решить, прежде чем заняться высокими технологиями».
Восстановление
Когда первые волнения немного улеглись, Полу Хони пришлось предпринять некоторые действия, чтобы можно было оценить ущерб: «Бумага, конечно, хорошая вещь, но она, к сожалению, горит, а моим первым заданием было вернуться в основное здание и найти записи, связанные с оплатой труда руководства фирмы. Хорошо еще, что вся необходимая учетная информация хранилась в компьютерах».
Опыт Meryll Lynch хорошо показывает, какое значение имеют технологии резервного восстановления и зеркалирования. «У нас была основная система на мэйнфрейме и около 10 петабайт информации, и все это синхронно зеркалировалось, благодаря чему мы не потеряли ни бита, — отмечает Пол Хони. — Но кроме этого работу корпорации поддерживал огромный распределенный ЦОД из 20 тыс. серверов, многие их которых находились в разрушенных зданиях. Для восстановления этих данных пришлось обратиться к резервным копиям на магнитных лентах. Из 20 тыс. магнитных лент пять или десять были повреждены, но самое трудное состояло в том, что они хранились в основном ЦОДе. Найти ленту в горящем здании… это было почище, чем искать иголку в стоге сена! Вы хорошо знаете, что многие программы резервирования оптимизированы для записи, но никому не приходило в голову оптимизировать их для чтения, а это неправильно, и теперь мы это хорошо поняли». Естественно, что процесс проверки и обработки всех этих лент был для сотрудников Meryll Lynch очень напряженным.
Кроме того, в первую неделю после катастрофы понадобилось установить более 5,5 тыс. настольных ПК взамен тех, что были потеряны из-за катастрофы.
«Немало проблем доставили нам телевизионщики и вообще СМИ, которые в буквальном смысле этого слова гонялись за сенсационными деталями, в реальном времени через спутниковые каналы транслируя ваши слова, — посетовал Пол Хони. — А слова, как известно, могут быть не только полезными для вашего бизнеса, но и убийственными. Например, если вы говорите, что да, это катастрофа, но у нас есть план и мы уже предпринимаем все необходимы действия, то конечно же такая информация скорее успокоит ваших партнеров, чем общие отговорки. Компания потратила около 2700 часов на звонки, более 37 тысяч сообщений было разослано нашим клиентам, сотрудникам и партнерам, чтобы объяснить им, как идут дела». Только через шесть недель руководители Meryll Lynch смогли вернуться в свое основное здание.
***
Безусловно, атака на башни-близнецы — это экстраординарный случай, с которым не пожелаешь столкнуться и врагу. Но опыт Пола Хони позволяет кое о чем задуматься и сделать соответствующие выводы. И дискуссии на семинаре «Ай-Теко», возникшие после доклада, это подтверждают. «Информация об опыте Meryll Lynch несомненно применима и в российских условиях, — уверен консультант отделения “Ай-Теко Бизнес Консалтинг” Максим Климов. — Безусловно, любая компания подвержена воздействию внешних и внутренних негативных факторов, способных нанести существенный ущерб ее бизнесу. Зачастую после таких воздействий компания несет ощутимые потери, а иногда и вообще перестает существовать. Однако при разработке организационно-технологических компонентов обеспечения бесперебойности бизнеса трудно бывает предугадать, насколько разрушительны для компании будут последствия тех или иных чрезвычайных ситуаций, сколько времени и сил понадобится на восстановление нормального функционирования предприятий в наших реалиях. Доклад Пола Хони содержал в себе не только изложение последовательности выполненных действий, но и бесценную информацию об ошибках и просчетах, которые имели место при планировании и организации бесперебойности бизнеса, а также при восстановлении нормальной работоспособности корпорации».