Непрерывности бизнеса – что входит в это понятие? Какие метрики, организационные меры могут помочь в ее ее обеспечении? Своими взглядами делится Михаил Сенаторов, заместитель председателя Банка России.
Intelligent Enterprise: Термин «обеспечение непрерывности бизнеса» звучит весьма привлекательно для потребителя услуг, и поэтому поставщики различных ИТ-систем часто по-разному трактуют его, стараясь выгоднее представить собственные продукты. Это, естественно, приводит к некоторой неопределенности. Каковы, по-вашему, корни этого понятия и каким образом менялись представления о непрерывности бизнеса со временем?
Михаил Сенаторов: Лет 20–30 назад, когда еще не было такой сильной вовлеченности ИТ в бизнес-процессы финансовых организаций, резервирование и скорость обработки информации определялись скоростью работы с бумажными документами. Она была вполне фиксированной, зависела от человеческого фактора, и непрерывность бизнеса как таковая не становилась показателем успешности компании.
Когда информационные технологии стали определять значительную долю бизнес-процессов и скорость их выполнения, непрерывность процессов стала зависеть от технологии обработки информации, ее хранения. Возникли требования к резервированию, безопасности ИТ-систем. Так началось приближение к концепции непрерывности бизнеса. Затем оказалось, что ИТ-средства – это дорого, и применять их, не считая рисков, возникающих в бизнесе от каких-либо сбоев, невозможно. Стали появляться более определенные и даже иногда количественно измеримые требования класса «скорость восстановления процесса», «степень защиты ресурсов», «степень защиты торговой марки».
Все эти требования постепенно сложились в современное понятие «непрерывности бизнеса», весьма многодисциплинарное. К нему относятся защита информации, ее резервирование, требования к восстановлению, требования к скорости прохождения бизнес-процессов, защиты торговой марки, репутации на рынке, защиты своих сотрудников, физической защиты зданий и сооружений компании.
Как складываются требования к отдельным системам для обеспечения непрерывности бизнеса?
Их определяет анализ бизнес-процессов. Возьмем наш банк. По закону у нас три направления деятельности: платежная система Банка России, поддержка национальной валюты, укрепление банковской системы.
Остановка платежной системы сразу же воздействует на экономику страны. Платеж завершает большинство бизнес-процессов. Если нельзя его произвести в течение некоторого времени, начинает останавливаться экономика. Поэтому время восстановления платежной системы после сбоев очень короткое, два часа для особо важных процессов. Шесть часов – это максимум. После этого срока начинаются следствия, для ликвидации которых требуется привлекать органы управления страной, могут понадобиться денежные резервы для выдачи банкам, то есть процесс выходит далеко за пределы управления платежной системой. Вот таким образом параметры восстановления определяет бизнес-процесс.
Система банковского надзора включает множество баз данных, аналитические приложения и отчеты, большие потоки информации. Предположим, произошел сбой одной из систем. Если эта система надзора будет стоять неделю, то в банках могут произойти события, которых ЦБ не увидит, что скажется на финансовом рынке. Но все же временные параметры здесь иные: сроки восстановления исчисляются днями, а не часами.
Таким образом, критерии непрерывности определяются требованиями бизнес-процессов к техническим решениям, их автоматизирующим. Если таких оценок не проводить, неминуемо будут потрачены на ИТ лишние средства, которые можно было бы сэкономить.
Но кроме надежности технологических систем есть и другие области, имеющие самое прямое отношение к непрерывности бизнеса. В том числе защита чести и достоинства своей организации, защита репутационных рисков. Понятие непрерывности бизнеса еще в основном техническое, оно выросло из технических требований, но в этой области имеют значение не столько технические, сколько юридические процедуры, а иногда и политические обстоятельства.
Еще одно направление – защита сотрудников. Сюда можно отнести льготные страховки, дополнительные отпуска и прочие меры, направленные на то, чтобы сотрудники чувствовали себя комфортно. Это позволяет, кроме всего прочего, набирать более качественных специалистов. Если ваши сотрудники ездят в командировки в районы или города, где складывается угрожающая ситуация, долг компании – предупредить их об опасности. Это может быть сообщение о наводнении, например, и требование, чтобы сотрудник немедленно прервал работу и вылетел домой. Либо, допустим, сотрудник находится на отдыхе и, проводя время на пляже, может не знать, что в соседнем городе уже идет гражданская война. Наш долг – во-первых, быть в курсе событий и их возможных последствий, а во-вторых, сообщить сотруднику об этом, чтобы исключить излишний риск.
Поскольку сложность и связность ИТ-систем все время растет, повышается также важность квалификации и опыта конкретных ИТ-специалистов. Если придется кого-то заменять, то можно, конечно, заменить любого другим толковым профессионалом, но новый человек не будет знать всех связей между системами. Ему не будет ясно, как изменения, вносимые в одну систему, повлияют на другие. Поэтому уже работающих, тем более давно, своих специалистов необходимо защищать, и это одно из требований к непрерывности бизнеса.
Хочу подчеркнуть обстоятельства, которых не было раньше: в непрерывность бизнеса вошли новые элементы. Это и правовые системы защиты, и психологические формы поддержки своей репутации, и маркетинговые действия, направленные на нивелирование проблем, вызванных сбоями в других областях. Здесь уже задействованы далеко не только технологии, но и окружающие области деятельности. В этом и заключается кумулятивный эффект, который возникает, когда мы переходим от защиты информации, от построения резервных технологических систем к общей концепции обеспечения непрерывности бизнеса. Об этих элементах часто забывают, а они очень важны. Ведь иногда какие-то проблемы проще решить за счет маркетинговых действий, чем за счет перестройки ИТ-систем.
Какие организационные меры могут быть приняты для обеспечения непрерывности бизнеса?
Вопросы обеспечения непрерывности бизнеса, как сложные и комплексные, должны решаться на уровне руководства банка, лучше всего, первым лицом или одним из его заместителей. Формируется комитет, в котором работают представители разных направлений. Они определяют круг важных технологий, процессов, управляющих воздействий, которые могут повлиять на устойчивость организации.
Наш опыт показывает, что все серьезные нештатные ситуации порождаются людьми, а не машинами. Как показывает наша многолетняя статистика, множественные мелкие отказы в технических системах имеют техногенную основу. Но когда к ним добавляются человеческие ошибки – они перерастают в сложные нештатные ситуации, разрулить которые иногда бывает очень непросто.
Как требования непрерывности бизнеса влияют на архитектуру ИТ-систем, управление ими?
Архитектура систем влияет на бизнес-процессы, и они сами влияют на нее, поэтому и требования к непрерывности бизнеса сказываются на архитектуре. Сложность информационных систем возрастает пропорционально квадрату числа взаимодействующих элементов. Увеличение сложности ведет к увеличению рисков возникновения сбоев. Возникновение рисков оценивается требованиями по резервированию, по развитию систем безопасности. В любом случае процесс постоянно усложняется, а влияние этого процесса на непрерывность бизнеса возрастает. Чем больше вероятность сбоя, тем больше внимания нужно уделять непрерывности бизнеса. Сделать систему «неубиваемой» практически невозможно.
Кроме того, по мере усложнения системы возникают проблемы с ее развитием, изменение одного элемента приводит к сбоям в других. Технологическое обслуживание, включая апгрейды, требует специальных окон, особенно если ваша система эксплуатируется 24х7. Если систему нельзя останавливать, потребуется резервный комплекс, на который можно будет ее переводить в случаях, когда требуется модернизация или внесение исправления в программные продукты.
Поэтому начиная с некоторого уровня сама сложность системы порождает необходимость в ее резервировании, причем даже не для того, чтобы не потерять какие-то данные, а для проведения профилактических работ или ее развития.
В своей практике мы уже столкнулись с тем, что работать с некоторыми нашими ИТ-системами можно только в выходные и праздничные дни. В рабочие дни их невозможно останавливать, например платежную систему. А выходных нам не хватает, чтобы проводить все необходимые регламентные работы. С каждым годом проблема эта усугубляется. Значит, хотя бы по основным своим комплексам мы должны иметь такое резервирование, чтобы можно было полностью «откатиться» на него, провести нужные работы на основной системе. Эти работы занимают явно больше двух дней в неделю. Затем нужно будет вернуть систему с резервного комплекса на основной. И мы все чаще и чаще прибегаем к такой технологии, чего раньше не делали. А этот подход означает, что резервные системы должны быть не хуже основных. Если есть требование «не хуже», значит, их нужно проверять, обслуживать наравне с основными.
Видно, что непрерывность бизнеса – кумулятивное понятие. В данное определение вовлекаются все новые элементы, часто взаимосвязанные. И с каждым годом значение его будет расти не только для организаций, работающих в режиме 24х7, но и для всех тех, кому необходимо в течение рабочего дня иметь бессбойный процесс.
Аренда ЦОД – тоже путь, диктуемый потребностью обеспечить непрерывность бизнеса. Небольшим организациям довольно сложно обеспечить свой дата-центр всем необходимым, включая резервирование различных систем. Это задача, требующая много средств и высококвалифицированных специалистов. Аутсорсинг – один из путей ее решения.
Существуют ли метрики, методики оценки условий непрерывности бизнеса?
Осознание самой проблемы обеспечения непрерывности бизнеса еще только начинает формироваться. Хотя есть стандарты, есть определенные требования, но это в основном чисто технические вещи, которые выросли из ИТ.
Единых общепринятых метрик изменения устойчивости бизнеса практически нет. Но в серьезных организациях складываются собственные методы и практика оценки. Вначале это качественные оценки важности тех или иных составляющих. Со временем удается перейти к количественным оценкам, в том числе в материальном и денежном выражении.
Есть бюджет на безопасность, на PR, на ИТ, на что-то еще. Если возникнет сбой в одной из систем, то сколько будет стоить его нивелирование? Оно может быть выполнено по-разному: может быть, через реструктуризацию ИТ-систем, а может быть, и иными способами. Сравнивая расходы, принимают решение закрывать те или иные риски, например, с помощью юридических действий. Выявляются и такие риски, которые можно снизить лишь единственным путем, в частности изменив ИТ-систему. Из скоординированной работы различных служб и подразделений и складываются со временем общие метрики обеспечения непрерывности бизнеса, на которые можно полагаться при составлении бюджетов. Но задача эта очень сложная, к ее решению наши компании еще только-только приступают.
Необходимо осознать саму проблему управления процессами, связанными с непрерывностью бизнеса. Это сейчас и происходит в нашем банке. Скорей всего, в следующем году у нас появится специальный орган, комитет по непрерывности бизнеса, который возглавит кто-то из первых зампредов Банка России. Комитет объединит представителей разных наших подразделений, чтобы требования, которые они предъявляют к непрерывности бизнес-процессов, были учтены при построении информационных систем, систем защиты информации, деятельности других подразделений.
Законы – прежде всего
Роман Юрченко,
руководитель направления «Индустриально-финансовый сектор» Fujitsu в России и СНГ"Все серьезные нештатные ситуации порождаются людьми, а не машинами". Мы согласны с этим тезисом, из которого следует логичный вывод: для обеспечения непрерывности бизнеса инвестировать прежде всего необходимо в человеческий капитал.
Что касается именно технологических составляющих, то в интервью подсказан довольно логичный выход – аренда ЦОД и аутсорсинг. Я считаю, что управление сложными технологическими системами надо передавать профессионалам и начинать серьезно думать о модной теме перехода к облачным вычислениям. Однако прежде всего необходимо подготовить законодательную систему. Пока в России законы не позволяют вплотную подойти к теме аутсорсинга в отраслях, связанных с персональными данными, их защитой и ответственностью за нарушение закона о персональных данных.