Прежде чем говорить о внедрении системы управления ИТ-инфраструктурой, необходимо четко понимать, зачем нужна такая система и какие задачи она решает. Цели и задачи внедрения любой ИТ-системы главным образом зависят от двух вещей: уровня зрелости корпоративного менеджмента и предметной области деятельности бизнеса. Соответственно задачи, стоящие перед системой управления ИТ-инфраструктурой, могут сильно различаться. В одном случае они могут ограничиваться только мониторингом базовых компонентов ИТ-инфраструктуры (например - в офисе крупной компании), в другом задачи могут существенно усложняться вплоть до оптимизации производительности ИТ-инфраструктуры (телекоммуникационная компания) или обеспечения заданного уровня качества ИТ-сервисов для бизнес-процессов предприятия (банки, страхование). В последнем случае говорят уже не о системе управления ИТ-инфраструкторой, а о системах класса Service Level Management (SLM).
Здесь стоит отметить, что иногда проводят параллель между ERP-системами и SLM-системой. Действительно, управление в любой сфере деятельности имеет схожие цели, законы, структуру и правила. Только ERP решает задачи оптимизации управления финансовыми потоками, а SLM-системы - потоками информационными. Главная задача и там и там - добиться 100%-ной управляемости. И решение этой задачи в области ИТ, на мой взгляд, заключается не столько в том, чтобы качественно управлять отдельными элементами ИТ-инфраструктуры, а в том, чтобы дать бизнесу понимание того, как отдельные элементы ИТ-инфраструктуры связаны между собой для поддержки специфичного ИТ-сервиса, какую роль этот ИТ-сервис играет в поддержке соответствующего бизнес-процесса и, в перспективе, оценку влияния этого бизнес-процесса на финансовые результаты деятельности предприятия.
Возвращаясь к задачам, решаемым системой управления инфраструктурой, в общем случае можно выделить четыре ее уровня. Первый - это простейший мониторинг базовых компонентов ИТ-инфраструктуры: аппаратные платформы, телекоммуникационное оборудование, операционные системы, СУБД и другое системное ПО. Второй уровень - это корпоративные приложения, комплексные автоматизированные системы. Третий - это уже уровень ИТ-сервисов, которые данная ИТ-инфраструктура оказывает бизнесу. И, наконец, четвертый уровень - это мониторинг и управление автоматизированными бизнес-процессами. Но это пока в теории. На практике чаще всего можно встретить системы первого уровня, реже - второго. О третьем задумываются только наиболее "продвинутые" CIO. Четвертый - пока почти экзотика.
Давайте подробнее обсудим третий уровень. Ведь сегодня ИТ-сервисы и управление ими - самая "горячая" тема в индустрии.
Действительно так. По-сути, предоставление ИТ-сервисов - это новая парадигма продаж в ИТ-отрасли, поэтому маркетинговая машина вендоров раскручивается в этом направлении достаточно динамично. Нельзя не признать, что появление стандартов бизнес-процессов для ИТ-служб - IT Infrastructure Library - является знаковым для отрасли событием. И самое важное здесь то, что данные процессы построены именно вокруг управления ИТ-сервисами. Это существенным образом меняет мировоззрение как CIO, так и системных интеграторов. Есть еще проблемы методологического плана - как правильно сформировать каталог ИТ-сервисов, как их классифицировать, как измерять… И, наконец, самое главное - как ими управлять. Но несмотря на это, ИТ-службы уже должны задумываться над такими вопросами: какие сервисы предоставляются ИТ-системой и какова ценность каждого из них, кто потребители данного сервиса; как они его определяют и измеряют его качество; из каких элементов или компонентов состоит данный сервис; как происходит регистрация всех отклонений качества сервиса от заданного уровня; как происходит изменение текущих сервисов и т.д. А после этого "продвинутый" CIO должен пытаться выстроить бизнес-процессы своей ИТ-службы вокруг важнейших для бизнеса ИТ-сервисов. А для бизнеса взгляд на ИТ через призму ИТ-сервисов становиться реальным инструментом управления инвестициями в ИТ.
Как подходить к выбору системы для управления ИТ-инфраструктурой?
Платформ управления достаточно много. Есть традиционные лидеры рынка - так называемая "Большая Четверка" - HP, IBM, CA, BMC. Есть новые перспективные игроки - MicroMuse, Mercury, NetIQ. В последнее время Microsoft начинает активную экспансию в этот сектор рынка. Все как обычно, чем более зрелой становится технология, тем большее количество игроков на ней появляется. У каждой платформы управления есть свои преимущества и недостатки, отраслевая специфика и т.п. Мне кажется, что главным при построении системы управления является все-таки не выбор продуктов. Гораздо важнее хорошо представлять себе модель вашей ИТ-системы, понимать, как она устроена, какие процессы функционируют и как их возможно улучшить за счет автоматизации и т.д. В противном случае получиться очередное подтверждение печально известного для ИТ эффекта - 80% ИТ-служб будут использовать лишь 20% возможностей выбранной платформы управления.
С чего же нужно начинать внедрение системы управления ИТ-инфраструктурой?
Прежде всего необходимо описать ИТ-инфраструктуру - провести ее инвентаризацию. Для задач управления совершенно необходимо знать, из каких элементов состоит ИТ-инфраструктура, как они задействованы, где они расположены, с какими другими элементами связаны и каким образом, кто несет ответственность за их работоспособность и т.д. В терминах ITIL - необходимо отстроить процесс Configuration Management. Далее можно начинать решать задачу мониторинга. На базе данных мониторинга возможно получить систему метрик, которые будут описывать различные состояния как отдельных элементов ИТ-инфраструктуры, так и их совокупностей. Затем необходимо определиться с тем, какой набор этих метрик является оптимальным для успешного функционирования бизнеса и пытаться требовать от ИТ-инфраструктуры неукоснительного их соблюдения.
С одной стороны, мониторинг - это чисто техническая задача. Однако здесь есть свои тонкости - просто собрать информацию о компонентах недостаточно. Нужны модели, описывающие нашу ИТ-систему. Тогда будет ясно, как изменение тех или иных показателей влияет на работу всей системы. Если нет модели системы, если нет анализа, как тот или иной параметр влияет на функционирование системы в целом, то мониторинг мало полезен. Важно построение прогнозов, сценариев развития. Надо понимать, что если система работает сейчас, это не значит, что она будет работать через минуту. И если сегодня критического инцидента не произошло, нет гарантии, что он не произойдет завтра. Для того, чтобы прогнозировать работу системы, нужно четкое понимание того, как она устроена, какие события приводят, соответственно, к тем или иным результатам. Изучить эти причинно-следственные связи - в целом большая аналитическая работа, которая обязательно должна быть проведена.
Например, если монитор сервера БД каждое утро в 9 часов из-за массового логина пользователей сигнализирует о росте загрузки центрального процессора (но этот уровень пока ниже предельно допустимого), то важен не только этот факт сам по себе, но и его изменение во времени. Важно ответить на вопрос: когда сможет произойти превышение этого уровня в связи с ростом количества пользователей? И какое количество пользователей является критичным? Система управления ИТ-инфраструктурой на основе этих данных (динамика роста числа пользователей и уровня загрузки процессора) должна "уметь" определить вероятную дату потери качества сервиса для данного сервера БД и выдать соответствующее сообщение в систему поддержки принятия решений.
На основе данных мониторинга и адекватных моделей ИТ-системы можно провести и оптимизацию ИТ-инфраструктуры. Известно, что распределение ресурсов в ИТ-системе нелинейно - где-то есть большие резервы, а где-то - наоборот. Поняв, где у системы проблемные точки, можно увеличивать ресурс именно в этих точках. Тоже своего рода способ управления инвестициями в ИТ….
Какие проблемы могут встретиться при внедрении подобной системы?
Есть три составляющие успешного внедрения любой системы: наличие работоспособной технологии и продуктов, компетенция и мотивация персонала и желание руководства получить результат и понимание того, каким он должен быть. Проблемы возникают, когда чего-либо не хватает.
Идеальной является ситуация, когда бизнес ставит перед ИТ-службой конкретные задачи: какие ИТ-сервисы ему нужны и какого качества. При этом задача ИТ-службы - правильно определиться с бюджетом и научиться эти сервисы предоставлять. В этом случае задача построения системы управления решается классически правильно - сверху вниз.
Как можно оценить эффективность системы управления ИТ-инфраструктурой? Есть ли методики оценки подобной эффективности? Как должно происходить взаимодействие персонала с ИТ-службой компании?
Видимо, на каждом уровне системы управления метрики эффективности должны быть разными. Для первых двух уровней нормальной метрикой может быть время доступности какого-либо элемента ИТ-инфраструктуры, для третьего - количество инцидентов. Для четвертого - какие-то финансовые показатели, например, вклад данного ИТ-сервиса в себестоимость продукции, и т.п. Но необходимо всегда иметь в виду, что большая часть эффективности лежит и в принципиально неизменяемой области: удобство работы администратора, возможность получения качественно новой информации о работе системы и т.д.
Что касается взаимодействия ИТ-службы с бизнес-пользователями то, на мой взгляд, идеальной является ситуация, когда его нет вообще. Каждый сотрудник пришел на свое рабочее место, включил компьютер, и все в порядке. А когда что-то не работает - это инцидент, которого в идеально отлаженной ИТ-системе быть вообще не должно. Очевидно, исключая случаи глобальных форс-мажоров, когда, например, во всем здании выключили свет или прорвало трубы.
В реальности, чем более формальны отношения бизнес-пользователей компании с ИТ-службой, тем лучше. Очевидно, должна быть единая точка контакта в случае возникновения проблем у пользователей. Обученный оператор по описанию пользователя должен четко понять, к какому типу относится случившийся инцидент и максимально оперативно его устранить. Собственно, это один из самых хорошо проработанных на сегодня ITIL-процессов - Incident Management + SeviceDesk. Цель ИТ-службы в этой ситуации - максимально быстро восстановить для пользователя нормальный рабочий процесс, внести описание инцидента в соответствующую статистическую библиотеку, отнести его к определенному классу, найти причину его возникновения, по-возможности устранить эту причину или подготовить на будущее методику устранения подобных инцидентов. Ведь одна из целей существования SeviceDesk как раз и состоит в том, чтобы любой возникший инцидент не "потерялся", а был корректным образом отработан и закрыт его инициатором. Поэтому ServiceDesk вполне можно использовать не только для нужд ИТ… Например, на его базе можно организовать работу курьерской службы. Заявка на доставку товара - инцидент, факт доставки - закрытие инцидента.
Очевидно, что организовать такой процесс потенциально возможно и без средств автоматизации, как это и делается до сих во многих отраслях. Вопрос только в масштабах системы и требуемой оперативности ее работы.
Начинайте строить систему управления ИТ-инфраструктурой последовательно:1. Постройте фундамент системы управления (Monitoring, Inventory, Configuration Mngt, Network Mngt, Configuration Mngt, Security Mngt, Storage Mngt)2. Постройте корреляционные модели управления (Alarm Correlation, Problem Mngt, Root Cause analysis) 3. Внедрите систему планирования (Job Scheduling) 4. Постройте системы управления базовыми бизнес-цепочками (Application Mngt, Business Systems Mngt) 5. Постройте систему управления бизнес-уровня (SLA Mngt, Business Service Mngt, Billing) |