Фирма «ЛУКОЙЛ-Интер-Кард», дочерняя компания «ЛУКОЙЛа», занимается обслуживанием системы безналичной оплаты на АЗС «ЛУКОЙЛ». В настоящее время на территории РФ обслуживается 750 тысяч топливных карт, 2,5 млн. карт программы поощрения клиентов, 3500 терминалов на более чем 2700 АЗС.
Бизнес фирмы активно расширяется по мере освоения новых регионов и открытия там АЗС. Но со временем ее ИТ-инфраструктура, основы которой были заложены еще в середине 90-х годов прошлого века, перестала справляться с ростом нагрузки и стала тем самым бутылочным горлышком, тормозящим дальнейшее развитие бизнеса.
Как отметил руководитель департамента технологического развития «ЛУКОЙЛ-Интер-Карда» Михаил Бриф, прежняя инфраструктура не соответствовала современным бизнес-задачам. В 90-е годы не шла речь об оперативном обмене информацией между терминалами на АЗС и процессинговой системой. То же самое происходило и между филиалами и центральным офисом: весь объем данных передавался в режиме офлайн или, в лучшем случае, по электронной почте. Сейчас же задача онлайнового обмена данными между разными подразделениями стала насущной как для самой компании, так и для ее клиентов, и ее решение тормозилось именно устаревшей инфраструктурой, которая изначально не была для этого приспособлена.
Практически полностью были исчерпаны резервы по масштабируемости систем, что также мешало развитию бизнеса. Причем во многом это произошло вследствие хаотичности развития, когда под каждую новую задачу внедрялся новый сервер, что в итоге привело к ситуации, в обиходе называемой «зоопарком». Кроме того, устаревший ЦОД не позволял обеспечивать необходимый уровень доступности. Значительная часть регламентных работ по техническому обслуживанию требовала прекращения работы сервисов и была сопряжена с проведением ручных операций, что также занимало много времени и являлось причиной ошибок.
В итоге руководство «ЛУКОЙЛ-Интер-Карда» приняло решение запустить комплексную программу модернизации ИТ и повышения доступности ИТ-сервисов на АЗС. Как отметил заместитель генерального директора по операционной деятельности компании Николай Яшин, стояла задача от систем, собранных «на коленке», перейти к промышленному решению и промышленным стандартам. В качестве партнера проекта была выбрана компания «Инфосистемы Джет».
На первом этапе было развернуто оборудование в коммерческом ЦОДе, отвечающем необходимым требованиям бесперебойного электропитания, кондиционирования и пожарной безопасности. На новой площадке для наиболее критичных систем были созданы виртуальная инфраструктура с единым центром управления, централизованная система резервного копирования, отказоустойчивая система хранения данных, внедрены автоматизированные решения по обеспечению доступности ИТ-систем. Кроме того, для нового ЦОДа была спроектирована и построена сеть передачи данных.
Следующим шагом стал физический перевод из старого ЦОДа «ЛУКОЙЛ-Интер-Карда» оборудования, специализированного ПО, баз данных и двух процессинговых систем — offline- и критически важной online-системы. Необходимо было перевести свыше пятидесяти серверов, причем ряд наиболее критичных систем — без остановки их работы. Это был один из самых сложных этапов проекта. Положение осложняло то, что в ходе физического перемещения серверов имели место логистические проблемы. В итоге для того, чтобы своевременно запустить системы на новом оборудовании, пришлось прибегать к восстановлению из резервных копий. Процессинговые системы удалось перенести в новый ЦОД с минимальным временем простоя. Для этого на старой площадке было установлено ПО репликации виртуальных машин и организован туннель между двумя ЦОДами, что позволило полностью автоматизировать процесс миграции.
Основу платформы составили серверы и системы хранения данных IBM. В качестве серверов баз данных был использован кластер из двух серверов System p на базе RISC-архитектуры POWER, работающих на промышленной Unix-системе AIX. Серверы приложений располагаются на серверах стандартной архитектуры System x в стоечном исполнении и BladeCenter. Для повышения эффективности и надежности функционирования применяются средства виртуализации. Для RISC-систем это фирменные программно-аппаратные средства IBM, для систем стандартной архитектуры — решения VMware. Сеть хранения данных построена на коммутаторах Brocade.
Далее началась подготовка к переводу систем на аутсорсинг. Как отметил руководитель департамента ИТ-инфраструктуры компании «ЛУКОЙЛ-Интер-Кард» Владимир Родневский, в связи с планируемым увеличением объема, а также с появлением необходимости в специалистах по дополнительным специальностям для сопровождения ИТ-инфраструктуры было принято решение о выводе части функций на внешнее обслуживание. Это позволило избежать существенного увеличения штата собственных сотрудников, связанных с техническим обслуживанием систем, а также снизить дополнительные административные расходы. К централизованной системе мониторинга сервисного центра компании «Инфосистемы Джет» были подключены все компоненты ИТ-комплекса «ЛУКОЙЛ-Интер-Карда», включая процессинговые системы. Специалисты «Инфосистем Джет» осуществляют их мониторинг и администрирование в режиме 24×7×365. Для наиболее критичных систем время доступности составляет 99,93%. Специалисты компании «ЛУКОЙЛ-Интер-Кард» осуществляют контроль функционирования ИТ-инфраструктуры, а также выполнения параметров SLA с использованием централизованной системы мониторинга.
Следующим проектом стало построение системы контроля функционирования терминальной сети, активного сетевого оборудования и арендованных каналов связи. В настоящее время в контур мониторинга включено более 2900 объектов. Система спроектирована на базе программных продуктов компании SolarWinds, которые позволяют проводить мониторинг параметров, сбор данных о событиях, их корреляцию и определять первопричины сбоев. Это стало возможно благодаря стандартизации средств мониторинга. Ранее разнородные средства не позволяли полноценно решить данные задачи. Реализовано оперативное оповещение сотрудников «ЛУКОЙЛ-Интер-Карда» о выявленных сбоях по электронной почте и через SMS, автоматизирована регистрация данных о них в форме инцидентов в системе Service Desk. В итоге проекта руководство компании получило инструмент для отслеживания параметров уровней обслуживания, а также внутренних показателей эффективности. Причем можно контролировать работу как собственного персонала, так и внешних сотрудников компаний-аутсорсеров (помимо «Инфосистем Джет» к обслуживанию систем «ЛУКОЙЛ-Интер-Карда» привлекается также «ЛУКОЙЛ Информ»).
Именно выработка SLA, как отметил Николай Яшин, была одной из наиболее сложных фаз данного проекта. Процесс разделения различных систем по уровню критичности для бизнеса и определения для каждой из таких групп экономически обоснованных показателей по максимальному времени простоев занял около шести месяцев.
Первым осязаемым результатом проекта, как отметил Михаил Бриф, стало то, что дежурная смена теперь видит в реальном времени, как функционирует терминальное оборудование на АЗС. Вместе с тем от офлайнового режима полностью отказаться не представляется возможным, поскольку многие АЗС расположены в местах, где отсутствуют каналы связи, не считая низкоскоростной и не слишком надежной сотовой. Но система даже в этом случае позволяет выбрать сеть оператора, которая позволит передать данные с максимально возможной для этих конкретных условий скоростью.
Другими важными результатами проекта стали:
- возможность выполнять значительную часть регламентных и восстановительных работ без полного прекращения функционирования сервисов;
- ускорение ввода в эксплуатацию и изменения конфигурации серверов;
- уменьшение сроков диагностики неисправностей терминального и каналообразующего оборудования;
- повышение ответственности за проведение работ со стороны аутсорсинговой компании;
- снижение эксплуатационных расходов за счет более эффективного использования оборудования.
Перспективы проекта связаны с расширением функциональности системы мониторинга. Он должен будет охватить все ИТ-сервисы компании, как внутренние, так и внешние. Планируется внедрение системы аналитической отчетности. И наконец, должна быть сформирована база данных управления конфигурациями (CMDB), что позволит перейти к построению полноценной системы управления ИТ-активами и жизненным циклом оборудования.