Развитие средств бизнес-анализа в банках напрямую связано с изменением их стратегии, с переходом от корпоративного рынка, где все они долго и успешно существовали, к рынку физических лиц, в частности к массовому кредитованию. Множество банков, и крупнейших, и средних, и небольших, пытаются занять свою нишу в этом относительно новом для России сегменте. Делают они это по-разному, некоторые пытаются идти нетрадиционными для отечественного рынка путями, но для всех необходимым фактором становится перестройка ИТ-систем. Повышение производительности сетей, централизация приложений, внедрение принципиально новых классов ПО, таких как CRM, мобильный банкинг, развертывание процессинговых центров, — все эти шаги составляют непременное условие трансформации бизнес-модели. Использование средств BI и, как основа, построение хранилищ данных — очень важная компонента в движении по этому пути.
Эти вопросы активно обсуждались на конференции «ИТ в финансовом секторе», которую провела компания AHConferences. Однако ситуацию c BI-системами в банках усложняют три фактора. Один — постоянный прессинг регуляторных органов, все новые и новые требования к отчетности, которые часто бывают непредсказуемы. Это стимулирует желание сохранять всё что можно: ведь неизвестно, что затребуют в следующий раз. Другой — рост масштабов бизнеса за счет слияний и поглощений. Когда эти факторы складываются, проблема мучительно обостряется: очень много часто меняющейся отчетности при резко выросшем объеме данных. И плюс к тому — не для всех, разумеется, но уже для заметного количества заказчиков — требования «головной организации» в лице международных финансовых групп. И хотя Базель II — пока еще будущее для российской банковской системы, готовятся к нему практически все крупные игроки уже сейчас. Так что отчетность — актуальная, полная, достоверная — нужна как никогда.
Многие банки создают хранилища данных, но поскольку это проекты сложные и долгие, очень мало кто может сказать, что хранилище у него уже есть. Опыт нескольких таких организаций: Центрального банка РФ, Еврофинанс-банка, Росбанка, ВТБ-24, Русфинансбанка — был доложен на профильных конференциях и форумах по BI в текущем году. В этих проектах прослеживаются некоторые общие черты, но было бы неразумно утверждать, что такие же черты характеры для всех банковских хранилищ в России, ведь их уже десятки. Но тем не менее общее есть.
1. Хранилище — это очень трудно. Хотя проекты, о которых идет речь, затевались далеко не неопытными юнцами, практически все докладчики отмечали, что уровень сложности проекта оказался для них неожиданным. Одно из мнений: самое трудное — создавать собственную модель хранилища на основе требований банка. При этом построение хранилища — это организационное изменение, а совсем не ИТ-инициатива. И одновременно хранилище — это настоящая ИТ-система, именно система, а не отдельное приложение. Поэтому комплексность подхода как с точки зрения организационной, так и с точки зрения архитектурной необходима, но достичь ее нелегко. В том числе потому, что чаще всего хранилища начинаются не как глобальный комплексный проект, а как отдельный тактический шаг для решения частной задачи.
Судя по всему, практически никто не начинал строить хранилище как стратегически важную для бизнеса систему. Все пытались сначала решить частные, тактические задачи, довольно быстро получали нечто раздробленное, но параллельно входили во вкус, а главное — во вкус аналитической работы входили функциональные пользователи. Затем уже проект переводили в другой, стратегический статус и дальше развивали его комплексно. С пониманием высокой сложности и множества зависимостей связан технологический вывод: необходимы серьезные ETL-инструменты, более простыми, подручными средствами обойтись не удастся.
2. Хранилище — всегда бизнес-проект, но крайне сложно донести его суть до бизнеса. Нередко поворотным моментом оказывается необходимость готовить обязательную отчетность, а делать это своевременно просто не хватает ресурсов. Только полная заинтересованность бизнеса в результатах позволяет двигаться вперед. Марат Валеев, заместитель начальника управления развития информационных технологий Еврофинасбанка, дает два совета в связи с «бизнес-природой» проектов создания хранилищ. Во-первых, разбивать проект на относительно небольшие этапы, не более полугода, дабы за это время завершить часть работ с ясным результатом и показать этот результат бизнесу. Не пытаться сделать сразу всё желаемое, а двигаться поэтапно — на этом настаивают все. Во-вторых, постоянно и неустанно пиарить проект хранилища внутри организации, неизменно подчеркивая его пользу и управляя ожиданиями пользователей. Извне суть этого проекта совершенно не видна, заявляют ветераны «хранилищестроения».
3. Качество данных — настоящий камень преткновения. Марат Валеев, которому не откажешь в образности мышления, напоминает: «Хранилище — не шайтан-палочка, взмахнул — и получил желаемое. Скорее это сад, где работает много садовников, каждый выращивает что-то свое, а цветы — это данные, которые там хранятся». Вот набросок типовой ситуации: «Заказчикам все время нужны данные, которых в хранилище нет. Их нужно находить и загружать в него, а аппетит приходит во время еды. Поэтому постоянно надо менять учетные системы и одновременно выпускать приказы, вводить новые регламенты, заставлять те или иные подразделения вносить эти данные, заполнять новые аналитические формы. И мы три года как минимум объясняем бизнесу — данные сами по себе в хранилище не попадут, там есть только то, что туда положено». В некоторых проектах выделялся отдельный блок — построение системы контроля качества данных.
4. С чисто технической точки зрения хранилище — весьма ресурсоемкий объект, но его аппетиты можно умерить. Практический пример: вначале в распоряжении банка были малопроизводительные серверы; «боевые» базы и хранилище были территориально разнесены, и только перекачка данных с места на место занимала несколько часов.
Схема, которая позволяет снизить объемы, такова: берем один срез информации. Затем через промежуток берем другой, сравниваем их между собой. Вычленяем части, которые изменились, появились, исчезли. Тогда весь поток, выгружаемый из источника, разделяется на три меньших составляющих. Таким образом можно в четыре-пять раз сократить объем передаваемых данных. Но несмотря на множество подобных находок, на втором-третьем году активной жизни вопрос масштабирования встает ребром, и хранилище начинает требовать разнообразного оборудования, особенно мощных серверов и систем хранения. Так, у Еврофинансбанка объем хранилища за последний год увеличился на 50%. При таком росте возникает и вопрос масштабирования приложений. Один из полушутливых тезисов гласит, что какую бы систему вы ни выбрали, банки развиваются так быстро и так серьезно меняется их бизнес-среда, что невозможно несколько лет работать на одном приложении, даже самом замечательном. Однако и те, кто пять лет назад выбрал Intersoftlab (как Еврофинансбанк), и те, кто остановился на IBM BDW (как Росбанк), избранной платформой довольны.
5. Пользователи преподносят не меньше сюрпризов, чем само хранилище как ИТ-система. Получены достоверные данные: их можно обучить «аналитически самообслуживаться». Даже если придется потратить два года на агитацию за OLAP, вы не будете разочарованы: рано или поздно множеством своих запросов пользователи все же полностью загрузят серверы. Они полюбят витрины и даже начнут использовать их не по прямому назначению, а для решения совсем других, неожиданных бизнес-задач. В применении отчетов пользователи консервативны более, чем во множестве других областей: сколько бы вы ни снабжали их удобными электронными отчетами, сколько бы ни давали средств для самостоятельной работы, они все равно будут запрашивать электронные аналоги прежних бумажных документов.
Еще три года назад конференции по BI с трудом находили российских докладчиков. Теперь в них нет недостатка, и почти все — из банков. Можно предположить, что пройдет еще несколько лет и хранилища данных в финансовом секторе станут такой же распространенной, обязательной и понятной сущностью, как АБС.