Вопрос использования продвинутой аналитики в российских компаниях интересен не только с точки зрения представления реализованных проектов. Это, безусловно, важно, но подобные проекты пока редки, и напрямую воспользоваться накопленным в ходе их реализации опытом могут немногие компании. Однако не менее ценны в данном случае наработки, тесно сопряженные непосредственно с опытом ведения проектов. Мы имеем в виду такие часто обсуждаемые нашим изданием и очень важные с нашей точки зрения темы, как вопрос взаимодействия с бизнесом или влияние реорганизуемого с помощью автоматизации конкретного бизнес-направления на культуру ведения бизнеса компании в целом. Характерно также, что эти моменты, связанные с проектом, куда более универсальны, чем сам проект. Рассматриваемая в статье ситуация также весьма достойна внимания в этом отношении. О методическом построении и автоматизации анализа клиентской базы в компании «Мобильные ТелеСистемы (МТС)» и о вопросах, смежных с реализацией проекта, мы беседуем с начальником отдела целевого маркетинга МТС Романом Постниковым.
Intelligent Enterprise: Само понятие клиентской аналитики сейчас уже можно считать распространенным. Однако относительно его содержательной трактовки, похоже, далеко не все однозначно. Вопрос о том, что это понятие означает, думается, стоит адресовать именно вам.
Роман Постников: Исходную ситуацию, которая, по сути, порождает понятие клиентской аналитики, наверное, можно было бы описать весьма просто. Имеется некое множество клиентов компании и множество продуктов, которое она может им предложить, а задача состоит в том, как компании при таких условиях получить максимальную выгоду.
Понятно, что в такой ситуации как минимум целесообразно изучать первичную информацию о клиентах, чтобы не тратить силы на продвижение продукции, в которой они очевидно не нуждаются. Это наиболее примитивный сценарий, и здесь мы, не говорим о глубоком анализе информации.
Далее, в случае ужесточения конкурентной борьбы, при появлении все большего числа клиентов и при развитии возможностей в отношении продуктовой линейки важнее становится понимание того, что можно предложить разным категориям заказчиков. Соответственно целесообразнее бывает использовать предиктивные модели, а с соответствующей информацией работать в статистическом аспекте.
На еще более продвинутую стадию применения клиентской аналитики компания поднимается тогда, когда речь уже идет даже не о наиболее эффективной схеме предложении имеющихся продуктов, а о разработке продукции или услуг, в которых заказчики нуждаются больше всего. Это опять‑таки новый этап методической работы с информацией, равно как и использования ИТ‑систем.
Именно эти нюансы, я думаю, позволяют говорить о различиях (порой весьма значительных) содержательной трактовки понятия «клиентская аналитика». Соответственно столь же существенно могут различаться подходы к методологическому и информационному обеспечению решения этой задачи.
В каждой коммерческой организации есть свои категории клиентов, однако вышеперечисленные нюансы в бизнесе разной отраслевой направленности и разного масштаба проявляются, наверное, в неодинаковой степени. Если говорить о компании МТС, то мы в полной мере имеем дело со всеми факторами, которые делают клиентский анализ наиболее сложным и одновременно критически важным для бизнеса.
Прежде чем переходить к вопросам автоматизации и используемым методам обработки данных, хотелось бы немного детализировать ту динамику, в соответствии с которой росла зрелость подходов к клиентской аналитике в компании МТС. Примеры зрелого применения по‑настоящему продвинутой аналитики в России встречаются нечасто, и практической информации крайне мало. В то же время некоторые российские компании вполне могут приближаться к необходимости использования серьезных методов в этой области, одновременно осознавая, что цена ошибок и неверных решений здесь слишком велика.
Сценарии начального уровня, когда информацию о клиентах начинают заносить в базу и думать, что с ней дальше делать, мы рассматривать не будем. Начнем в известном смысле со сценария «среднего уровня», когда используется так называемый продуктовый подход. А именно с той ситуации, когда компания имеет заданный набор продуктов и пытается оптимальным образом предложить его своим клиентам. То есть некий продукт изначально считается релевантным некому сегменту абонентской базы. В этом случае уже могут применяться достаточно серьезные модели предсказательной аналитики (например, модель вероятности покупки), в расчете, скажем, на то, чтобы дополнить портфель сервисов, приобретенных клиентом ранее, сопутствующей этому портфелю услугой (совершить up-sell). Таким образом, мы пытаемся максимизировать прибыль от клиента, но при этом спектр предложений считаем заданным и не принимаем во внимание тот факт, насколько он адекватен клиентскому спросу. Проблема этого подхода не в том, что мы не используем клиентскую аналитику (без нее мы просто не сделаем грамотный up-sell), а в том, что мы идем от продуктов. Иными словами, мы можем их разрабатывать, а затем даже не без успеха продавать, но у нас при этом очень мало объективных данных, дающих уверенность, что все продукты действительно будут востребованы.
Такой этап был пройден и в МТС, после чего мы поставили перед собой задачу изначально отталкиваться от информации о клиентах в маркетинговом планировании, а также от анализа целевых программ разработки и вывода на рынок тех или иных сервисов. Это, по сути, означает выстраивание всех процессов компании, самого бизнеса от потребности клиента. Здесь вполне можно говорить о неком качественном шаге не только в развитии клиентской аналитики, но и в построении бизнеса вообще. Понимать этот момент — чрезвычайно важно. Пути реализации «сквозного» клиентоориентированного подхода были конкретизированы в виде следующих направлений.
Во-первых, это определение и разработка наиболее привлекательных продуктов со строгой привязкой к профилю потребления услуг нашими абонентами. Во-вторых, речь шла об определении оптимального канала, частоты и времени коммуникации с абонентом, исходя опять‑таки из его предпочтений. Необходимость развития данного направления сопряжена с тем, что для каждого сегмента абонентской базы наиболее эффективен вполне определенный канал продвижения и его параметры. В-третьих, для нас было важно минимизировать количество ресурсов, которые тратятся на обслуживание клиентов с невысокой ценностью для компании.
Для решения этих задач мы выбрали модель поведенческой сегментации абонентов (или микросегментации), которую использует большинство европейских сотовых операторов. Состоит данный подход в том, что к так называемому профилю потребления абонентов (мы условно называем эту категорию данных Hard Data) была добавлена информация, полученная на основе обычного маркетингового исследования, проведенного путем классического телефонного интервьюирования (Soft Data). Первая категория информации представляет собой некую совокупность данных, которая собирается в ходе операционной деятельности по предоставлению услуг мобильной связи: кому звонит абонент, как часто, какова продолжительность звонков, какими сервисами он пользуется, какой у него процент звонков на телефонные номера конкурентов и т. д. Вторая — социально‑демографический портрет абонента, из которого мы получаем дополнительные знания о пользователях наших услуг. Речь идет о возрасте абонента, о том, какие у него доходы, есть ли семья, как и где он отдыхает, каким банковским сервисом пользуется, и о ряде других параметров, характеризующих стиль жизни абонента. На основе суммарной информации (или, более конкретно, на основе 192 полученных из нее параметров) мы выделили 19 сегментов клиентской базы (например, сегменты «Семья», «Всегда онлайн», «Яппи», «СМС — это все»). Эта сегментация в настоящий момент является абсолютным ключевым элементом для нашей работы.
На качественно новом этапе развития клиентской аналитики мы соответственно получаем и возможность решать новые задачи. Начнем с того, что количество итераций по оптимизации предложений, которые мы разрабатываем с учетом нынешнего профиля клиентской базы, существенно сокращается. Появляются широкие возможности для развития совместных проектов (например, с банками или туристическими компаниями), в которых интегрированная из разных компонентов услуга должна попасть в «яблочко» или быть предложена наиболее адекватному сегменту нашей клиентской аудитории. Это важно, потому что совместные предложения — неисчерпаемый резерв для развития бизнеса. Здесь открываются перспективы в отношении мобильного маркетинга или предложения товаров и услуг посредством мобильной связи.
Если выделить тот качественный шаг в развитии клиентской аналитики или создании единой платформы знаний о клиенте, какие конкретные инициативы необходимо было предпринять в области использования информационных технологий, а также, возможно, в области методологического обеспечения?
Информация категории Hard Data в любом случае содержится в системе класса Operation Support System (OSS), однако для нас важно продолжать ее последующий анализ.
Конечно, речь идет о весьма продвинутых ИТ-инструментах принятия решений: сегментации клиентов и моделирования их поведения на перспективу. Этим инструментом для нас является пакет решений SAS Telecommunications Intelligence Solutions, обеспечивающий нас интегрированными инструментами: хранилищем, отчетностью и продвинутой аналитикой (data mining). Что касается методологических инноваций, тут можно вспомнить поведенческую сегментацию, о которой мы только что говорили. И адекватный подбор вопросов маркетингового исследования для получения Soft Data, и выбор тех самых 192 параметров, по которым проводилась сегментация, представляют собой не что иное, как методическую работу. Эту информацию, кстати, мы тоже помещаем в хранилище и таким образом имеем соответствующие атрибуты в отчетности. Если говорить о методологических акцентах в целом, об общих подходах, касающихся, к примеру, обеспечения качества данных, сегментации клиентской базы, моделей предсказания, моделей хранилища, то здесь мы, конечно, не изобретаем велосипед. Иными словами, работаем с элитой консалтингового бизнеса и в конечном итоге используем Best Practice, наработанный сотовыми операторами во всем мире. Однако такие вещи, как выделение ключевых показателей клиентской информации, способы ее отображения и отчасти адаптация алгоритмов обработки данных, остаются за специалистами компании МТС. Здесь, кстати, нам оказывают поддержку решения компании SAS. Если мы хотим трансформировать встроенные в SAS TIS методы аналитической обработки информации, ориентированные на телекоммуникационную отрасль, то специализированный инструментарий позволяет нам своими силами адаптироват их или применять собственные.
Выше проблема качества данных упоминалась, но пока исключительно декларативно. В то же время известно, что наряду с грамотно спроектированным хранилищем и инструментами принятия решений вопрос качества исходных данных является, по сути, третьей технической (а может, отчасти и организационной) проблемой. Что бы вы могли сказать по этому поводу?
Контроль качества данных в нашем случае вряд ли можно напрямую сравнить, скажем, с контролем изделий на производственном конвейере, где во входном потоке, условно говоря, контроллер проверяет каждую цифру, пытаясь изловить закравшуюся ошибку. Качество данных для предиктивных моделей чрезвычайно важно, но здесь мы работаем со статистическим распределением и его параметрами. Сбой в получении информации на «атомарном» уровне тут вряд ли имеет значение. Соответственно необходимо контролировать параметры статистического распределения. Их отклонение в какую‑либо сторону может быть обусловлено случайными факторами. С этим надо разбираться, погружаясь в отчетность того же хранилища, в том числе отчетность, специально разработанную для контроля качества исходных данных. Но дрейф параметров распределений может быть связан и с новыми тенденциями на рынке. Если установлено, что тенденция действительно имела место, мы, возможно, снова должны вернуться к моделям и модифицировать их в соответствии со складывающейся ситуацией.
Использование сложных аналитических подходов в бизнесе, даже если оно жизненно необходимо для развития компании, все равно, по нашему мнению, может воздвигать барьеры между профессиональной командой, которая этим занимается, и менеджментом, ориентированным прежде всего на получение конечного результата. Алгоритмы здесь используются сложные, представляющие собой так называемый черный (ну, или, условно говоря, «темно‑серый») ящик. Будет ли верить менеджмент каким‑либо моделям предсказания? Будут ли совпадать прогнозы с тем, что получается в результате? Если вдруг не совпадет — что тогда? Иными словами, тут возникает целый спектр подобных вопросов.
Это действительно очень важный момент, комментарий к которому можно начать с тезисов, содержащихся в самом вопросе. Да, конечно, для того чтобы поддерживать развитые формы клиентской аналитики, нужны профессионалы, которые строят модели прогноза, определяют параметры описания клиентской базы, проводят ее сегментацию и т. д. Это, безусловно, профессиональная работа, деталей которой значительная часть менеджмента может совершенно не касаться. С другой стороны, в нашем случае всегда существуют люди, стоящие, условно говоря, между аналитикой и принятием решений. С их стороны крайне важно желание разобраться хотя бы в некоторых общих вещах. Но даже в этих условиях вопрос доверия к принятию ключевых решений на основе «черного ящика» все равно остается.
Приведу один пример. Мы у себя в компании достаточно успешно работаем в области прогноза оттока клиентов. Решение этой проблемы, а стало быть, и решение удержания недовольных клиентов трудно переоценить, поскольку «новых» потенциальных пользователей на рынке сотовой связи уже практически нет. В процессе работы над этой проблемой мы предприняли некую базовую проверку, которая состояла в следующем. Мы провели прямое маркетинговое исследование с целью выявить, сколько клиентов из одного сегмента недовольно предоставляемыми нами услугами, затем оценили, сколько действительно от нас ушло, и, наконец, посмотрели на цифры, полученные посредством использования моделей предсказательной аналитики. И все три числа у нас с достаточной степенью точности совпали. Данный факт очень важен, и прежде всего потому, что совпадение этих трех цифр фактически означает совпадение мнений тех категорий специалистов, которые традиционно привыкли доверять одному из трех методов получения данных значений. В данном случае я имею в виду аналитиков, менеджмент, ориентированный на получение результата, а также маркетологов. После проведения подобных проверок доверие к предиктивным моделям, безусловно, повышается, и это очень важно не только для нас, но и для бизнеса в целом.
Данный пример можно обобщить более универсальными, хотя, быть может, и не столь тривиальными рассуждениями. Дело в том, что наша работа в сфере клиентской аналитики в известном смысле сопровождается несколькими ключевыми словами. Это «цель», «точность результата», «проверка», «интерпретация». Между этими понятиями формируется определенный баланс, достижение которого возможно благодаря использованию различных инструментов. Прежде всего благодаря различным методам SAS TIS, применяемым в той или иной комбинации, и использованию хранилища — естественно, при условии обеспечения полноты и качества исходных данных. Данный баланс позволяет, с одной стороны, использовать достаточно сложные аналитические методы, с другой — обеспечивает высокую степень доверия к результатам со стороны менеджмента компании.
Вот один пример из практики. Цель в клиентской аналитике, как правило, формулируется довольно просто. Например, определить клиента, готового купить тот или иной продукт, или максимально доходного на протяжении определенного срока клиента. Мы можем использовать модели прогнозирования, качество работы которых неоднократно проверено. И точность предсказания в данном случае будет, скорее всего, достаточно высока. При этом, правда, возникнут сложности с интерпретацией результата. Но интерпретацию с нас и не всегда требуют. Считается, что это в значительной степени «внутренняя кухня» аналитиков. В любом случае есть хранилище с адекватной моделью, а также с полными и качественными данными, и полученная на его основе отчетность позволит произвести практически любые проверки post factum — и тем самым если не интерпретировать результат, то по крайней мере доказать, что модель сработала правильно.
Есть другой путь, по которому мы часто идем, работая с информацией о клиентах, готовых отказаться от услуг компании (или, в нашей терминологии, уйти в отток). Мы берем сегмент абонентов, которые уходят в отток, а далее работаем с ним, используя расширенную информацию из хранилища. То есть пытаемся понять профиль этого клиента, возможно, выделяем среди соответствующего множества отдельные кластеры, определяем логику поведения клиента, выясняем, какие действия он совершал перед этим, и т.д. Точность получаемого результата здесь может оказаться понятием более расплывчатым, чем та, которая могла бы быть обеспечена при использовании сложных предиктивных моделей. Зато с интерпретацией результатов все значительно проще, в том числе для широкого круга менеджмента компании МТС, далекого от тонкостей аналитики и задействованного в решении самых разнообразных бизнес-задач.
Мы поговорили о важных нюансах, способствующих доверию к серьезной аналитической работе, ведущейся внутри компании, со стороны бизнеса, и это, безусловно, важнейший момент. Но остается открытым вопрос бизнес-процессов. Иными словами, та же предиктивная аналитика может, скажем, позволить отказаться от лишних итераций, упростить путь к нахождению правильного решения. И возникает вопрос, не проявляется ли здесь более рельефно инертность бизнеса. Ведь столь зрелый подход к аналитике по целому ряду причин могут позволить себе использовать в основном крупные компании, но именно они в известном смысле более бюрократизированы и более инертны.
Известную долю работ в сфере клиентской аналитики мы относим к области R&D. Это неизбежно, хотя здесь и рисков больше, и сроки исполнения работ (а они построены по проектному принципу) сложнее контролировать. Но чтобы оставаться конкурентоспособными, мы вынуждены идти по этому пути.
С другой стороны, если уж мы внедрили какой‑либо аналитический подход, то должны обеспечить его стабильное функционирование. Тут вопросы бизнес-процессов действительно выходят на первый план. В МТС нам удалось создать процессы, на исполнение которых результаты аналитической работы не влияют в качестве некоего «прерывателя». Аналитика — это часть бизнес-процессов, без которых, например, целевые предложения в области услуг не запускаются в принципе. То есть любое целевое предложение обязательно походит через этап, связанный с клиентским анализом, а таких предложений мы запускаем до 300 в месяц. Но, несмотря на такие объемы, обходного пути или каких‑либо исключений здесь не существует. Достичь этого было действительно сложно, и на решение данной задачи мы потратили много времени.
Особенности масштабных BI-решений
Максим Андреев,
руководитель направления бизнес-приложений компании КРОКОператоры сотовой связи уже давно поняли, что детальный анализ данных о клиентах — конкурентное преимущество. Сегодня подобная система стала реальной необходимостью для всех крупных операторов. Если говорить о целевом маркетинге, BI-решения позволяют не только выбирать и анализировать определенную целевую группу, разрабатывать для нее маркетинговые инициативы, но и оценивать их эффективность в денежном эквиваленте, что ранее было довольно сложно сделать.
В построении хранилища и аналитики такого масштаба (а речь идет о десятках и сотнях терабайт данных) есть своя специфика. Необходимо загрузить и обработать данные и предоставить бизнесу аналитику как можно быстрее. Ежедневно десятки миллионов человек пользуются услугами оператора, предоставляя информацию для не менее чем 10 систем-источников (биллинговые системы, CRM, платформы конкретных продуктов). Обеспечение on-line обновления и расчета показателей в хранилище — довольно сложная задача, поэтому процедура загрузки (ETL) чаще всего запускается один раз в день, а задержка представления данных по некоторым показателям порой составляют два дня и более. Витрины данных в большом хранилище могут иметь иерархическую структуру, и расчет дочерних витрин возможен только после окончания расчета родительской. А это опять время и ресурсы серверов. Следующая интересная задача — это обеспечение качества данных. Бывают ситуации, при которых либо невозможно исправить выявленные ошибки в данных в системах-источниках, либо на это нет времени. В этом случае может проводиться корректировка данных в самом хранилище (корректироваться могут только данные витрин — таковы правила SOX). При этом важно сохранить консистентность данных с источниками, либо правильно согласовать и зафиксировать исправления.
Что касается обеспечения целевого маркетинга, то для него в первую очередь необходим непрерывный анализ клиентских профилей. Конечная информация зависит от модели и может представлять собой вероятность покупки абонентом той или иной услуги либо вероятность ухода абонента к другому оператору. Подобная информация постоянно изменяется и не всегда сочетается с данными корпоративной и финансовой отчетности, а также с аналитикой маркетинга массового сегмента. Например, в целевом маркетинге не так важно атомарное качество данных, а в финансовой отчетности — наоборот. Поэтому для обеспечения целевого маркетинга обычно строится витрина детальных данных. Она передается приложению, в котором как раз и происходит создание, расчет и анализ моделей поведения клиентов. Такое разделение обычно производится и на аппаратном уровне, чтобы регулярные перерасчеты моделей не влияли на работу ETL и пользовательские отчеты.