Среди специалистов по маркетингу уже давно бытует мнение, что «лучшие» потребители обладают определенным набором постоянных характеристик, которые отличают их от всего остального населения. За последние годы параметры, определяющие поведение клиентов, изменились — от демографических (возраст, образование и доход) до психографических (отношение) и даже до геопсихографических (местожительство, отношение, возраст, образование и доход), — но принцип остался прежним: кто ты есть, определяет то, что ты покупаешь или делаешь. Действительно, фундаментальное понимание того, что представляют собой ваши клиенты, открывает все потенциальные преимущества, которые они способны предоставить для вашего бизнеса.

Этот принцип не изменился даже с появлением электронной коммерции. В сущности, онлайновые технологии просто позволили специалистам по маркетингу подняться на более высокий уровень понимания своих клиентов.

К обычным способам «заглянуть в голову клиента» относятся такие методы исследования поведения потребителей, как целевые группы, групповые дискуссии и опросы. Однако, прежде чем прибегать к традиционным методам, следует осознать, что вы уже стоите за зеркалом: ваши клиенты прямо сейчас отвечают на ваши вопросы, просто делая что-то или не делая на вашем сайте.

Собирая и анализируя онлайновые данные, вы сможете разбить клиентов на определенные группы в соответствии с тем, как происходит у них процесс принятия решения, и выявить подлинные потребности и мотивы клиентов по их поведению. Вы также сможете установить, какие страницы сайта посещаются чаще всего, как происходят переходы по сайту и сколько времени посетители проводят на отдельных страницах. Вы также можете определить время посещения сайта и частоту повторных визитов.

Однако ценность этой информации существенно возрастет, если ее сопоставить с традиционными «оффлайновыми» данными, такими как сведения о счетах, транзакциях или данные центра обработки вызовов (call center). Даже в условиях беспрецедентного роста электронной коммерции и распространения Интернета важно не забывать, что Web — просто еще одни канал взаимодействия, ставший доступным клиентам. Активность потребителей в «оффлайне» по-прежнему имеет место, и это следует учитывать при анализе их онлайнового поведения.

Ранее считалось, что онлайновые и оффлайновые потребители — это взаимоисключающие группы. Однако, как оказалось, большинство потребителей используют оба способа: одни собирают информацию о товаре или услуге на сайте, а затем приобретают это в магазине. Другие полностью полагаются на онлайн, если только им не требуется техническая поддержка — в этом случае они обращаются к «живому» сервисному специалисту. Объединив эти два четко различающихся типа потребителей, вы получите более полную картину того, как ведут себя конкретные клиенты. Это очень важно, потому что, игнорируя деление на два типа поведения, вы получите одностороннее представление о потребителе. Понимание этого служит ключом к тому, чтобы точнее охарактеризовать клиента и измерить значимость его присутствия в онлайне и его полезность для общих целей и задач компании.

В этой статье речь пойдет о системе и основных способах «слияния» онлайновой и оффлайновой информации и извлечения из нее осмысленных результатов. Как и в любом другом проекте интеграции данных, здесь будут свои аномалии и исключения из правил, которые потребуют творческого подхода. Тем не менее основная цель — создать надежный логический базис отношений между данными, который позволит справиться с такими аномалиями.

Как объединять онлайновые и оффлайновые данные

Итак, цель понятна, но возникает вопрос: с какой стороны к ней подойти? Сейчас ИТ-специалисты и менеджеры, имеющие дело с онлайновыми и оффлайновыми операциями, активно трудятся над проблемой интеграции онлайновых данных с оффлайновыми. В частности, многие компании используют онлайновые средства для инициирования оффлайновых продаж. Таким образом обычно продают товары, которые, как правило, покупают «в реальности», но предварительно изучают рынок в Интернете (например, автомобили или недвижимость).

Описываемая интеграция также становится критически важной для компаний, которым необходимо оценивать экономию от использования Web (например, за счет самообслуживания клиентов). Именно в таких случаях для оценки добавочных затрат очень важны данные центров обработки вызовов и информация о Web-активности.

В большинстве случаев оффлайновые данные лучше организованы и нормализованы — все определяется тем, сколько унаследованных систем приходится интегрировать. Обычно первые трудности возникают при попытке обнаружить зерна смысла в онлайновых данных.

Правильно сконфигурируйте свой Web-сервер. Корректно настроенный Web-сервер регистрирует каждый щелчок по ссылке на сайте. Для каждого перехода по ссылке регистрируется IP-адрес пользователя, запрошенный ресурс (URL-адрес), клиентская программа, ссылка на страницу, с которой происходит переход (referrer), метка времени, код состояния HTTP и файлы cookies (если они есть). Такой подход обычно и вызывает первые сложности: журналы трудны для расшифровки, объем хранимой в них информации достаточно велик, а сами данные сильно фрагментированы. На рынке есть компании (например, SageMetrics Corp., Synera Oy и CentrPort Inc.), предлагающие обработку подобных файлов, если у вас недостаточно ресурсов, чтобы сделать это самостоятельно. Но основное эмпирическое правило здесь таково: чем лучше стандартизованы и организованы данные в журналах, тем легче и экономнее оперировать информацией. Для файлов стандартного формата можно написать программу, которая будет автоматически извлекать и обрабатывать данные. Но если формат файлов непостоянен, их обработка требует очень много ручного труда и времени.

Фиксируйте критически важную информацию в журналах. Следует с самого начала принять важное решение, четко установив, какие данные следует фиксировать в журналах и как группировать информацию. Бывает, что критически важные данные не фиксируются и возможность получить ценные сведения безвозвратно теряется. В этом смысле очень полезны сведения о запросах к поисковым системам: клиент сам точно указывает, какую информацию он ищет. Это позволяет оптимизировать сайт и заранее позаботиться о предоставлении нужных клиентам сведений. Однако в большинстве компаний данные для поисковых систем (текст, вводимый пользователем в поле поиска) не фиксируются.

Используйте данные в своих интересах. Кроме регистрации критически важной информации, следует понять, что означают собираемые сведения. Обычный сайт состоит из нескольких сотен страниц, и простые средства отчетности, например, создаваемые компаниями Accrue Software Inc. или WebTrends, позволяют точно подсчитать число просмотров или посещений каждой из страниц. Однако ценность отчета о посещениях только на уровне страниц невелика — страницы следует разнести по определенным бизнес-функциям, таким, как обслуживание клиентов, исследования, регистрация или покупки. Вместо данных о числе посещений конкретных URL-адресов вы получите более осмысленный отчет о том, сколько посетителей побывало в том или ином разделе сайта. Такой подход информативнее, так как позволяет обнаружить взаимосвязи между различными разделами, которые можно применить для управления определенными участками, например, продажами или регистрацией.

Кроме того, информация, представленная в узком ракурсе, наименее ценна. Чем лучше вы понимаете связи между различными страницами и их динамику, тем ценнее такая информация. Выявление факта, что посетители, просматривающие Flash-заставку о товаре и посещающие раздел часто задаваемых вопросов (FAQ), с наибольшей вероятностью купят товар, намного важнее, чем просто сведения о числе просмотров каждого из URL-адресов. Сопоставление отдельных URL-адресов определенным бизнес-функциям — это ключ к осмыслению онлайновых данных; в противном случае вы получите кипу отчетов, содержащих массу данных, но не дающих ответа ни на один из ваших вопросов.

Идентифицируйте своих посетителей. Идентификация посетителей — наиболее важная (и, возможно, самая сложная) цель интеграции онлайновых и оффлайновых данных. Понятие «посетитель» каждая компания определяет по-своему, но идеальное определение таково: посетитель — это уникальная личность, посещающая ваш сайт, чью активность вы способны проследить, независимо от числа посещений и их времени. Можно больше ничего не знать об этом человеке, но вы должны уметь идентифицировать всю его активность и просматривать ее в исторической перспективе. Если это не так, то понятие посетителя распространяется лишь на одну конкретную сессию в системе. В результате вместо одного пользователя, пять раз посетившего сайт, вы будете обнаруживать пять разных пользователей, посетивших сайт лишь однажды, и вам никак не удастся узнать, что на самом деле это один и тот же человек.

Способ идентификации клиентов определяет, сможете ли вы интегрировать эти данные. Если вы помните, в стандартной архитектуре баз данных таблицы связаны с помощью логических первичных ключей. Поэтому в случае с онлайновыми и оффлайновыми данными проблема достаточно очевидна: как идентифицировать онлайновых и оффлайновых клиентов и связать между собой эти два массива данных для одного и того же клиента?

В терминах онлайновых данных клиентов можно идентифицировать по IP-адресам, файлам cookies или даже по данным процедуры аутентификации, если они доступны. Однако если для идентификации клиентов по умолчанию использовать только IP-адрес, вам не удастся ни с чем его связать; единственное, что вы получите, — это возможность группировать всю информацию сеанса для конкретного пользователя в одном отдельно взятом сеансе. Если тот же пользователь вернется через пять дней, в каждый последующий визит система будет регистрировать его как нового пользователя. Подобный метод не позволяет идентифицировать уникальных пользователей и, в сущности, предоставляет вам только информацию о посещениях. А не идентифицируя уникальных посетителей, вам не удастся объединить два описанных выше массива данных.

Регистрация данных в разрезе уникальных пользователей

Если пользователи определяются по их идентификаторам при входе в систему или файлам cookies, то для идентификации уникальных посетителей сайта можно воспользоваться cookies или данными аутентификации. В этом случае данные о пользователях на протяжении некоторого времени регистрируются независимо от того, как часто и в какое время они посещают сайт. Если удается правильно сгруппировать информацию об уникальном пользователе, вы получаете возможность интегрировать ее с оффлайновыми данными.

У этого метода есть и недостатки. Как, к примеру, идентифицировать посетителя, если никакой процедуры аутентификации при входе на сайт не предусмотрено? Что произойдет, если в одной части сайта требуется регистрация для входа, а в остальных — нет? Вопрос управления файлами cookies также не имеет однозначного решения: создавать ли их при входе на главную страницу сайта или в разделе регистрации? Что, если cookies вообще не используются? Эти трудности преодолимы, но решаются они в разных компаниях по-разному. Иногда применяется комбинация из всех трех перечисленных методов, но все равно в конечном счете задача сводится к регистрации данных с разнесением по уникальным пользователям.

После группировки онлайновых данных и стандартизации формата они становятся похожими на любой другой файл данных. Для установления связи между двумя массивами данных достаточно указать первичный ключ. Критически важный момент при объединении информации — выбор первичного ключа. Им может быть комбинация имени и адреса, идентификатор учетной записи, номер кредитной карточки, файлы cookies или даже номер карточки социального обеспечения. Ключ определяется на основании конкретной структуры данных, но в любом случае он должен обеспечивать уникальное и точное сопоставление онлайновых и оффлайновых данных о конкретном посетителе. Обеспечивает ли описанный метод 100%-ную точность? Нет, в некоторых случаях обеспечить соответствие всей информации не удается. Тем не менее уже имеющегося соответствия достаточно для получения необходимых вам сведений.

Перед вами также будет стоять задача — уследить за поддержкой и обновлением сайта. Некоторые сайты весьма статичны, но есть и чрезвычайно динамичные Web-узлы, которые могут обновляться ежедневно. Tем не менее рекомендуется позаботиться о механизме, который будет автоматически устанавливать, как записывать эти изменения страниц в общей инфраструктуре данных. Например, если путь к спортивному разделу сайта имеет вид www.acme.com/news/sports, можно создавать или удалять сколько угодно страниц, посвященных спорту, — программа распознает их как спортивные при условии, что путь к ним остается тем же.

Однако реалии нашего мира таковы, что определять инфраструктуру в любом случае должен человек, потому что никакая компьютерная программа не в состоянии оценить, какова ценность тех или иных данных для вашей компании. Возьмем описанный выше пример: допустим, вы создали специальный раздел www.acme.com/news/winterolympics2002 для освещения зимних Олимпийских игр. Этот путь не соответствует критерию для «спортивных» страниц, поэтому статьи автоматически не будут классифицироваться программой как спортивные. Кому-то придется вручную указать, что путь www.acme.com/news/winterolympics2002 тоже относится к спортивной тематике.

Данные или знание

И последнее, что следует иметь в виду: создание удачной инфраструктуры данных — это критически важный первый шаг на пути к тому, чтобы заставить имеющиеся у вас данные приносить выгоду компании. Однако это не единственный шаг: во всем массиве собираемой компанией информации есть жизненно важные «информационные самородки», которые чрезвычайно важны для повышения доходов и сокращения затрат фирмы.

В прошлом компаниям приходилось принимать решения на основании недостаточных данных. Сегодня все чаще компании борются с «информационным параличом» — данных слишком много, и сложно понять, какие из них существенны, какие — нет.

Поэтому помните, что не все данные одинаково важны для ваших целей. Существует множество средств анализа работы сайта, создающих сотни отчетов, в которые содержится масса данных, но какую выгоду или какое знание они действительно способны предоставить вашей компании? У вас должны быть специалисты, которые понимают не только то, какие данные собираются, но и то, как различные виды информации соотносятся с целями бизнеса.

Сами по себе данные не обеспечивают знания — оно добывается в процессе анализа данных. Эти две составляющие взаимосвязаны. Будут ли данные в конечном счете приносить выгоду вашей компании, зависит от того, как успешно вы управляете обеими.

Квонг Сай (Kwong Sai) — вице-президент по исследованиям производительности в компании Agency.com. Квонг помогает клиентам определять метрики и меры, используемые для оценки их Web-сайтов. С ним можно связаться по e-mail: ksai@agency.com.

Статьи по теме в Intelligent Enterprise

Марк Смит. Динамическое взаимодействие с клиентами. Intelligent Enterprise №23’2001, с. 42.