Социальные сети стали аккумулятором огромного массива информации о самых разных пользователях, что подталкивает компании использовать их в качестве поставщика данных о клиентах и их потребностях.
Каждый маркетолог желал бы получить в руки инструмент, позволяющий оценивать как социально-демографические характеристики покупателей, так и их потребности. До появления социальных сервисов сложно было предположить, что люди захотят делиться такой информацией, однако сегодня данные о миллиарде с лишним потребителей находятся фактически в открытом доступе, и при использовании определенного программного обеспечения у аналитиков появляется возможность проанализировать огромный пласт данных о пользователях.
В то же время не следует надеяться на то, что социальные сети сразу помогут создать репрезентативный портрет пользователя-потребителя, настолько интересующий коммерческие компании. Для каждой соцплатформы характерна специфическая аудитория, что в некоторой мере определяется её особенностями. В частности, социальная сеть LinkedIn разработана для ведения бизнес-контактов. В несколько меньшей степени на это же нацелена и сеть Facebook. А вот для российского сегмента соцсети «Вконтакте» данная функция практически не характерна. Ясно, что в зависимости от потребностей, реализуемых участниками социальных сетей в рамках этих платформ, видоизменяются их пользовательские практики и генерируемый контент. Сложно, например, представить молодого человека, позиционирующего себя как «делового яппи» и обсуждающего на своей странице или в комментариях к другим постам плюсы и минусы докторской колбасы. Скорее (для создания имиджа) этот юноша будет рассуждать о товарах класса люкс (электронике, автомобилях и ресторанах), нежели о продуктах массового потребления. При этом вполне вероятно, что в социальной сети «Вконтакте», участники которой традиционно придерживаются более «демократичного» стиля взаимодействия, для этого же человека будут характерны принципиально иные паттерны поведения. Таким образом, изучая контент той или иной социальной сети, необходимо внятно представлять себе тех пользователей, офлайновое поведение которых компания хотела бы сопоставить с их возможным поведением в онлайне.
После того, как вывод относительно целей маркетингового исследования будет сделан, следует принять во внимание сложность получения данных из различных социальных сетей. Проще всего получить данные из микроблогинговой платформы Twitter, предоставляющей открытый API. Тем не менее существуют серьезные ограничения по объемам скачивания, так что получить большие массивы данных и здесь непросто. (В скобках заметим, что в России этот канал коммуникации прижился не до конца, поэтому к выводам на основе данных Twitter следует относиться с осторожностью. При этом Twitter, по результатам исследования Pew Internet Research, не всегда репрезентирует общественное мнение и порой может просто противостоять ему.) Чтобы получить данные небольшого объема, вполне можно использовать надстройку над Microsoft Excel — NodeXL, который позволяет не только загружать данные о связях в Twitter, об использовании хештегов и упоминаниях, но и визуализировать сеть и считать основные показатели графа. Впрочем, для серьезного анализа наряду с ним стоит использовать и другие программы, например статистический пакет R или общераспространенный Matlab.
Социальная сеть «Вконтакте» предоставляет довольно широкие возможности по загрузке пользовательских данных, оставляя открытым API, так что при желании вполне можно загрузить как пользовательские профайлы, так и данные об их взаимных связях.
Сложнее добывать данные из социальной сети Facebook. Несмотря на то, что существует большое количество программ (Givememydata,NetVizz, FriendsGraph, FriendsVisualMap, NameGenWeb), в большинстве своем они предназначены для анализа данных конкретных пользователей. Другими словами, если пользователь захочет понять, как выглядит сеть его личных контактов в Facebook, он может визуализировать свою социальную сеть, отображающую его связи с друзьями и связи друзей между собой. На основе этих данных, конечно, можно сделать множество выводов, однако они находятся скорее в плоскости выстраивания личных отношений, так что для коммерческих компаний подобные приложения и получаемая с их помощью информация вряд ли могут представлять большой интерес.
Чаще всего социальные сети интернет-пространства изучают путём сетевого анализа. Этот метод исследования, в основе которого лежит теория графов, позволяет выявить наиболее активных пользователей как по количеству содержательных взаимодействий (число комментариев и лайков), так и по формальным показателям (число друзей). При этом необходимо учитывать, что наиболее активные пользователи далеко не всегда оказываются самыми влиятельными, и наоборот. Доказательством могут служить, например, микроблоги знаменитостей: практически каждый их пост находится в фокусе внимания фанатов. Для анализа социальных сетей могут использоваться следующие инструменты: Gephi, ORA, NodeXL, UCINET, Pajek, PNET, R, Matlab. Каждый из них имеет свою определенную специфику: одни хорошо визуализируют (Gephi), другие работают с большими массивами данных (Pajek) и дают детальную аналитику (R), поэтому подобрать универсальный инструмент, подходящий для анализа социальных сетей, в принципе невозможно.
Несмотря на широкое распространение сетевого анализа, наряду с ним используются и многие другие инструменты анализа данных, получаемых из социальных сетей Интернета. В частности, в последние годы большую популярность получает анализ тональности текстов (sentiment analysis). Для русского языка, следует отметить, пока не разработано сколько-нибудь успешного решения, поэтому качественно определить тональность текстов можно исключительно в ручном режиме. Такие инструменты разрабатываются различными исследовательскими и коммерческими группами, но говорить об успешности какого-нибудь из них пока рано.
Выше мы говорили о способах сбора данных из социальных сетей и о методах анализа, использовать которые могут квалифицированные специалисты. Но что делать остальным, не столь искушенным пользователям?
Они могут воспользоваться проприетарными системами анализа социальных сетей (например, Radian 6, VisibleTechnologies, Techrigy/Alterian, Buzzmetrics и Cymfony), в основном предназначенными для коммерческих организаций (для анализа присутствия в социальных сетях брендов и их решений, анализа мнений пользователей о брендах и продуктах и т. д.). Такие системы предоставляют определенные возможности по мониторингу и анализу социальных сетей, но не охватывают задачи прогноза и управления. Стоит упомянуть и другой класс проприетарных систем анализа социальных сетей, предназначенных для силовых структур и органов государственной власти. Это в первую очередь системы разведки на основе открытых источников и системы предотвращения утечек данных. В целом следует отметить, что современные инструменты для «обычных» пользователей-аналитиков обладают вполне определенными недостатками: предоставляют скудный набор методов анализа; являются закрытыми; не в полной мере учитывают специфику социальных сетей, не обладают возможностью сбора данных и обрабатывают относительно малые их объемы.
В заключение можно сделать следующий вывод: идеальная система анализа социальных сетей должна работать на всех уровнях анализа (от мониторинга до прогноза и управления) в разных режимах (в реальном времени, в ретроспективном режиме); анализировать различные объекты социальной сети (от отдельно взятого пользователя и даже информационного сообщения до социальной сети в целом и внешних по отношению к ней источников) и учитывать разные отношения между такими объектами (связи знакомств между пользователями, связи цитирования, связи комментирования и пр.); базироваться на математических моделях и методах интеллектуального анализа данных; интегрироваться с подсистемами сбора данных из различных открытых источников (социальных сетей, блоговых площадок, новостных ресурсов и т. п.); обрабатывать очень большие массивы информации (терабайты данных, миллионы узлов сети и сотни миллионов связей между ними).
Кроме того, важно, чтобы такая система была ориентированной на «обычного» аналитика в определенной предметной области. Представляется очевидным, что разработка серьезной системы интеллектуального анализа социальных сетей для всех возможных пользователей весьма сложна и экономически нецелесообразна. Поэтому можно предположить, что в ближайшие годы появятся системы для конкретных конечных пользователей, решающих частные задачи в тех или иных предметных областях.