Принимать решения, основываясь только на оперативных данных, весьма непросто. Помимо таких проблем, как ограниченная доступность данных, недостаточное их качество и своевременность получения, приходится учитывать и то, что внутренние данные — это в принципе ненадежный источник информации. Им не хватает контекста.

О том, что «чистых» данных недостаточно для принятия решений, и о необходимости контекста для понимания всей бизнес-среды, в которой выполняется интерпретация фактов, говорилось уже неоднократно. Осознание этого очень важно для принятия качественных решений. Поэтому лица, ответственные за принятие решения, обязательно должны своевременно получать корректные данные в верном контексте (под которым подразумеваются метаданные).

"Принятие решений, будучи практически синонимом управления, очень важно для любых менеджеров. Более того, качественное, надежное принятие решений должно основываться на информации с надлежащими атрибутами... Возможности формальных информационных систем (имеющих дело лишь с данными) в области поддержки самых разных процессов принятия решений весьма ограниченны".

Information Systems: Theory and Practice («Информационные системы: теория и практика»), Burch, Stater, Grudnnitski, 5th Edition, 1989.

Откройте глаза

Давайте для начала уточним, что такое метаданные. Мне больше всего нравится определение, данное Робертом С. Сейнером в журнале The Data Administration Newsletter (http://TDAN.com): «Метаданные — это информация, которая улучшает понимание — в плане бизнеса и технологий — данных и связанных с ними процессов; метаданные дают пользователям возможность лучше понимать данные и на основании этого принимать более удачные решения».

Традиционно метаданные более кратко определяют как «данные о данных». Сейнер расширяет это определение, привлекая внимание к возможностям, которые предоставляют сбор и применение метаданных, а также к «заказчику» метаданных — пользователю, который находится в бизнес-сфере и поэтому способен находить применение метаданным и оценивать их.

Для наших целей нам понадобится именно это довольно широкое определение метаданных, в частности, применительно к среде информационного хранилища. При этом в качестве руководства мы используем концептуальную модель, представленную в таблице.

Концептуальная модель объектов и типов метаданных

Традиционные способы использования метаданных

Рекомендуемое расширение

Этап

Источник

Извлечение, преобразование, загрузка

Корпоративное информационное хранилище

Извлечение

Отчетность

Объекты данных

База данных

Таблицы

Таблицы кодов

Столбцы

Значения кодов

Файл

Задача

Процедура

Преобразование

Расписание загрузки

Загрузочные программы

БД субъектов

Таблицы

Таблицы кодов

Значения кодов

Модель

Задача

Процедурная программа

Преобразование

Кубы

Инструменты

Поля

Методология

Термины

Пользователи

Релевантная информация извне

Отраслевые отчеты

Внутренние комментарии, обзоры, электронная почта, служебные записки и т. д.

Организационная информация, обеспечивающая контекст бизнес-данных

Типы метаданных

Технические метаданные и метаданные определений на элементарном уровне

Метаданные о движении данных на элементарном уровне

Технические метаданные и метаданные определений

Метаданные о движении оперативных данных

Бизнес-метаданные

В общем случае метаданные делятся на четыре категории по видам объектов, о которых собирается информация. Каждая категория по-своему дополняет метаданные, которые облегчают работу с данными и повышают их ценность. Первые три категории — определения элементарного уровня, технические определения и определения движения данных — общеизвестны и достаточно понятны, так что я не буду на них останавливаться. Однако бизнес-метаданные нуждаются в более детальном пояснении.

Определитесь с терминами

Бизнес-метаданные относятся к информации, которая, будучи отображенной в виде отчета, обогащает восприятие традиционных табличных (структурированных) данных. Такая информация включает используемые в отчетах бизнес-термины, методы получения отдельных элементов данных в отчете, цели создания и основные предположения отчета, а также внешнюю информацию и мнения (данные, не входящие в таблицы). Подбор состава бизнес-метаданных субъективен и определяется потребителем данных.

Основная цель подобных метаданных — обеспечить контекст для табличной информации и обогатить ее. Контекст не обязательно должен быть одинаков для всех пользователей. Например, директору по сбыту, изучающему отчет о продажах за прошлый месяц, требуется разбиение по видам товаров, и, чтобы обеспечить контекст для таких данных, может потребоваться создать сравнительные отчеты по продажам на основании различных признаков. Важными признаками в данном случае могут быть региональные параметры, действия конкурентов, в том числе маркетинговые инициативы, погода, различные социальные и политические события, способные повлиять на продажи (к примеру, такие, как события 11 сентября). Начальнику производственного подразделения те же данные следует предоставлять в другом контексте: с указанием запасов в компании, запасов в производстве, параметров линии поставок, состояния производственных средств, прогноза рынка сбыта, а также стоимости и объемов поставок сырья в количественном или качественном представлении.

Роль бизнес-данных становится понятнее после изучения самого процесса принятия решений в компании, где есть информационное хранилище. Далее мы посмотрим, как информационное хранилище вообще используется в компаниях.

Традиционный процесс принятия решения на основании информации из информационного хранилища включает операции на нескольких уровнях организации, из которых, собственно, и состоит процесс принятия решения.

На самом высоком уровне находятся цели организации, сформулированные в виде материальных показателей, на основании которых можно оценивать прогресс компании. Далее, на Уровне анализа несоответствий и действий изучается разница между нынешним и планируемым положением компании. Это уровень проверки на реалистичность. Если разрыв между действительностью и ожиданиями возрастает или компания ставит перед собой новые цели, руководство инициирует на этом уровне новые бизнес-стратегии и инициативы.

Эффект от указанных инициатив проявляется в производственных системах на Уровне производственных систем, находящемся в самом низу иерархии. Именно здесь в первую очередь заметны результаты текущей бизнес-практики. Такими результатами могут быть новые заказы, поступающие к поставщикам, изменившиеся объемы продаж и т. п.

Данные оперативного уровня далее переносятся на Уровень информационного хранилища, где для их интерпретации применяются различные инструментальные средства. Создаются стандартные и специальные (ad hoc) отчеты.

На Уровне бизнес-аналитики (Business Intelligence, BI) изучаются и оцениваются первичные данные, полученные в результате работы различных средств, например, OLAP-инструментов. Этот уровень соответствует пониманию и извлечению знаний; здесь достигается общая оценка и понимание данных, но никаких важных решений не принимается. Решения — это прерогатива уровня, расположенного на ступень выше, — Уровня анализа несоответствий и действий.

Примерно так выглядит стандартный цикл для большинства организаций, использующих информационное хранилище. В некоторых компаниях данные охватывают многие бизнес-операции, но обычно обслуживается по крайней мере одна бизнес-область, например продажи или маркетинг.

Обратите внимание, что на рисунке не показано никаких формальных процедур сбора нетабличных данных из внешних и внутренних источников и их передачи потребителю данных из информационного хранилища. Это стандартный недостаток схемы информационных потоков в обычных BI-системах. Другая популярная проблема, которую иллюстрирует рисунок, — недостаточная формальная интегрированность хранилища метаданных в общем цикле обмена информацией.

Изучите детали

Прежде чем определять, какие данные следует собирать и какие метаданные позволят разместить их в корректном контексте, следует выяснить, кто в компании принимает решения, и поближе познакомиться с ними. Обычно за принятие тактических и стратегических решений отвечают управляющие среднего и высшего звена. С большой вероятностью ваши клиенты — менеджер по продуктам или по маркетингу, финансовый директор подразделения и т. п.

Далее следует определить, какие типы решений принимаются указанными лицами или группами. Исследование их действий поможет сформировать корректные наборы информации (данных и метаданных), которые придется предоставлять в срок соответствующим сотрудникам.

Понаблюдайте за работой ответственных сотрудников, станьте на несколько дней их тенью, посмотрите на мир их глазами и выясните, с какими проблемами они сталкиваются, какие решения принимают и как это делается.

Спросите у них, каковы их обязанности в процессе принятия решений. Кто принимает окончательные решения? Кто участвует в ранних этапах процесса принятия решений? Какие роли играют эти лица, какие параметры для них важны (об этом чуть ниже) и каковы их интересы? Эта информация понадобится для настройки как на индивидуальном, так и на групповом уровне.

Вы также должны выяснить, как часто принимаются те или иные решения и в каком формате. В некоторых случаях решения принимаются ежемесячно, иногда — каждые шесть недель или шесть месяцев. Что касается формата, узнайте, какой уровень детализации данных требуется пользователям и в каком порядке следует предоставлять информацию.

Сформируйте набор данных

Чтобы определить, как объединять данные и метаданные, следует учесть несколько перечисленных далее обстоятельств.

Релевантность. Данные должны соответствовать потребностям лиц, ответственных за принятие решений. Помните, что наиболее ценная для таких лиц информация связана с мерами — показателями, по которым в компании оценивают продвижение к бизнес-цели. Примеры мер — доходы, загрузка, загруженность мощностей, процент задолженности потребителей и т. п.

Метаданные должны соответствовать данным, которые они описывают. Часть данных и метаданных, в которых нуждаются ответственные лица, уже есть в компании, но остальное следует собирать или покупать из внешних источников. Метаданные, присоединяемые к исходным данным, должны соответствовать этой информации. Например, определенные отраслевые отчеты, представляющие информативную картину, наиболее ценны, когда внутренние данные отображаются на общем фоне, причем все это снабжено качественным комментарием.

Агрегирование. Характер и подробности предоставляемых метаданных должны соответствовать уровню данных, которые они дополняют. Избыточность здесь так же плоха, как и недостаточность. Кроме того, не забывайте о частоте принятия решения. Если периодичность его составляет полгода, то и данные, и метаданные должны ориентироваться именно на полугодовые отчеты.

Безопасность. Поскольку метаданные бывают конфиденциальными (вспомните об электронной почте, личных комментариях, мнениях экспертов, бизнес-планах и стратегиях), следует соблюдать осторожность при их распространении. Даже если они относятся лишь к информации, на основании которой принимается решение в одном из отделов, все равно не в интересах предприятия предоставлять метаданные для широкого круга всех заинтересованных лиц. Иногда идут на компромисс, предоставляя информацию только устно, а не в легко воспроизводимом формате.

Принять решение о порядке объединения данных и метаданных совсем не просто. Вам придется часто возвращаться к предыдущим шагам, проверяя корректность отбора информации и правильность принятых решений, и снова переходить на этап объединения. Лишь итерационный процесс гарантирует успех.

Предоставьте данные пользователям

Мне не известно ни одно электронное или программное решение для эффективного сбора и доставки метаданных пользователям. Наиболее вероятными поставщиками подобного решения могут стать компании, предлагающие средства извлечения знаний из текстов (text mining), информационные хранилища текстовых данных и поисковые машины.

Интерпретация метаданных в широком их значении — как любой информации, которая создает определенный контекст для данных, облегчая процесс принятия решений, — открывает новые возможности при сборе и применении метаданных. Представление табличных данных в контексте, основанном на релевантных метаданных, способствует лучшему пониманию бизнес-климата и своевременному принятию решений.

Шираз Кассам (Shiraz Kassam) — ведущий специалист по архитектуре данных в компании Merck & Co. С ним можно связаться по e-mail: Shiraz_Kassam@Merck.com.