Принимать решения, основываясь только на оперативных данных, весьма непросто. Помимо таких проблем, как ограниченная доступность данных, недостаточное их качество и своевременность получения, приходится учитывать и то, что внутренние данные — это в принципе ненадежный источник информации. Им не хватает контекста.
О том, что «чистых» данных недостаточно для принятия решений, и о необходимости контекста для понимания всей бизнес-среды, в которой выполняется интерпретация фактов, говорилось уже неоднократно. Осознание этого очень важно для принятия качественных решений. Поэтому лица, ответственные за принятие решения, обязательно должны своевременно получать корректные данные в верном контексте (под которым подразумеваются метаданные).
"Принятие решений, будучи практически синонимом управления, очень важно для любых менеджеров. Более того, качественное, надежное принятие решений должно основываться на информации с надлежащими атрибутами... Возможности формальных информационных систем (имеющих дело лишь с данными) в области поддержки самых разных процессов принятия решений весьма ограниченны". Information Systems: Theory and Practice («Информационные системы: теория и практика»), Burch, Stater, Grudnnitski, 5th Edition, 1989. |
Откройте глаза
Давайте для начала уточним, что такое метаданные. Мне больше всего нравится определение, данное Робертом С. Сейнером в журнале The Data Administration Newsletter (http://TDAN.com): «Метаданные — это информация, которая улучшает понимание — в плане бизнеса и технологий — данных и связанных с ними процессов; метаданные дают пользователям возможность лучше понимать данные и на основании этого принимать более удачные решения».
Традиционно метаданные более кратко определяют как «данные о данных». Сейнер расширяет это определение, привлекая внимание к возможностям, которые предоставляют сбор и применение метаданных, а также к «заказчику» метаданных — пользователю, который находится в бизнес-сфере и поэтому способен находить применение метаданным и оценивать их.
Для наших целей нам понадобится именно это довольно широкое определение метаданных, в частности, применительно к среде информационного хранилища. При этом в качестве руководства мы используем концептуальную модель, представленную в таблице.
Концептуальная модель объектов и типов метаданных
Традиционные способы использования метаданных |
Рекомендуемое расширение |
||||
Этап |
Источник |
Извлечение, преобразование, загрузка |
Корпоративное информационное хранилище |
Извлечение |
Отчетность |
Объекты данных |
База данных Таблицы Таблицы кодов Столбцы Значения кодов Файл |
Задача Процедура Преобразование Расписание загрузки Загрузочные программы |
БД субъектов Таблицы Таблицы кодов Значения кодов Модель |
Задача Процедурная программа Преобразование Кубы Инструменты Поля |
Методология Термины Пользователи Релевантная информация извне Отраслевые отчеты Внутренние комментарии, обзоры, электронная почта, служебные записки и т. д. Организационная информация, обеспечивающая контекст бизнес-данных |
Типы метаданных |
Технические метаданные и метаданные определений на элементарном уровне |
Метаданные о движении данных на элементарном уровне |
Технические метаданные и метаданные определений |
Метаданные о движении оперативных данных |
Бизнес-метаданные |
В общем случае метаданные делятся на четыре категории по видам объектов, о которых собирается информация. Каждая категория по-своему дополняет метаданные, которые облегчают работу с данными и повышают их ценность. Первые три категории — определения элементарного уровня, технические определения и определения движения данных — общеизвестны и достаточно понятны, так что я не буду на них останавливаться. Однако бизнес-метаданные нуждаются в более детальном пояснении.
Определитесь с терминами
Бизнес-метаданные относятся к информации, которая, будучи отображенной в виде отчета, обогащает восприятие традиционных табличных (структурированных) данных. Такая информация включает используемые в отчетах бизнес-термины, методы получения отдельных элементов данных в отчете, цели создания и основные предположения отчета, а также внешнюю информацию и мнения (данные, не входящие в таблицы). Подбор состава бизнес-метаданных субъективен и определяется потребителем данных.
Основная цель подобных метаданных — обеспечить контекст для табличной информации и обогатить ее. Контекст не обязательно должен быть одинаков для всех пользователей. Например, директору по сбыту, изучающему отчет о продажах за прошлый месяц, требуется разбиение по видам товаров, и, чтобы обеспечить контекст для таких данных, может потребоваться создать сравнительные отчеты по продажам на основании различных признаков. Важными признаками в данном случае могут быть региональные параметры, действия конкурентов, в том числе маркетинговые инициативы, погода, различные социальные и политические события, способные повлиять на продажи (к примеру, такие, как события 11 сентября). Начальнику производственного подразделения те же данные следует предоставлять в другом контексте: с указанием запасов в компании, запасов в производстве, параметров линии поставок, состояния производственных средств, прогноза рынка сбыта, а также стоимости и объемов поставок сырья в количественном или качественном представлении.
Роль бизнес-данных становится понятнее после изучения самого процесса принятия решений в компании, где есть информационное хранилище. Далее мы посмотрим, как информационное хранилище вообще используется в компаниях.
Традиционный процесс принятия решения на основании информации из информационного хранилища включает операции на нескольких уровнях организации, из которых, собственно, и состоит процесс принятия решения.
На самом высоком уровне находятся цели организации, сформулированные в виде материальных показателей, на основании которых можно оценивать прогресс компании. Далее, на Уровне анализа несоответствий и действий изучается разница между нынешним и планируемым положением компании. Это уровень проверки на реалистичность. Если разрыв между действительностью и ожиданиями возрастает или компания ставит перед собой новые цели, руководство инициирует на этом уровне новые бизнес-стратегии и инициативы.
Эффект от указанных инициатив проявляется в производственных системах на Уровне производственных систем, находящемся в самом низу иерархии. Именно здесь в первую очередь заметны результаты текущей бизнес-практики. Такими результатами могут быть новые заказы, поступающие к поставщикам, изменившиеся объемы продаж и т. п.
Данные оперативного уровня далее переносятся на Уровень информационного хранилища, где для их интерпретации применяются различные инструментальные средства. Создаются стандартные и специальные (ad hoc) отчеты.
На Уровне бизнес-аналитики (Business Intelligence, BI) изучаются и оцениваются первичные данные, полученные в результате работы различных средств, например, OLAP-инструментов. Этот уровень соответствует пониманию и извлечению знаний; здесь достигается общая оценка и понимание данных, но никаких важных решений не принимается. Решения — это прерогатива уровня, расположенного на ступень выше, — Уровня анализа несоответствий и действий.
Примерно так выглядит стандартный цикл для большинства организаций, использующих информационное хранилище. В некоторых компаниях данные охватывают многие бизнес-операции, но обычно обслуживается по крайней мере одна бизнес-область, например продажи или маркетинг.
Обратите внимание, что на рисунке не показано никаких формальных процедур сбора нетабличных данных из внешних и внутренних источников и их передачи потребителю данных из информационного хранилища. Это стандартный недостаток схемы информационных потоков в обычных BI-системах. Другая популярная проблема, которую иллюстрирует рисунок, — недостаточная формальная интегрированность хранилища метаданных в общем цикле обмена информацией.
Изучите детали
Прежде чем определять, какие данные следует собирать и какие метаданные позволят разместить их в корректном контексте, следует выяснить, кто в компании принимает решения, и поближе познакомиться с ними. Обычно за принятие тактических и стратегических решений отвечают управляющие среднего и высшего звена. С большой вероятностью ваши клиенты — менеджер по продуктам или по маркетингу, финансовый директор подразделения и т. п.
Далее следует определить, какие типы решений принимаются указанными лицами или группами. Исследование их действий поможет сформировать корректные наборы информации (данных и метаданных), которые придется предоставлять в срок соответствующим сотрудникам.
Понаблюдайте за работой ответственных сотрудников, станьте на несколько дней их тенью, посмотрите на мир их глазами и выясните, с какими проблемами они сталкиваются, какие решения принимают и как это делается.
Спросите у них, каковы их обязанности в процессе принятия решений. Кто принимает окончательные решения? Кто участвует в ранних этапах процесса принятия решений? Какие роли играют эти лица, какие параметры для них важны (об этом чуть ниже) и каковы их интересы? Эта информация понадобится для настройки как на индивидуальном, так и на групповом уровне.
Вы также должны выяснить, как часто принимаются те или иные решения и в каком формате. В некоторых случаях решения принимаются ежемесячно, иногда — каждые шесть недель или шесть месяцев. Что касается формата, узнайте, какой уровень детализации данных требуется пользователям и в каком порядке следует предоставлять информацию.
Сформируйте набор данных
Чтобы определить, как объединять данные и метаданные, следует учесть несколько перечисленных далее обстоятельств.
Релевантность. Данные должны соответствовать потребностям лиц, ответственных за принятие решений. Помните, что наиболее ценная для таких лиц информация связана с мерами — показателями, по которым в компании оценивают продвижение к бизнес-цели. Примеры мер — доходы, загрузка, загруженность мощностей, процент задолженности потребителей и т. п.
Метаданные должны соответствовать данным, которые они описывают. Часть данных и метаданных, в которых нуждаются ответственные лица, уже есть в компании, но остальное следует собирать или покупать из внешних источников. Метаданные, присоединяемые к исходным данным, должны соответствовать этой информации. Например, определенные отраслевые отчеты, представляющие информативную картину, наиболее ценны, когда внутренние данные отображаются на общем фоне, причем все это снабжено качественным комментарием.
Агрегирование. Характер и подробности предоставляемых метаданных должны соответствовать уровню данных, которые они дополняют. Избыточность здесь так же плоха, как и недостаточность. Кроме того, не забывайте о частоте принятия решения. Если периодичность его составляет полгода, то и данные, и метаданные должны ориентироваться именно на полугодовые отчеты.
Безопасность. Поскольку метаданные бывают конфиденциальными (вспомните об электронной почте, личных комментариях, мнениях экспертов, бизнес-планах и стратегиях), следует соблюдать осторожность при их распространении. Даже если они относятся лишь к информации, на основании которой принимается решение в одном из отделов, все равно не в интересах предприятия предоставлять метаданные для широкого круга всех заинтересованных лиц. Иногда идут на компромисс, предоставляя информацию только устно, а не в легко воспроизводимом формате.
Принять решение о порядке объединения данных и метаданных совсем не просто. Вам придется часто возвращаться к предыдущим шагам, проверяя корректность отбора информации и правильность принятых решений, и снова переходить на этап объединения. Лишь итерационный процесс гарантирует успех.
Предоставьте данные пользователям
Мне не известно ни одно электронное или программное решение для эффективного сбора и доставки метаданных пользователям. Наиболее вероятными поставщиками подобного решения могут стать компании, предлагающие средства извлечения знаний из текстов (text mining), информационные хранилища текстовых данных и поисковые машины.
Интерпретация метаданных в широком их значении — как любой информации, которая создает определенный контекст для данных, облегчая процесс принятия решений, — открывает новые возможности при сборе и применении метаданных. Представление табличных данных в контексте, основанном на релевантных метаданных, способствует лучшему пониманию бизнес-климата и своевременному принятию решений.
Шираз Кассам (Shiraz Kassam) — ведущий специалист по архитектуре данных в компании Merck & Co. С ним можно связаться по e-mail: Shiraz_Kassam@Merck.com. |