Даг Хенсчен

Многие процессы включают как структурированные, так и неструктурированные данные. BPM-системы, технологии анализа текстов и EEI могут отчасти решить задачи объединения обработанных и данных. Но все эти технологии еще достаточно молоды. Какие из них уже можно пробовать применять?

Организациям уже давно приходится как-то увязывать структурированные данные с полу- и неструктурированными документами, почтовыми сообщениями, картинками и другими формами передачи информации, чтобы, например, отвечать на вопросы клиентов или принимать бизнес-решения. Два-три года назад при одновременной работе как со структурированной, так и неструктурированной информацией обязательно требовалось вмешательство человека. Интеграция данных и текстовой информации требовала специальных связей на уровне API, которые дороги, требуют больших временных затрат при разработке, ограничены по функциональности и перестают работать при обновлении ПО.

Однако с появлением XML, Web-сервисов и сервисно-ориентированных архитектур возникли новые многообещающие технологии и новые возможности для автоматизации процессов, интеграции разнородной по типу информации и анализа как «сырых», так и обработанных данных. Например, успешные внедрения систем BPM (Business Process Management) реанимировали десятилетнюю мечту об автоматизации рабочих процедур путем подсоединения к хранилищам структурированных и неструктурированных данных. С другой стороны, значительно прогрессировали технологии анализа текстов, проводящие поиск необходимой информации в неструктурированных текстах. Сегодня они применяются на практике, например в сервисной деятельности и в управлении контрактами. И наконец, развитие технологий EII (Enterprise Information Integration) привело к тому, что многие пакеты уже включают инструменты доступа к неструктурированному контенту.

BPM соединяет контент и структурированные данные

Основная цель создания BPM-инструментов заключается в том, чтобы более эффективно автоматизировать сквозные процессы независимо от бизнес-приложений и хранилищ данных. Это промежуточное ПО, с помощью которого можно выносить дизайн процессов и бизнес-правила за рамки лежащих в их основе приложений. Большинство систем BPM включают технологии интеграции, которые позволяют им получать доступ к информации из любого источника. То есть, с одной стороны, BPM-системы призваны облегчать требующую больших временных затрат работу по интеграции, а с другой — должны с минимальными усилиями моделировать и быстро менять сложные межфункциональные бизнес-процессы.

И уже есть несколько примеров успешных проектов подобного рода. Например, в страховой компании American National Insurance Co. (ANICO) BPM-систему используют, чтобы повышать эффективность работы отдела, обслуживающего клиентов. Дело в том, что при работе с обращениями клиентов в страховую компанию требуется доступ как к структурированным данным из хранилища данных предприятия и аналитической системы Cognos, так и к текстовой информации о клиентах, включая полисы страхования, различные законы и требования. Старый метод обслуживания клиентов ANICO требовал поиска в рамках разных систем. В результате среднее время обработки звонка в отделе медицинского страхования составляло восемь с половиной минут, а для некоторых звонков это время доходило до получаса.

С целью сокращения расходов и улучшения обслуживания клиентов в 1999 году компания начала внедрять технологию BPM на основе ПО от Pegasystems. Первый проект был реализован в call-центре отдела медицинского страхования, а затем компания внедрила проведенные там наработки в call-центрах двух основных маркетинговых групп и группы кредитного страхования. «Когда звонит независимый агент или клиент, происходит подключение к различным системам. Это позволяет получить всю необходимую клиентскую информацию, — рассказывает Гарри Киркхэм, вице-президент ANICO по планированию и поддержке. — Так как оператор call-центра идет последовательно по регламентированному процессу, бизнес-правила в точности предсказывают, что хочет узнать клиент, а система выводит эту информацию на экран. Таким образом мы покрываем по крайней мере 85% звонков». Процессы регламентированы для клиентов каждого из уровней, а уровни определяются на основе информации хранилища данных. Так, например, если звонит страховой агент с высоким уровнем продаж, согласно правилам обработки данный звонок автоматически направляется на приоритетную обработку специализированному менеджеру. За последние три года ANICO существенно продвинулась в интеграции обработанных и необработанных данных, и сейчас обработка звонка требует около четырех минут, что вдвое меньше предыдущих показателей. По одному из направлений бизнес компании растет на 60% в год, однако эффективная работа четырех call-центров позволила компании не привлекать для обеспечения этого роста дополнительных 20—30 менеджеров службы обслуживания, а обойтись своими силами.

Взаимодействие человека с необработанной текстовой информацией, как правило, принципиально необходимо в CRM-системах, но в большинстве других процессов сегодня видна тенденция минимизации обмена текстовыми сообщениями между сотрудниками. Пример этого — компания Hasbro, в которой BPM автоматизировала процессы в цепи поставок. Неструктурированная текстовая информация по-прежнему является неотъемлемой частью этих процессов, но участие в этом менеджеров — скорее исключение, чем правило. «Наша ERP-система SAP R/3 обрабатывает сотни тысяч документов каждый год, а мы только отправляем по факсу и почте твердые копии поставщикам и грузовым экспедиторам», — рассказывает Дэвид Адамс, менеджер по интеграции в Hasbro. «По крайней мере 80% наших заказов на поставку могут быть обработаны по шаблону. Ранее, если у нас было 100 заказов на поставку, нам приходилось вручную обрабатывать эти 100 документов. Нам требовалось освободить себя от всей этой бумажной работы и вручную работать только с исключительными ситуациями».

Hasbro завершила свой первый пилотный BPM-проект в 2002 году с использованием ПО от Lombardi Teamworks. Правила управления процессами построены на основе метрик, например, соглашений об уровне сервиса и дат отгрузки. ПО Teamworks отслеживает задачи и конечные сроки, в нем зарегистрированы все менеджеры и поставщики Hasbro. Когда транзакции выходят за предопределенные рамки, например, товар отгружается с опозданием, ПО устанавливает предупреждающие флаги и само отправляет по электронной почте предупреждения соответствующим менеджерам. Исключительные ситуации обычно требуют вмешательства человека, а для этого нужна содержательная информация. Teamworks имеет доступ не только к данным SAP, но и заказам на поставку и сервисным соглашениям, которые могут быть вызваны с помощью программного интерфейса BPM.

Сегодня эта технология работает для тысяч продуктов, изготовляемых сотнями различных поставщиков и поставляемых более чем 25 грузоотправителями. По словам Дэвида Адамса, теперь прежний отдел из ста человек может управлять вдвое большим номиналом товаров. Следующим этапом развития будет развертывание специализированной базы данных. «Нам необходима отчетность по реакции производителей. Мы протоколируем результаты их работы, следим, насколько они выполняют свои обязательства, особенно если это касается отгрузок, — говорит Девид Адамс. Соответствие расписанию — это главное условие, и мы должны быть уверены, что Wal-Mart его соблюдает».

Решения по страховке на основе бизнес-правил


Страховая компания Horizon (подразделение Horizon Healthcare Services) обрабатывает около 150 000 медицинских документов в год. Основная ее деятельность — рассмотрение требований по страховым выплатам. При этом необходим доступ к данным, связанным с каждым из требований, к правилам погашения счетов, формам заявлений. Кроме того, каждая операция требует участия специалистов медицинского страхования. Важно, что процессы Horizon варьируются в зависимости от того, к чему они относятся: к дополнительным требованиям работников или к полисам автострахования. С точки зрения Джона Оливьера, директора по маркетингу и операциям Horizon, лежащие в основе их работы процессы могут сильно различаться. «Существует пять различных путей выполнения одной и той же операции, — утверждает Джон Оливьера.— Сейчас мы имеем дело с самыми различными потоками работ. Если шесть людей обрабатывают счета, мы можем получить шесть разных результатов по одному и тому же счету».
В 2002 году Horizon начала внедрять BPM-систему. Параллельно был стандартизирован центральный процесс компании с различными опциями, выполненными под заказ для специфических клиентов. Решения теперь принимаются на основе бизнес-правил, а вмешательство человека необходимо только в исключительных ситуациях. Автоматизация процессов исключает индивидуализацию, уменьшает количество ошибок и экономит время и деньги. ПО BPM дает специалистам по выплатам всю информацию о пропущенных или вызывающих подозрение данных. Примерно 90 000 заявлений в год сканируются и передаются в сервисное бюро для обработки.
Хотя первоначально планы заключались в уменьшении затрат на обработку на 10% и автоматизацию по крайней мере 20% операций, они были перевыполнены. Сейчас автоматически обрабатываются по крайней мере 60% заявлений, приходящих каждый год через EDI. Модернизированные процессы обработки данных сократили время рассмотрения невыполненных заказов с двух недель до двух-трех часов. «Мы вдвое уменьшили количество служащих, занимающихся выплатами, хотя обрабатываем такой же объем заявлений, что и прежде, и собираемся привлечь еще несколько новых клиентов», — говорит Джон Оливьера. За два года проекта компания потратила на новое ПО порядка 100 тыс. долл. и планирует развивать его дальше. Следующей фазой проекта будет работа с системой страхования здоровья при автомобильных авариях. Эта область деятельности насыщена различными правилами и взаимозависимостями, цель которых — выявлять злоупотребления.

Тандем BI и KM

Системы класса business intelligence работают со структурированными данными, а системы управления знаниями (knowledge management, KM) связаны с неструктурированным контентом. Они делают одно и то же дело в разных типах данных, поэтому уже несколько лет предполагается, что эти системы сойдутся в одной точке. «Пока этого не случилось, но, в конечном счете, обе системы являются интеллектуальными ресурсами, поэтому бизнесмены рассматривают их как одно целое», — утверждает аналитик Gartner Тэд Фридман. Например, обе эти технологии можно применить для анализа документов со сходной структурой информации, но расположенной в них случайным образом. Можно определить ссылки на людей, организации, места размещения или даже факты и события, содержащиеся в тексте электронных документов, почтовых сообщений, Web-страниц, и присвоить им метатеги, после чего метатеги будут проанализированы с помощью инструментов BI.

Подобным анализом текстов занимается ассоциация NASD (National Association of Securities Dealers), которая составляет правила, регулирующие фондовую деятельность. NASD проверяет всех участников Nasdaq и других финансовых рынков по всему миру и использует анализ текстов, чтобы отследить активность участников рынка и соответствие их деятельности установленным правилам. Цель этого процесса — исключить незаконные операции с ценными бумагами на основе информации о деятельности компании-эмитента. Для понимания торговой активности компаний и отрасли в целом недостаточно одних биржевых данных, поэтому NASD разработала приложение, анализирующее как информацию о торговле, так и выпуски новостей, данные от SEC и другие текстовые документы.

Второй пример — использование анализа текстов в EDS, ведущем мировом системном интеграторе. Для более чем 9000 корпоративных клиентов EDS покупает серверы, ПК, сетевое оборудование, ПО и сервисы. При таком объеме усложняется координация закупок с учетом оптовых скидок, так как офисы клиентов EDS находятся в более чем 65 странах, а количество поставщиков переваливает за десятки тысяч. Для решения этой задачи EDS запустила проект «Банк знаний». Первоначально он стартовал в BI. Однако основная проблема EDS заключалась в интерпретации содержимого более чем 35 000 контрактов на поставку. «Каждый контракт обычно занимает от 40 до 60 листов, поэтому невозможно изучить его и применить полученные знания за приемлемое время», — говорит Кас Касрэви, член совета EDS. Поэтому впоследствии, в 2001 году, EDS привлекла технологии анализа текстов для исследования контрактов и проверки соблюдения правил и определения оптимальных значений объемов и логистики поставок, а также сроков их выполнения. Для определения отдельных пунктов, терминов, цен, контактной информации и других необходимых деталей были разработаны лингвистические правила поиска структуры слов. Некоторые контракты были доступны в электронном виде, в то время как другие пришлось отсканировать и поместить в PDF-файлах, пригодных для работы ПО ClearForest.

Когда производится такой анализ? Например, производитель уведомляет EDS о повышении цен. Если контракт с производителем подразумевает фиксированные цены на период, скажем, три года, инструменты анализа текста быстро находят этот пункт договора и направляют его менеджерам по закупкам. Когда клиент EDS заказывает телефоны или ПК, с помощью технологий анализа текстов определяется лучший источник поставки. При этом сравниваются такие данные, как расположение производителя, предыдущий опыт, доступность продукта, скидки, объем заказа, прибыль и условия разрыва контракта.

Эффект от применения такой технологии очень существенен. Сегодня EDS применяет анализ текстов для тысяч контрактов, и согласно официальной статистике экономит на каждом контракте в среднем 2000$ в год из-за четкого соблюдения его условий. Кроме того, продуктивность работы менеджеров по закупкам увеличилась более чем на 12%, потому что они тратят меньше времени на изучение контрактов, поиск соответствующих пунктов и соотнесение этой информации с текущими заказами. Управление контрактами — это одно из новых направлений технологий анализа текстов. Другие направления — анализ затрат, заполнение патентов, раннее предупреждение проблем контроля качества и гарантии.

Интеграция всех форм информации

EII — это еще одна технология, которую можно рассматривать как вариант решения задачи интеграции структурированных данных и текстовой информации. Как правило, EII ассоциируется с технологиями интеграции баз данных, известных как «гетерогенная распределенная БД», «виртуально-централизованная БД» или «федеративная БД». Теоретически такое можно было сделать и ранее. Но API и заказные модули интеграции требуют месяцев труда и огромных вложений, хотя перестают работать при обновлении ПО. Принципиально то, что EII обеспечивает возможность повторяющейся интеграции, которая занимает недели, а не месяцы.

Однако часть аналитиков склонна рассматривать EII-технологии шире. Аналитик Gartner Тед Фридман рассматривает EII не как технологию, а как цель — объединить все данные по порядку с целью получения своевременных и полных представлений о бизнесе, обеспечения непротиворечивости данных и межплатформенного доступа к различным источникам данных разного типа. Именно такие идеи развития EII-технологий вынудили ряд производителей добавить в свои продукты решения по интеграции неструктурированного контента.

Так, IBM недавно приобрела компанию Venetica, чье промежуточное ПО для интеграции неструктурированной информации включено в DB2 Information Integrator. Эти действия IBM придали некоторую фундаментальность технологии, которая раньше рассматривалась в качестве «неоперившегося птенца». Теперь и другие производители EII-продуктов, включая Meta Matrix, Actuate, Journee, Avaki, Ipedo и Snapbridge, также предлагают различные решения по интеграции контента.

Например, компания Motorola, используя сервис-ориентированную архитектуру и EII-пакет, получает доступ к различным данным. Тоби Редшоу, главный технолог Motorola, говорит: «Сервисные мастерские и центры обработки вызовов имеют хорошие вертикальные данные, но теперь нас интересуют горизонтальная информация, и нам необходимы инструменты ее получения и нормализации». Тоби Редшоу считает, что идея «неструктурированных данных» комплексна и способна описать информацию как континуум начиная от четко структурированных, определенных данных (как в БД) до XML-документов или информации на картинках, которые практически не структурируются.

Повторное использование информации

Как и большинство юридических фирм, Zelle Hofmann имеет дело с тысячами документов каждый год. В шести ее офисах на территории США работают 180 адвокатов. В 2002 году фирма установила Hummingbird Enterprise, систему управления контентом предприятия (ECM, Enterprise Сontent Management)которая основана на инструментарии BI-запросов. «Внедрение технологии BI первоначально не входило в наши планы, но у фирмы более 60 партнеров, и они все заинтересованы в повышении качества наших услуг», — рассказывает Уорен Ноулс, менеджер по ИТ-проектам Zelle Hofmann. «Мы используем данное ПО для получения более полных и гибких отчетов по финансовому состоянию компаний». Hummingbird BI может просматривать стандартные отчеты или вырабатывать свои собственные критерии и показатели и получать отчеты по ним без помощи ИТ или бухгалтерии.
Однако использование BI-инструментария Zelle Hofmann продвинулось дальше, в область изучения материалов судебных дел. Это помогает юристам сэкономить время, а клиентам — деньги. Например, с помощью BI-инструментария был исследован результат работы West KM, системы управления знаниями компании Thomson, которая просматривает репозиторий текстовых документов фирмы и ищет необходимые документы. Исследования показали, что West KM предоставила 1400 важных ссылок в месяц — хороший результат для сервиса, который в месяц обходится фирме в 8 тыс. долл.. «Мы поняли, что использование BI для анализа шаблонов использования контента повышает наш уровень знаний, — говорит Уорен Ноулс. — Когда полезны шаблоны? Когда к документу часто обращаются, или когда используется старый контент. Основная движущая сила — это стремление использовать полезную структурированную информацию. Если адвокаты смогут постоянно обращаться к материалам старых дел и мы привлечем связанные с ними документы, то это будет лучшей основой для будущей юридической практики».

Какая из технологий?

Какая из технологий — BPM, анализ текстов или EII — наиболее зрела и сулит наибольший эффект? Насколько велик риск при их внедрении? По мнению Майка Мизиарка, аналитика InfoTrends/CapVentures, BPM-приложения вполне созрели для решения таких задач, позволяя компаниям эффективно и глубоко проникать как в данные, так и в неструктурированный контент. Особенно хороши применения BPM-приложений в области финансовых приложений и поддержки клиентов. BPM там сможет подключиться к ERP и помочь объединить то, что надо получить, и то, что надо заплатить, утверждает Майк Мизиарка. В любом случае стоит сравнить затраты из-за этих проблем с инвестициями в BPM, которые для больших компаний начинаются с 300 тыс. долл. В целом, чем более повторяющимся будет процесс (и чем затратнее он без автоматизации), тем актуальнее станет применение BPM-инструментов.

Технологии анализа текстов также достаточно зрелы для широкого использования. говорит: «Как большой, так и малый бизнес имеют дело с огромными количествами текстовой информации, — говорит Кас Касрави. — Стоит выбросить из головы, что необходимо вручную читать и обрабатывать всю эту информацию». Анализ конкурентов, новостей, выявление мошенничества, соблюдение обязательств по поставке — все это области, где может быть востребован анализ текста. «Обязательства по поставке и расходы на гарантийное обслуживание растут, а анализ текстов может на ранней стадии выявить все недостатки продукта», — говорит Кас Касрави. Типичные продукты для анализа текста стоят от 300 до 600 тыс. долл., но широкое распространение этих инструментов снизит цены.

EII — это последняя из обсуждаемых в данной статье технологий. В отношении неструктурированного контента она еще находится в самом начале пути. Однако решения, подобные использованным в Motorola, являются правильным ориентиром для всех компаний. «Web-сервисы и свободная интеграция позволят вам получить ожидаемый результат», — считает Тоби Редшоу.

Рыночный анализ: технологии объединения структурированных и неструктурированных данных

Технологии BPM — наиболее сформировавшаяся из обсуждаемых выше трех технологий, особенно по своим возможностям использования как обработанных, так и «сырых» данных. Анализ текстов показал себя как инструмент интерпретации контента и корреляции результатов с неструктурированными данными, но шестизначные суммы, необходимые для внедрения данной технологии, ограничивают ее распространение. EII — это совсем новая категория ПО.
Спрос Многие процессы включают как структурированные, так и неструктурированные данные. И на BPM-технологии, одинаково хорошо обрабатывающие и то и другое, спрос непременно будет расти. Применение анализа текстов по-прежнему остается в областях, близких к искусственному интеллекту. EII-инструменты пока концентрируются в области обработки данных.
Окружение Очень важно, что XML, Web-сервисы и сервис-ориентированная архитектура намного упрощают доступ ко всем формам информации. Кроме того, различные рыночные стимулы несомненно помогут преодолеть барьер недоверия к этим технологиям.
Примечание: Анализ применим строго в контексте объединения структурированных и неструктурированных данных, а не для областей BPM, EII и анализа текста в целом.