Едва ли какой-нибудь термин употребляется сегодня в ИТ-индустрии чаще, чем портал. О включении в свои продуктовые линейки решений для построения корпоративных порталов заявили крупные вендоры с известным технологическим прошлым. Небольшие молодые компании тоже гордо именуют свои продукты порталами. Что общего между их решениями? Как получилось так, что порталы строят компании, принадлежащие к совершенно разным сегментам ИТ-рынка? Что такое корпоративный портал?

Чтобы ответить на эти вопросы, мы решили найти в материалах аналитических агентств набор параметров/критериев, описывающих то, что называют корпоративным порталом, познакомиться с продуктами известных вендоров (Oracle, Sybase, Hummingbird, SAP AG и т. д.) и на основании этого охарактеризовать набор подсистем в структуре портала, выполняемые функции, области применения и т. д. Однако после выполнения намеченного плана предмет рассмотрения оказался еще более неясным, чем на старте. Казалось, что объект изучения находится в постоянном движении, изменяется в размерах и очертаниях и поворачивается к исследователю разными сторонами.

Проблема в том, что рейтинги аналитических агентств отличаются друг от друга подборками рассматриваемых портальных продуктов, предъявляемыми к ним требованиями, а следовательно, и позиционированием продуктов на рынке. Так как агентств много, а тема порталов весьма модная, то всегда можно выбрать агентство и рейтинг по вкусу. Впрочем, и сами агентства не скрывают, что в оценке портальных продуктов остается очень много неопределенностей. “Рынок порталов широкий и запутанный, - пишет аналитик Forrester Research. - Нам пришлось рассмотреть порядка 900 продуктов”. Замечу, что в итоге компания составила рейтинг по продуктам всего шести вендоров. Исследователи Gartner Group также считают, что «строгая категоризация порталов в ближайшее время вряд ли возможна, и выбор вендора останется трудоемкой задачей» [1].

Тем не менее некоторые выводы можно сделать. И прежде всего такой: корпоративный портал - это не Web-приложение, не отдельная технология, а концепция, динамично развивающаяся и подразумевающая синергетическое объединение нескольких технологий, которые, в свою очередь, также динамично развиваются. Управляют этими изменениями экономические и технологические тенденции развития, и под их влиянием корпоративный портал постепенно приобретает общие черты. Вендоры, которые верно угадывают современные тенденции, в конце концов смогут предложить рынку наиболее конкурентоспособные продукты.

В этой статье мы анализируем действующие тенденции и особенности продуктов известных компаний, представленных на российском рынке: Oracle 9iAS Portal, Sybase EP 2.0, Hunmmingbird EIP 4.0.

Новые условия ведения бизнеса

Любая технологическая инновация обслуживает потребности бизнеса. Паринов и Яковлева [2], резюмируя экономические приметы сетевой экономики, утверждают, что в начале 21-го века экономически наиболее эффективной средой становится “общество с высокой информационной проницаемостью”. Стоимость транзакций по доставке информации в новом обществе будет стремиться к нулю. Обществу с высокой информационной проницаемостью будет соответствовать управление «на основе прямых равноправных связей, когда между людьми установятся ...длительные прямые связи "всех со всеми" (аналог общины, только в глобальном мире)”. Добавим от себя, что процессное управление, которое распространяется взамен функционального, иерархического, - это первая ласточка на пути к новым «плоским» формам управления. Еще об одной тенденции говорит гуру американской школы менеджмента Питер Друкер (Peter Drucker). Он считает, что, начиная с момента их первого применения в 50-х годах и вплоть до недавнего времени, компьютеры производили данные, а не информацию (data literate vs. information literate), и поэтому не могли раскрыть свой потенциал полностью, но в ближайшем будущем ситуация изменится.

Интернет-порталы

Концепция портала возникла как ответ на постановку двух задач: прозрачный доступ к любой информации и легкость коммуникаций между людьми в рамках произвольно организуемых групп. Появление первых порталов: Lycos, Yahoo!, Infoseek, Excite и т. д. (1996-1997 годы) пришлось на юность Интернета. В ту пору World Wide Web ассоциировалась с «глобальной виртуальной книгой» [3], и многочисленные молодые Интернет-компании ринулись в Сеть, чтобы решить единственную задачу - заставить как можно большее число посетителей открывать эту книгу именно со своего сайта. Для этого они совершенствовали технологии поиска информации, навигации в Интернете, улучшали контент и т. д.

Порталы стали новым интерфейсом пользователя с Всемирной сетью. Они предоставили единый вход в глобальное информационное пространство и инструменты поиска информации, библиотеку систематизированного контента, средства персонификации. Позже новый интерфейс позволил посетителям сети общаться друг с другом в рамках сообществ по интересам и чатов в реальном времени. Параллельно порталы начали предлагать первые коммерческие сервисы в Интернете. Так, на Yahoo! в ноябре 1997 года заработало агентство путешествий Yahoo!Travel. Можно сказать, что портал соединил “B” и “C” в формуле В2С (business-to-customer).

По мере того, как обживалось глобальное информационное пространство, модель работы по образцу Интернета распространялась на управление внутренними процессами компаний. Это позволило переложить сложные задачи обработки данных на профессионально управляемые серверы и получать доступ к данным с помощью Web-браузеров. Началось развитие интранет-среды. Одновременно понадобился универсальный интерфейс к ней, подобный порталам в WWW, и примерно в 1998 году это вызвало к жизни концепцию корпоративного портала. А кризис, последовавший за взрывной экспансией Интернет-компаний в сети, в значительной степени переключил внимание вендоров портальных технологий на решение внутренних задач управления предприятием.

На первом этапе своего развития корпоративный портал соединял “B” и “Y” в формуле В2Y (business-to-employee). По мере развития бизнес-процессы все больше выходят за пределы предприятий, охватывают мобильных участников, и корпоративный портал становится универсальным интерфейсом пользователей к гетерогенной среде Интернет/интранет, образующейся в рамках взаимодействия В2B.

На смену Windows

Корпоративный портал соответствует современному этапу в развитии графического интерфейса пользователя (Graphical User Interface - GUI). Однако в современных условиях избытка информации оконная структура тормозит работу корпоративного пользователя [4]. Во-первых, она не позволяет воспринимать бизнес-процессы целиком, а дробит их на фрагменты, которые поддерживаются отдельными программными системами и отображаются в разных окнах. Во-вторых, существующие GUI не обеспечивают эффективных коммуникаций между людьми в виртуальном пространстве. В-третьих, требуется новый подход к представлению информации, предполагающий формализацию и доставку корпоративных знаний. Поэтому новый интерфейс пользователя с новой виртуальной сетевой средой должен быть не просто HTML-картинкой, имитирующей рабочий стол с окнами для разных задач и информационных ресурсов, а чем-то большим. Рассмотрим, что требуется от корпоративного портала, чтобы он мог поддерживать новые способы ведения бизнеса [1, 4-7].

Во-первых, необходимо сделать информационное пространство предприятия единым - объединить разрозненные островки автоматизации, сформировавшиеся после внедрения MRP/ERP-систем, систем документооборота, групповой работы, хранилищ данных, информационно-аналитических систем; поддержать сквозные бизнес-процессы, выходящие за пределы предприятия. Интеграция должна поддерживаться на уровне данных, приложений, событий (задача middleware).

Во-вторых, требуется создать структуру пространства: в части как структурированной информации (на основе технологий СУБД, построения хранилищ данных), так и неструктурированной (ввести единую таксономию, управление контентом).

В-третьих, пространство должно быть прозрачным. Для этого корпоративный портал, с одной стороны, должен предоставить развитые механизмы поиска структурированной и неструктурированной информации (запросы к БД, лексический и векторный поиск); с другой - разумно ограничивать объем информационного пространства (с помощью профилирования пользователей - технологий CRM); с третьей, четко разграничивать права доступа.

В-четвертых, портал берет на себя часть работы пользователя по анализу и обобщению информации (с помощью OLAP, средств бизнес-аналитики, извлечения данных (data mining), управления знаниями).

В-пятых, он организует группы людей (в соответствии с технологией workflow, управления проектами) и обеспечивает простоту коммуникаций между ними.

В-шестых, требуется поместить пользователей в комфортные условия интерактивного взаимодействия с информационной средой: снабдить их простыми интуитивно понятными инструментами для персонализации интерфейса (редактирования дизайна и контента) и обеспечить ввод/ доставку информации на любое мобильное, проводное или беспроводное устройство, устанавливаемое на столе, переносимое в руках, карманах и портфелях. На одном экране могут объединяться данные из разных корпоративных приложений, кусков Интернет-сайтов, новостных лент и т. д.

В-седьмых, необходимо гарантировать надежную производительную работу пользователей с большими массивами информации (технологии больших СУБД) и масштабируемое наращивание (архитектура портала должна разрабатываться на основе современных открытых стандартов XML, Java, COM и т. п.).

Ниже мы подробнее рассмотрим технологические тенденции, которые привели к возникновению концепции корпоративного портала. Эти технологии начали развиваться совсем недавно, практически независимо друг от друга, и продолжают бурно развиваться в настоящее время. “Лицо” корпоративного портала главным образом определяют технологии управления контентом, СУБД и ПО класса middleware.

Управление информацией и извлечение знаний

По мере того, как в геометрической прогрессии росло число пользователей Интернет/интранет-систем, а сайты переходили в своем развитии от безыскусных HTML-страниц к динамическому представлению богатого разнородного контента, которым пользователи могут манипулировать в соответствии с присвоенными им правами и бизнес-логикой, существенно менялись и технологии управления контентом на протяжении его жизненного цикла «создание/ управление/публикация/доставка» (CMS - content management solution).

К первым CMS относились системы управления документами или созданием/развертыванием/модернизацией ПО (SCM - source control management), которые помогли организовать работу групп пользователей, готовящих контент определенного типа (документы или программный код), и обеспечили хранение этого контента в репозитории для повторного использования с разграничением прав доступа. В принципе, если пользователи файловой системы могут договориться о соблюдении некой логики при работе с файлами (порядок утверждения, обновления, контроль версий, структура каталогов и т. п.), файловую систему тоже можно рассматривать как CMS.

К задаче управления контентом близка проблема поиска информации. Первые поисковые инструменты создавались в доинтернетовскую эпоху для поиска информации в БД ограниченного размера и известной структуры. С появлением Интернета задача поиска информации усложнилась, и сегодня она формулируется как “задача поиска информации в неограниченной неоднородной информационной среде” [8]. Новые условия стимулировали развитие лингвистических и вероятностных методов обработки текстовой информации. Поиск в Интернете проводится на основе индексов - специального представления документа с помощью набора параметров. Индексирование обычно выполняется автоматически. Все существующее многообразие методов индексирования можно разбить на два больших класса: лексическое на основе булевой логики и векторное, которое позволяет делать запросы по подобию [8]. Лексическое появилось значительно раньше; развитые поисковые лексические системы позволяют выполнять поиск по ключевым словам и фразам с учетом словоформ и расширенных запросов и вполне удовлетворяют требованиям к поиску информации в специальной предметной области. Для улучшения лексического поиска обычно вручную или в полуавтоматическом режиме составляются тезаурусы - списки связей между терминами и устойчивыми сочетаниями, в том числе синонимических. Чтобы задавать запросы на естественном языке, получать ответы с учетом контекста и осуществлять поиск в не ограниченной предметом области, требуется векторный подход. Его основное преимущество - поиск и ранжирование информации по подобию (на основе близости в векторном пространстве). По адресу http://www.monash.com/spidap3.html можно найти руководство по поисковым машинам, доступным online, и их возможностям.

Современные CMS должны управлять жизненным циклом Web-контента: поддерживать основные стадии его обработки (создание, управление, публикации на Web, доставку), фиксировать его изменения во времени (учет версий, сроков архивирования, обновления и т. д). Кроме того, они должны манипулировать контентом гораздо меньшей дискретности, чем это делали первые системы управления документами, используя в качестве единицы контента не целый документ, а шаблон, страницу и т. д. И наконец, современные CMS должны управлять “активным контентом” (active content), соответствующим активному интерфейсу, когда в результате интерактивного взаимодействия меняются графический вид и информационное наполнение портала (в отличие от того, как меняется интерфейс в процессе терминальной сессии).

Основные функции CMS представлены в таблице [9]. Поскольку речь идет об CMS, манипулирующих Web-контентом, аббревиатура сменилась на WCM (Web-content management). По сути WCM - это объединение технологий работы с документами и поддержки Web-сайта. Данные могут поступать на вход WCM из текстовых документов, различных приложений, синдикативных источников, в виде графических изображений, программного кода, видео- и аудиоинформации. В общем случае надо уметь обрабатывать контент из любого источника, невзирая на формат контента, операционную систему и коммуникационный протокол источника. Пользователи должны иметь возможность выполнять все нужные операции, не прибегая к помощи Web-дизайнера, с помощью удобных визуальных средств. Автоматические поисковые машины и автоматические инструменты категоризации прежде рассматривались как отдельные продукты; сегодня они предусматривают работу с мультимедийным контентом и составляют неотъемлемую часть WCM. В репозитории хранятся данные, метаданные и бизнес-процедуры, регламентирующие работу с контентом. Метаданные формируются в результате автоиндексирования, описывают источник, назначение, могут содержать информацию о синонимах и другие атрибуты каждого контента. Чем больше используется метаданных, тем более гибким может быть управление контентом. В качестве универсального формата данных и метаданных практически утвердился стандарт XML.

Функциональность WCM

Функция Операции
Создание: помещение контента из разных источников в центральный репозиторий Преобразование разных форматов данных в стандартный формат репозитория и генерация метаданных. Редактирование данных в репозитории пользователем
Управление (активами репозитория) Поддержание прав доступа, библиотечных функций, механизмов поиска, категоризации, потока работ по утверждению, отслеживанию дат публикации, обновлению и архивированию
Представление на Web Распределенная публикация контента
Сервисы Персонализация, управление каталогами и производительностью, скрипты, доставка по разным каналам, разграничение прав доступа

Публикация заключается в перемещении изготовленного контента из репозитория, доступного для WCM, в хранилище, доступное для пользователя. Обычно для целей изготовления и представления используются разные серверы данных. Публикация может быть статической и динамической, если контент изменяется во времени и/или персонифицируется. Как правило, на практике применяется комбинированный метод публикации. Производительность работы обоих серверов в большой степени зависит от структуры контента и возможности кэширования страниц.

Персонализация основывается на метаданных и на поддержке системы каталогов с разными правами доступа. Профили могут создаваться как самими пользователями, так и формироваться автоматически на основе анализа щелчков мышью (clickstream analysis). В последнем случае работает CRM-модуль, которые многие поставщики WCM-продуктов стали включать в свои системы, либо приобретая его у третьих фирм, либо разрабатывая самостоятельно. Это тенденция сегодняшнего дня, которая объясняется тем, что порталы все больше предназначаются для отношений В2В.

В общем случае контент должен доставляться пользователю по самым разным каналам , в том числе по мобильному и синдикативному каналам. Синдикация - это управление контентом в рамках взаимодействия двух приложений (с каждым приложением может быть связана своя система категорий контента - таксономия). Синдикация может достигаться, например, с помощью поддержки ICE-протокола. Практически все вендоры сегодня обеспечивают доставку контента по беспроводному каналу.

Хотя технологии управления контентом имеют довольно длительную историю развития, они продолжают бурно развиваться, причем тенденция такова, что они развиваются не в качестве отдельных продуктов, а в составе платформ для электронного бизнеса известных вендоров. Главная причина - резкое возрастание объема данных, контента, множественность каналов поступления и доставки информации. Например, по оценкам Forrester Research, средний корпоративный сайт имеет около 80 тыс. страниц. Число же страниц, составляющих портал, может превышать 300 тыс. Когда ставится задача управления столь обширным контентом, возникают вопросы производительности, масштабируемости, безопасного доступа, надежности WCM. Для решения этих проблем заключаются партнерские соглашения с производителями мощных платформ (таковы, например, партнерства между Oracle и Mascromedia, Sybase и Vignette) или же происходят покупки и поглощения (так, Hummingbird приобрела PeopleDoc). Заметим, что в результате подобных партнерств ISV добавляют в свои продукты для построения порталов недостающую функциональность.

Те же тенденции партнерства и поглощения наблюдаются и в отношении вендоров поисковых систем. Известные примеры: партнерское соглашение между Sybase и Autonomy, покупка Fulcrum Technologies компанией PeopleDoc и т. д. По мнению ряда экспертов (например, Meta Group), набор функций WCM более или менее устоялся и под влиянием рыночных требований фактически стандартизован.

Сегодня информации, знаниям в противовес “сырым” данным придают большое значение, поэтому порталы обязательно решают задачу извлечения знаний в процессе обработки любого контента - как неструктурированного, так и структурированного. При обсуждении WCM-решений обычно имеют в виду неструктурированные данные, а соответствующие технологии извлечения знаний называют управлением знаниями (knowledge management, KM). Когда же речь идет о структурированной информации, которая хранится, например, в реляционных БД, то соответствующие методологии анализа информации (запросы, OLAP, сведение данных в отчеты и т. д.) объединяют в направление бизнес-аналитики (business intelligence, BI). Более глубокий анализ структурированной информации, чем BI, называют добычей знаний (data mining). Data mining заключается в исследовании скрытых закономерностей в больших массивах данных на основе применения нейронных сетей, статистического анализа и т. д. Большие массивы структурированных данных загружаются из разных источников с помощью технологий ETL (Extraction, Transformation, Loading - извлечение, очистка, согласование, загрузка данных) и накапливаются в хранилищах данных.

Проницаемость приложений, событий, информации

По мнению аналитиков IDC, клиент-серверная архитектура с центральной СУБД все больше уступает место распределенной вычислительной среде, поддерживаемой мощным системным ПО. За этим стоят глубинные тенденции - переход от вычислений к коммуникациям, внедрению интеллектуальных сетей. В терминологии Gartner Group интеллектуальная сеть, нервная система предприятия (enterprise nervous system, ENS) - это ПО промежуточного слоя, которое необходимо, чтобы обеспечить интеграцию приложений, информации, событий и таким образом упростить коммуникации между людьми людей и накапливание коллективных знаний.

Концепция ENS отображает популярные сегодня идеи нейрокомпьютинга (распознавание сенсорной информации и выработка адекватной реакции на внешние воздействия) на уровень предприятия. Gartner Group [10] выделяет следующие главные технологические подсистемы ENS.

  1. Интеграционные брокеры (integration brokers) - играют роль “мозга”, распознают приложения (узлы) в сети и определяют базовые сценарии взаимодействия между элементами ENS.
  2. Адаптеры (adapter technologies) - соответствуют сенсорам, понимающим состояние/события, связанные с отдельными приложениями-узлами. Адаптеры могут быть простыми и сложными, универсальными и специализированными, ориентированными на процессы или на данные. От их состава зависит уровень интегрированности разнородных приложений, а значит, и возможность построения сквозных бизнес-процессов, адекватное принятие решений в масштабе предприятия. Развитие современных стандартов взаимодействия в Web-среде (SOAP, WSDL, UDDI, J2EE, JCA, ebXML) позволяет сократить число типов адаптеров. Развиваются и технологии создания инструментальных средств, дающих пользователю возможность самостоятельно создавать адаптеры.
  3. Система коммуникаций (communication middleware) предназначена для передачи между адаптерами и интеграционными брокерами сигналов о состояниях/событиях и передачи команд в обратном направлении. В частности, брокеры объектных запросов (object request brokers) обеспечивают жесткую разветвленную структуру взаимодействия приложений. К более простым и недорогим, но и менее интегрированным решениям относятся традиционные технологии очереди сообщений (message quering) и технологии публикаций/подписки (public-and-subscibe messaging), а также электронная почта по протоколу SMTP. При взаимодействии по схеме В2В часто применяется протокол HTTP, и ожидается, что в ближайшем будущем системы коммуникаций будут поддерживать протокол SOAP.
  4. Серверы приложений как таковые не являются элементами технологии ENS, но выступают носителями логики, структуры ENS и поэтому имеют важное значение для функционирования “нервной системы”. Сегодня наиболее распространены две стандартные архитектуры серверов приложений: Java2 Enterprise Edition и Microsoft Web Solution Platform.
  5. Web-сервер. Gartner отводит ему роль «телепатической передачи» (telepathic transmitters) и считает, что сам по себе Web-сервер значит очень немного для работы ENS - это всего лишь мостик между отдельными приложениями, чаще системами разных предприятий, взаимодействующих по схеме В2В. Его назначение - перевести в единый формат (HTTP, SMTP, XML) данные и инициировать информационный обмен между приложениями - «черными ящиками». Однако в совокупности с другими элементами ENS (пп.1-4) Web-сервер становится настоящей платформой виртуального предприятия.
  6. Инструментальные средства, позволяющие развернуть ENS в масштабе предприятия.

Инфраструктура корпоративного портала должна строиться в соответствии с концепцией ENS - только тогда будет обеспечен необходимый уровень интеграции приложений, данных и событий и на практике сконфигурированы сквозные бизнес-процессы.

Источники информации

  1. “2H01 Portal Products Magic Quadrant”,
    http://www.gartner.com/webletter/sybase/october/article1.html
  2. С.И. Паринов, Т.И. Яковлева «Экономика 21 века на базе Интернет-технологий». http://rvles.ieie.nsc.ru/parinov/economy21.htm
  3. ”The X Window System and broadway,”
    www.hummingburd.com/collateral/broadway.html
  4. ”Enterprise Portals Shape. Emerging Business Desktop”, the Delphi Group,
    http://www.delphigroup.com
  5. “Enterprise portal 2000/2001”, Meta Group,
    http://www.metagroup.com
  6. .
  7. “A Portal in Every Pot”, “Race for Portal Preeminence”, IDC,
    http://www.idc.com/newsletters
  8. .
  9. “Race for Portal Preeminence”,
    http://www.idc.com/ebusinesstrends/ebt20010628home.shtm
  10. “Ассоциативный поиск текстовой информации”, С.А.Шумский, А.В. Яровой, О.Л.Зорин,
    http://www.neurok.ru/pub/index.htm.
  11. “Managing the Content Explosion into Content-Rich Applications”, Yankee Group 2001,
    http://a1312.g.akamai.net/7/1312/812/fb9364709870f7/
    www.vignette.com/Downloads/YANKEE_CONTENT.pdf
  12. “ENS:Middleware best Practices in the E-Business World,”
    http://www.gartner.com/1_researchanalysis/focus/integration_sl.html