Распределяя бюджетные средства в рамках федеральной целевой программы (ФЦП), государственное ведомство выступает как крупный инвестор. Однако в отличие от частного инвестора, который может рассматривать все проекты с точки зрения ожидаемых или достигнутых финансовых результатов, ведомство не располагает столь же удобным единым критерием. Проекты, реализуемые в рамках ФЦП, обычно оцениваются не по прибыльности, а по другим параметрам, особенным для каждого проекта. Но эффективный инструмент комплексного анализа разнородной информации необходим им, пожалуй, больше, чем кому бы то ни было еще.
В конце лета ЗАО РАМЭК сообщило об успешном внедрении в интересах подведомственных структур Министерства образования и науки системы ПКВИС — программно-аппаратного комплекса визуализации информационных связей. Это собственная разработка компании. Представляется, что такие системы реализуют некий симбиоз аналитических функций, дополненный рядом технологических приемов работы с информацией, не совсем типичных для аналитических систем. На сегодня мы можем говорить лишь об очень специфических единичных внедрениях, но не исключено, что продукты, подобные ПКВИС, будут использоваться шире.
Назначение ПКВИС — сбор, обработка и комплексный анализ информации о проектах, реализуемых в рамках федеральных целевых программ. Система используется при подготовке данных для заключений о полноте, достоверности и обоснованности сведений о проектах, помогает оценить вклад каждого проекта в достижение целевых показателей ФЦП, проследить его связи с другими проектами. По сути, главное, что делает система, — это выявление разного рода неявных семантических связей, которые не видны в обычных отчетах. Ее основу составляет модуль визуализации аналитической информации, который наглядно показывает перемещение денежных средств, взаимодействие между организациями, проектами и т.д.
ПКВИС позиционируется как продукт для «добычи данных» (data mining), то есть для выявления структур и связей в большом массиве данных, в том числе неструктурированных, и представление этих структур и связей в удобном для пользователя виде — поддерживаются семантические графы, схемы и другие интуитивно понятные форматы. Есть возможность создавать специфические аналитические модели.
Рассматриваемый продукт также позволяет запрашивать информацию как из внутренних, так и из внешних источников. Сейчас в данном внедрении используются три источника данных, в других проектах их число доходит до 12. Преимущественно пользователи работают с базами данных Oracle и Microsoft SQL, а также с XML-файлами.
Для формирования запросов имеется набор готовых шаблонов. Запросы можно строить и самостоятельно, пользуясь индивидуальными критериями.
Система имеет открытый код (открытость, как известно, очень ценится государственными организациями и часто выступает одним из главных критериев при выборе решения). При разработке модуля визуализации использовались несколько открытых библиотек (которые были существенно модифицированы), а все коннекторы с источниками данных написаны программистами РАМЭК с нуля. Эти оптимизированные коннекторы обеспечили возможность работы ПКВИС без хранилища данных.
Для большинства аналитических систем, способных работать с источниками данных напрямую, вообще характерна малая производительность при таком «прямом» подключении, поскольку создаваемая ими нагрузка на источники данных существенно снижает быстродействие — именно этим обусловлена необходимость в выделенных хранилищах данных. Но построение хранилища — масштабная задача. В рамках государственного ведомства время на ее осуществление оценивалось в два-три года, а заказчик не мог ждать так долго. Поэтому коннекторы были оптимизированы таким образом, чтобы формирование аналитических отчетов не сказывалось отрицательно на производительности источников. Это позволило реализовать проект в очень сжатые сроки — весь комплекс работ был проведен в общей сложности за 10 месяцев — и снизить его стоимость. Сейчас с системой работает не так много пользователей, и объем необходимых им данных сравнительно невелик. Однако в государственном секторе есть и другие, в том числе значительно более масштабные внедрения. В одном из них ПКВИС обслуживает порядка 5000 человек и обрабатывает 4,5 Тб данных.
Решение постоянно развивается. В планах разработчиков — расширение возможностей контекстного поиска и реализация онтологического анализа.