Государственные ведомства, особенно силовые, активно используют средства информационных технологий для повышения эффективности аналитической и управленческой деятельности. К сожалению, подавляющее большинство таких проектов полностью закрыто и никаких официальных комментариев от тех, кто подобные системы эксплуатирует, получить не удается. Приятным исключением стала Федеральная служба Российской Федерации по контролю за оборотом наркотиков (ФСКН), где с момента ее создания в 2003 году разрабатываются и применяются BI-приложения. Об этой практике рассказывает полковник полиции Георгий Песчанских, заместитель начальника информационно-аналитического управления Департамента межведомственной и информационной деятельности ФСКН России.
Intelligent Enterprise: Расскажите, какие аналитические приложения вы используете и для решения каких задач.
Георгий Песчанских: Наше ведомство молодое, ему всего четыре года. Вначале для работы с аналитическими документами мы использовали Lotus Domino, но с ростом объема данных, числа сотрудников, заинтересованных в информационных и аналитических системах, и масштаба операций стало ясно, что этим приложением обойтись нельзя. Нам необходимо регулярно собирать и анализировать большие объемы статистической информации, поэтому и возникла потребность в специальном программно-технологическом комплексе «Матрица». Это тысячи взаимосвязанных числовых показателей, сгруппированных в формы по направлениям работы, которые собираются нашими территориальными органами. Только основных насчитывается более полутора десятков. Информация имеет внутреннюю логическую структуру, значения показателей могут быть жестким образом связаны между собой (с помощью математических формул) или иметь нечеткую взаимосвязь, когда зависимость между ними выражается логическими соотношениями, обусловленными накопленным опытом работы. Собранные статистические данные анализируются на непротиворечивость и достоверность. Если в ходе такого анализа выявляются нестыковки, логические несоответствия, то начинается работа по установлению их причин, выяснению истинного положения дел. Рассматриваются связанные показатели, запрашиваются объяснения с мест. Проведенные по результатам этой работы исправления могут нарушить другие логические соотношения. В результате процесс анализа и корректировки данных в целях устранения противоречий может растягиваться на множество итераций. Сложно добиться, чтобы несколько тысяч взаимосвязанных показателей не противоречили друг другу.
Проведение перечисленных операций вручную требует огромных трудозатрат и длительного времени, что делает эту задачу практически нерешаемой: ведь в результате человеческого фактора все равно допускаются ошибки. Получить инструментарий, позволяющий эту информацию собрать, обработать, проверить на достоверность и представить в нужной форме для принятия оперативных управленческих решений, — для этого требовался специальный программный комплекс. Сформировавшиеся в ходе практической работы требования к формам статистической отчетности, алгоритмам их проверки, методам анализа и формирования итоговых документов не могли быть реализованы средствами, которые предлагались стандартными пакетами на рынке информационных технологий. Тем не менее нами предпринимались попытки адаптировать типовые пакеты под имеющиеся задачи.
После ряда таких неудач стало ясно, что это бесперспективно и значительно эффективней будет создание заказного программного обеспечения, адаптированного под решение наших задач, что и было сделано специалистами компании «ФОРС — Центр разработки». До его внедрения нам удавалось полностью собрать и проверить данные лишь к середине месяца, следующего за отчетным периодом. Мало того, у руководства были претензии к качеству итоговой информации. Принимать на основании таких сведений оперативные решения нельзя: за время формирования отчета ситуация может претерпеть существенные изменения и тогда будет представлена в нем не вполне корректно. После ввода программного комплекса «Матрица» в постоянную эксплуатацию появилась возможность консолидации всех необходимых статистических данных, автоматической проверки их на непротиворечивость и обобщения в виде итоговых отчетов в течение нескольких рабочих дней по окончании отчетного периода.
Существенно, что наше руководство держит эту работу под постоянным контролем, лично участвуя в анализе поступающей информации. Наш директор просматривает всю отчетность и, опираясь на свои знания и опыт, быстро находит «странные» цифры, по которым требует от нас пояснений и проверки. Отчасти именно поэтому мы и стали строить аналитическую систему — чтобы иметь возможность быстро и точно по требованию руководителей прояснять такие неясности. Выработка решения о том, какие сведения необходимо собирать, в какой форме лучше представлять и визуализировать информацию, проходит под непосредственным контролем высшего руководства.
Как шел проект по разработке и внедрению «Матрицы»?
Проект стартовал в 2003 году. Первую скрипку в постановке задачи, в написании технического задания играло наше подразделение, поскольку именно информационно-аналитическое управление Департамента ФСКН России отвечает за сбор статистических отчетов, их обработку и представление. Выиграла конкурс компания «ФОРС — Центр разработки». Наше взаимодействие с исполнителем этой работы облегчалось тем, что многие сотрудники этой компании раньше работали в Министерстве обороны, в МВД России и других силовых ведомствах. Так что они знают существо решаемой проблемы, имеют опыт эксплуатации подобных систем, обладают практическими навыками обращения с информацией ограниченного распространения. По нашему техническому заданию была разработана рабочая версия программного обеспечения, её изучили, провели стендовые испытания и опытную эксплуатацию в некоторых территориальных органах ФСКН. Программный продукт был признан годным для решения наших задач и передан в постоянную эксплуатацию. Но это внесло свои коррективы: когда ежедневно обрабатываются большие объемы информации, появляются новые требования к программному обеспечению, становится ясней, что необходимо для повышения эффективности работы эксплуатирующего данный программный продукт персонала, возникает потребность в новых функциях, которые раньше даже при всем желании представить не могли.
Когда после года постоянной эксплуатации мы убедились, что пакет действительно позволяет с высоким качеством обрабатывать большие объемы данных, появились новые запросы от руководства и подразделений ФСКН России, увеличились объемы запрашиваемой информации и усложнилось формирование выводных данных, возросли требования к их достоверности. В ответ на возросшие запросы и требования к качеству нами организована работа по совершенствованию системы автоматизированной проверки данных на логическую непротиворечивость.
Сначала этот пакет проверял логику только на федеральном уровне. Впоследствии в ходе доработки был создан модуль «Логика-Т» для территориальных органов, с помощью которого они могут вести всю свою статистическую отчетность, проверять достоверность и проводить очистку данных, направляемых в центральный аппарат для консолидации в итоговых статистических отчетах. При выгрузке данных на федеральном уровне проводится их автоматизированная проверка на логическую непротиворечивость. Теперь, когда система проверки достоверности исходных данных и качества отчетов стала многоуровневой, значительно упростилась работа по созданию новых отчетов, группировке исходных данных на разнообразных основаниях, проведению выборок и упорядочению информации.
Усовершенствование пакета «Матрица» идет постоянно. Статистические формы периодически меняются. Во-первых, из-за изменений в законодательстве. Во-вторых, «по ту сторону баррикады» тоже есть умы, которые придумывают всё новые способы осуществления своей противоправной деятельности. А наши коллеги на местах постоянно ведут поиск контрмер, поэтому алгоритмы обработки данных трансформируются. А пакет «Матрица» позволяет оперативно учитывать изменения, внося свой вклад в эту «войну умов».
Известно, что от качества первичных данных зависит адекватность результатов анализа. Каким образом вы обеспечиваете и контролируете этот параметр?
Создаваемые нами формы статистической отчетности описывают результаты работы всего ведомства и его отдельных подразделений, в них проводится сравнение с данными работы иных органов исполнительной власти, и на этой основе формируются сведения о состоянии и тенденциях изменения наркоситуации в России в целом. Эта информация используется при выделении наиболее приоритетных направлений работы, планировании мер по противодействию наркоугрозе в стране и в отдельных ее регионах. Так что ошибки могут быть весьма критичными.
Борьба за качество данных идет каждый день, постоянно мы находим что-то новое, шлифуем методику сбора и проверки информации. Автоматизация имеет принципиальное значение для качества собираемых данных: она позволяет исключить непредсказуемый по своему воздействию человеческий фактор. Ошибки вследствие усталости, недопонимания существа проблемы трудно выявлять и исправлять.
Все требования к формированию показателей статистических отчетов, к порядку заполнения полей баз данных в ФСКН России регламентированы и закреплены соответствующими инструкциями. Для каждого поля определено, как оно должно быть заполнено, на основании чего, каких исходных данных, из каких первичных документов взяты показатели, какие значения они могут принимать, как должны соотноситься с другими показателями или полями баз данных. Соответственно имеются правила их проверки. Есть описания понятий, применяемых в формах статистической отчетности, их трактовки.
Казалось бы, формализовано всё. И тем не менее при формировании каждого отчета на местах находятся сотрудники, которые полагают, что эти правила можно обойти или что они столкнулись со случаем, который еще не регламентирован в инструкциях. «Новеллы» действительно случаются, и они служат сигналом изменения наркоситуации, вслед за которым должны последовать уточнения в методах работы, в формах статистической отчетности. Но чаще «отловленные» системой нестыковки являются следствием ошибок или недопонимания положений инструкций. Реагируем мы на такие «новинки» путем проведения организационно-технических мероприятий. Во-первых, совершенствуем программное обеспечение и логику проверки получаемых данных. Во-вторых, направляем на места инструктивные письма с разъяснениями, уточняем положения инструкций, контролируем точность их исполнения и достоверность предоставляемых данных в ходе выездов на места. Два-три раза в квартал я сам выезжаю в территориальные органы с целью проверки и оказания помощи в организации работы. Нахожу там ошибки, которые на местах более заметны и легче устраняются. Кроме того, там легче вскрыть причины допущенных ошибок, найти пути их предотвращения в будущем.
В какой мере вы готовы представлять накопленные данные другим ведомствам? Что делается для налаживания межведомственного взаимодействия?
Оно действительно необходимо. Постановление Правительства Российской Федерации от 23 января 2006 года № 31 «О создании, ведении и использовании единого банка данных по вопросам, касающимся оборота наркотических средств, психотропных веществ и их прекурсоров, а также противодействия их незаконному обороту» уже выполнено, и такой массив информации создан. Его создание — очень важный шаг. Он позволяет обобщать данные, понимать, что делается в стране на фронте борьбы с наркотиками, координировать работу нескольких ведомств, выявлять наиболее значимые направления противодействия наркоугрозе и профилактической, предупредительной работы, концентрируя на них общие усилия.
В силу того, что дополнительных финансовых средств на создание единого банка данных выделено не было, мы не стали начинать эту деятельность с закупки оборудования, разработки специального программного обеспечения и т. д. Разместив единый банк данных на нашем оборудовании, на тех же серверах, на которых находятся иные используемые нами информационные ресурсы, мы существенно сократили сроки его создания, сэкономили финансовые средства на самостоятельную разработку. А самое главное — мы уже используем этот банк данных, выдаем коллегам необходимую им информацию. Однако из многих десятков наших ресурсов к единому банку данных относятся только двенадцать. Нередко эти ресурсы имеют ограничения по доступу. Например, любое подписанное ФСКН России соглашение об информационном взаимодействии содержит требование о запрете доступа к полученным сведениям со стороны третьих лиц. В силу этого организовать к единому банку доступ в режиме онлайн пока не представляется возможным. Сейчас заинтересованные пользователи получают данные из него по письменным запросам. Однако мы проводим работы по созданию выделенной аппаратно-программной платформы единого банка данных. Как только она будет создана, можно будет ставить вопрос о нормативном правовом закреплении права доступа к единому банку данных в дистанционном режиме.
В основном в этом банке данных накапливается статистическая информация, и «Матрица» хорошо подходит для решения таких задач. Но в единый банк должна поступать информация и от других ведомств, формируемая по их собственным правилам, в своих форматах, которые могут к тому же с течением времени изменяться. При передаче этих сведений в ФСКН России никакая их доработка для удобства размещения в банке данных не проводится. Поэтому вопросы стандартизации форматов хранения и представления информации пока являются делом будущего.
Как продвигается работа по разработке единых стандартов, форматов и правил обработки информации на федеральном уровне?
Единые форматы обмена данными и их хранения — это действительно большая проблема. Очень немногие страны могут похвастаться тем, что у них имеется их нормативное закрепление. В России сейчас можно говорить о неких общих подходах, но не о решении самого вопроса. Работая с одинаковыми информационными объектами, различные ведомства и организации по-разному формируют перечень входящих в них данных и форматы их хранения. В качестве первого шага в этом направлении можно было бы обязать всех единообразно формировать наиболее общие и часто используемые информационные поля, такие как фамилия, имя, отчество физического лица, название организации и т. п. Это было бы уже значимым вкладом в дело взаимного согласования форматов хранения информации в базах и банках данных. Имея множество соглашений с разными ведомствами об информационном обмене, мы отчётливо видим необходимость в их стандартизации. Но сейчас никто не соглашается координировать эту работу, каждое ведомство исходит из собственных задач и представлений. Однако шаги навстречу делаются.
В прошлом году нашей службой был объявлен конкурс на создание поисковой системы, которая позволяла бы вести поиск в многообразных базах данных, полученных из сторонних организаций, и выполнять отдельные функции по анализу результатов этого поиска. Компания «ФОРС — Центр разработки», выигравшая также и этот конкурс, разработала программно-технологический комплекс «Поиск». Это существенно повысило эффективность работы с информационными ресурсами, которые мы получаем из сторонних организаций, имеющих разную структуру. С появлением комплекса «Поиск» на предоставление заинтересованным пользователям доступа к вновь полученным информационным массивам стало уходить гораздо меньше времени. При этом конечный пользователь может получать агрегированную информацию, не заботясь о внутренней структуре исходных баз данных. Так, введя фамилию человека, можно получить сведения о нем сразу из всех подключенных баз данных и связать их между собой. Сведение всей информации воедино, отождествление одинаковых объектов в различных базах позволяет выявлять опосредованные связи между объектами. Для удобства анализа полученной информации она может быть предоставлена пользователю в графическом виде. Сейчас завершена опытная эксплуатация комплекса «Поиск».
Насколько аналитическое ПО реально помогает вам в вашей работе? С какими особенностями вы сталкиваетесь в области автоматизации деятельности вашего ведомства?
Хочу подчеркнуть: к термину «анализ» я отношусь очень осторожно. Сейчас это слово стало модным, и все мы видим, как его применяют даже к простым документам с последовательностью убывающих или возрастающих цифр. Анализ — это, на мой взгляд, «высокая материя». Он должен не описывать статистику, а позволять выявлять скрытые тенденции, находить неявные взаимосвязи в сущности изучаемых явлений. Пакет «Матрица» дает возможность представить данные в такой форме, что становится наглядным развитие какой-то неочевидной тенденции, очерчиваются особенности работы по отдельным мероприятиям, выявляются имеющиеся и потенциальные проблемы, их скрытые причины. Программный продукт позволяет не только увидеть особенности того, как работают сотрудники органов наркоконтроля по определенной статье Уголовного кодекса Российской Федерации, но и, скажем, отследить, как распространяются новые виды наркотиков по территории России, как реагируют наши подразделения на эти угрозы, выявить положительный опыт и недостатки в работе. Но пакет не может делать эти выводы самостоятельно. Он лишь представляет информацию в таком виде, чтобы это было несложно для работающего с ним сотрудника.
При решении вопроса об автоматизации для нас важен гриф секретности обрабатываемой информации. Далеко не всё можно и нужно доверять информационным системам, даже если информация надёжно защищена от несанкционированного доступа. Существенное влияние на нашу работу с информацией оказывает вступивший в силу закон «О персональных данных». Требованиям этого закона мы следовали задолго до его принятия. В ведомстве были проведены научные исследования по разработке методов обеспечения безопасного хранения и обработки конфиденциальной информации. Сейчас продолжается планомерная деятельность в этом направлении.
Например, при разработке программного обеспечения очередной автоматизированной информационной системы мы учитываем гриф необходимой информации, особенности организации работы с ней, планируемые средства защиты и средства вычислительной техники, с которыми они будут эксплуатироваться.