В страховой компании РОСНО не так давно был завершен масштабный проект по оцифровке документации. Казалось бы, в этом нет ничего удивительного. Технология здесь неплохо отработана, накоплен значительный опыт ее практического использования. Однако специфика посткризисного времени наложила свои коррективы. Плюс ко всему возник целый ряд сложностей, многие из которых не удалось предусмотреть до начала работ. Об этом мы и беседовали с руководителем проекта департамента развития бизнес‑систем РОСНО Татьяной Князевой.
Intelligent Enterprise: Какова конфигурация вашего решения потокового ввода документов? Какие документы подлежат ретроконверсии?
Татьяна Князева: Запуск системы автоматизированного ввода клиентских данных в ОАО СК «РОСНО» на базе системы потокового ввода документов и данных ABBYY FlexiCapture 9.0 (далее СС — система сканирования) и интеграция СС с IBM Content Manager и IBM Document Manager состоялись в апреле 2010 г.(1) Предшествовал этому шагу более глобальный проект «Централизация», одним из важнейших этапов которого была консолидация ИТ-инфраструктуры. Раньше в РОСНО, как и в большинстве российских страховых компаний, использовалась децентрализованная система управления, когда каждый филиал выполняет все функции: от продажи и администрирования полиса до выплаты агентского вознаграждения и урегулирования убытков. В 2009—2010 гг. ряд простых и стандартных бизнес-процессов был переведен из филиалов в созданный в Воронеже Операционный центр (далее ОЦ). Новая схема работы с документами предполагала, что сотрудники в филиалах и агентствах производят первичную обработку страховой и финансовой документации, сканируют и размещают образы документов в электронном архиве, а в головной компании (Москва) и в ОЦ операторы вводят информацию в корпоративную информационную систему (КИС) уже с электронного образа, используя двухмониторную технологию.
В качестве электронного архива были выбраны IBM Content Manager и IBM Document Manager. В ходе централизации мы столкнулись с тем, что выбранное ранее решение по электронному архиву, реализованное на платформе Alfresco, «не потянуло» наши объемы и задачи (централизовалось 78 филиалов). Действующий электронный архив на базе Hummingbird не соответствовал требуемой функциональности, доработка была нецелесообразной. Выбранная нами потоковая СС на основе программного обеспечение ABBYY FlexiCapture позволяет значительно упростить операции по сканированию и размещению документов в электронном архиве (далее ЭХД). Ряд операций, которые сейчас делаются вручную на местах, будут перенесены в Операционный центр в Воронеже или автоматизированы.
Работа СС организована следующим образом: сотрудник сканирует в потоковом режиме сразу несколько документов, программа разделяет загруженные страницы и распознает заданные параметры (например, номер договора, дата договора, страхователь, сумма договора) и автоматически классифицирует документы по типам и видам. В Операционном центре сотрудники проводят верификацию документов (подтверждают, в случае необходимости, некорректно распознанные поля), далее документы автоматически экспортируются в ЭХД (при необходимости синхронизируются с КИС), а часть данных передается в SAP. Просмотр загруженных в ЭХД образов документов возможен и через КИС. При этом сотрудники, используя консоль мониторинга ABBYY, с помощью гибкой системы фильтров просмотра могут отслеживать движение (статус) обработки отсканированных документов.
Как изменился объем массива данных? Насколько необходима в таких условиях модернизация оборудования или использование новых технологий и подходов, таких как дедупликация, иерархическое хранение, архивирование данных, устранение избыточности?
Размеры сканированных документов мы стараемся уменьшить всеми способами. После обработки документа в ABBYY FlexiCapture 9.0 на этапе экспорта в ЭХД конвертируется в установленный формат с определенным разрешением. При этом он остается читаемым для осуществления дальнейшего ввода в КИС. С декабря 2010 г. запущен пилотный проект по внедрению СС в регионах. До установки станций сканирования оператор сканера для каждого документа вручную настраивал параметры сканирования для каждого типа документов, используя стандартное ПО, поставляемое со сканером. Стоит отметить, что в зависимости от объемов обрабатываемых документов в филиалах установлены разные по производительности сканеры. Это, в свою очередь, вело к ошибкам операторов при сканировании документов.
Сейчас возможностей для произвольного вмешательства в процесс со стороны оператора стало существенно меньше. При внедрении СС в регионах мы столкнулись с резким увеличением объема данных при импорте пакетов документов со станций сканирования на серверы обработки ABBYY. Во-первых, мы увеличили стандарты качества изображений для минимизации количества документов, подлежащих пересканированию. А во‑вторых, станция сканирования ABBYY FC 9.0 позволяет передавать изображения на сервер обработки только в определенном формате (tiff), который имеет большой объем и не поддается существенному сжатию. Данная ситуация существенно повлияла и на загрузку каналов связи между филиалами. В настоящее время мы совместно с компанией ABBYY прорабатываем возможные пути решения проблемы.
Количество документов, размещенных в ЭХД, растет каждый день. Несмотря на минимальные требования к формату изображений, объем хранилища ЭХД растет. На данный момент размер максимального хранилища ЭХД составляет 10 ТБ. Для увеличения объема хранилища инициирован проект «Архивное хранилище», который позволит увеличить объем до 27 ТБ. Определенным резервом емкости может стать только устранение избыточности, связанное с упрощением ряда внутренних бизнес-процессов. Пока система потокового ввода реализована только на этапе администрирования полиса (ОСАГО), и чтобы уйти от двойного ввода информации, нам еще предстоит внедрить ее на этапе урегулирования страховых случаев.
Как решается проблема хранения неструктурированной информации (графика, аудио, видео)?
Из подобной информации мы храним в электронном архиве только фотографии (клиентов, страхуемых объектов, ДТП). Они «присоединяются» к договору страхования или документу по возмещению ущерба. Поиск таких фото осуществляется по определенным атрибутам (номеру договора или убытка). С этим проблем не возникает. Эта дополнительная информация ни в коем случае не является «балластом».
Какие новые возможности дает оцифровка данных: полнотекстовый поиск, поиск по медиа-данным, автоматическое формирование краткого содержания документов, выделение ключевых слов и т. д.?
В ЭХД реализованы: стандартный поиск, расширенный (включая полнотекстовый) и настроенный поиск (сохраненные запросы). В основном поиск документов в ЭХД осуществляется по полям карточки (основные атрибуты документов, которые используются и при поиске в КИС). Полнотекстовый поиск практически не используется. Поясню: вся документация у нас оформляется по утвержденным формам и шаблонам, и при полнотекстовом поиске в результатах «вываливается» много ненужной информации.
Приобретают ли качественно иное значение разного рода регулирующие акты в том случае, когда мы говорим о массовом переходе от бумажной формы к цифре? Например, сейчас очень популярно для сведения счетов подводить «обидчика» под нарушение закона «О персональных данных», рассылая специальным образом составленные заявки, содержащие персональные данные высокой категории, о которых сообщается регуляторам.
Надо сказать, что мерам по приведению всех используемых ИТ‑систем в соответствие с требованиями Федерального закона «О персональных данных» в компании уделяется очень большое внимание. При внедрении СС мы опираемся на требования реализованной в компании системы управления информационной безопасностью.
Приходилось слышать, что одной из главных проблем, связанных с оцифровкой, становится обучение персонала. Насколько остро она стояла у вас?
Нет, у нас острой проблемы с обучением не возникло. Во-первых, ABBYY FlexiCapture имеет эргономичный интерфейс, а во‑вторых, для каждой роли оператора сканирования и оператора верификации существуют подробные инструкции. В основном в данных инструкциях уделяется внимание именно бизнес-процессу обработки документа, а не работе с интерфейсом, Сотрудник даже с минимальным опытом может сканировать пакеты документов, а верификатор — обрабатывать до 400 страховых документов в день и до 700 финансовых документов.
А как обстояло дело с пусконаладкой и настройкой?
Сроки запуска пилота по СС были довольно сжатыми в связи с планами по передаче части функций вводу страховой и финансовой документации в ОЦ. К тому моменту у нас был опыт использования ABBYY FormReader 6.5, предшественника ABBYY FlexiCapture 9.0, что несколько упростило задачу настройки шаблонов по финансовой документации. На российском рынке не было реализовано ни одного аналогичного проекта. Мы были первые, кто принял решение использовать станции верификации комплекса ABBYY FC через Citrix для минимизации нагрузки на канал с ОЦ. По сути, прошло менее года от момента проведения тендера по выбору СС и компании, внедряющей эту систему в РОСНО, до приема СС в промышленную эксплуатацию. В процессе работы над внедрением нам пришлось решать и другие проблемы, в частности, связанные с интеграцией как с ЭХД, так и с SAP.
Каковы ближайшие планы по развитию проекта?
На данный момент система покрывает лишь часть наших документов и процессов. Основная задача на 2011 г. — тиражирование СС во все филиалы компании и внедрение функциональности обработки документов по урегулированию убытков, добровольному медицинскому страхованию и другим добровольным видам страхования. В этом году мы планируем подключить 68 регионов и выйти на объем обработки до 3 млн документов в год.
(1) Проект осуществляется Центром обработки страховой документации РОСНО при поддержке Центра информационных систем и технологий, с привлечением специалистов компаний ABBYY и «АйТИ».
Меньше бумаги — эффективнее процесс
Сергей Бушмелев,
ИТ-аналитик DIRECTUMОчень интересный пример, подтверждающий мысль, что при переходе от бумажного документооборота к электронному не удастся избежать реинжиниринга бизнес-процессов. Платой за возможность оперативного доступа к документам с любого рабочего места стало лавинообразное разрастание архива. Частично эта проблема может быть решена за счет использования оптимизированных форматов для хранения изображений, частично за счет дедупликации и иерархического хранения. Но главный резерв для решения проблемы неуправляемого роста архива, на мой взгляд, — это перевод ряда документов полностью в электронный вид. Документы будут изначально создаваться в электронном виде и подписываться электронной подписью, вид которой соответствует возникающим рискам. Это позволит не только уменьшить объем архива, но и в ряде случаев отказаться от дорогостоящего сканирования бумажных документов и последующего распознавания и верификации. «Триггером» для начала более широкого использования электронных первичных документов должно стать принятие нового закона о цифровой подписи, вводящего в правовую сферу отличные от ЭЦП аналоги собственноручной подписи.