Начнем с определения. Ретроконверсия, или, правильнее, ретроспективная конверсия — это преобразование унаследованной информации из одной формы в другую. В смысле ИТ здесь обычно подразумевается оцифровка информации, которая, как правило, хранится в бумажном виде.
Задача ретроконверсии актуальна прежде всего для музеев и библиотек, точнее, их каталогов. Работы по электронной каталогизации книгохранилищ были начаты в середине 80-х годов, но более старые фонды до сих пор остаются вне новых каталогов, что затрудняет поиск. Если же библиотека специализированная, то эта проблема усугубляется еще больше. Пользователь вынужден строить гипотезы, как мог бы называться необходимый ему документ, или уметь работать с классификаторами. А для этого придется стать специалистом в области библиотечного дела.
Поворотным пунктом стал 2003 год, когда на одном из всероссийских совещаний библиотечных работников были названы результаты, характеризующие весьма плачевное положение дел в этой области. Тогда лишь 5% библиотек провели ректроконверсию в полном объеме, а почти треть из них так к ней и не приступила. Сейчас, когда уже есть немало успешно завершенных проектов, ситуация, конечно, серьезно изменилась в лучшую сторону, но до полного решения проблемы пока еще далеко.
В музеях всё почти так же, их специфика состоит лишь в том, что проблема была поставлена намного позже и соответственно позже ее начали и решать. И тут, как говорится, не было бы счастья, да несчастье помогло: многие вопросы были решены после скандального случая с кражей из фондов Эрмитажа. В несколько меньшей степени данная задача актуальна для архивов. Тут положение осложняет то, что оцифровывать нужно не только каталог, но и документы, которые к тому же продолжают поступать.
Ретроконверсию можно проводить тремя способами:
- ручной ввод;
- автоматическая оцифровка с оптическим распознаванием символов;
- заимствование данных из других источников, например каталогов, составленных другой организацией, в частности профильным федеральным ведомством.
Для библиотек возможными средствами ретроконверсии являются ручной ввод и оцифровка с распознаванием. Возможно и сочетание обоих подходов, поскольку технологии распознавания не всегда работоспособны, особенно если карточки заполнялись от руки или сильно повреждены, но их текст, тем не менее, разборчив для человека. Важно отметить, что оцифровка — задача разовая, и ее проведение не только можно, но и нужно отдать на аутсорсинг. Эта услуга хорошо развита, и количество успешных проектов тут исчисляется десятками, если не сотнями. Решены и такие задачи, как бережная оцифровка старых оригиналов, даже ветхих, в том числе и на территории заказчика. Оцифровку библиотечных и музейных каталогов проводит ГИВЦ Министерства культуры, компании «Элар», Scandocs, «Гипер» и еще целый ряд фирм, включая региональные. Приобретать дорогое, не слишком простое в обращении и довольно капризное оборудование совсем не обязательно. Обычные планшетные сканеры, конечно, уже не редкость в библиотеках, но речь в данном случае идет о высокоскоростных устройствах потокового ввода.
Для архивов ситуация несколько сложнее. Прежде всего по понятным причинам ручной ввод использовать не просто непродуктивно, но и невозможно. Но если поступают всё новые документы, то задачу оцифровки своими силами скорее всего решать придется. Что, однако, не мешает отдать на аутсорсинг ввод ретрофонда, по крайней мере частично. Сканирование на массовом оборудовании, к сожалению, может нанести вред документам, особенно ветхим. Кроме того, в фондах могут быть и документы, с которых не снят гриф секретности. Впрочем, целый ряд компаний может проводить оцифровку на территории заказчика, и в их арсенале есть оборудование для работы с ветхими и поврежденными оригиналами. На сегодняшний день уже реализовано несколько успешных проектов по оцифровке архивных фондов. Так что опыт в этой области, пусть и небольшой, но есть. Нужно только не бояться сложности и масштаба задачи. Ведь все равно от этого никуда не деться.