Об успехах и проблемах работы с электронными данными в Федеральной службе государственной регистрации, кадастра и картографии (Росреестр) рассказывает заместитель руководителя «Росреестра» Сергей Сапельников.

Intelligent Enterprise: Если говорить о предоставлении государственных услуг в электронном виде, то «Росреестр» — одно из наиболее передовых ведомств. Это означает, что вы достаточно далеко продвинулись в организации работы с весьма объемными массивами цифровых данных. Видимо, популярная ныне концепция «больших данных» явно имеет отношение и к вашей работе…

Сергей Сапельников: Попробую привести некоторые цифры. У нас в Российской Федерации более 100 млн объектов капитального строительства — жилых домов, нежилых зданий, всевозможных сооружений — и более 60 млн одних лишь земельных участков. С этими объектами и правами на них происходит более 25 млн транзакций в год. Элементарные межведомственные транзакции, связанные с рынком недвижимости, налогообложением, управлением имуществом и т. д., исчисляются десятками миллионов — пожалуй, ближе к 100 млн. Сегодня все данные об объектах недвижимости и транзакциях собираются в цифровом виде и хранятся в двух главных реестрах — Реестре прав и Государственном кадастре недвижимости.

Отдельно имеется область картографии, в которую со всей Российской Федерации собирается информация о всевозможных объектах на местности — зданиях, дорогах, мостах, опушках, отдельно стоящих деревьях, бродах, переходах... Это более 250 млн записей, распределенных по разным ведомствам, — понятно, что, например, любой мост, по которому происходит движение транспорта, есть и в реестре мостов в Минтрансе, и в реестре муниципальных органов власти. Электронная картография — обширная область знаний, где информация изначально накапливается в виде распределенных баз, и эта область только зарождается. До недавнего времени картографическая информация у нас не была представлена в цифровом виде, и только в последние два года мы вплотную занялись расшифровкой картографической информации с привлечением данных космической съемки. Сейчас, благодаря программе ГЛОНАСС, у нас есть практически сплошное покрытие всей территории Российской Федерации топокартами, но и здесь мы еще только в начале пути. Однако давайте вернемся к реестрам.

Реестр прав и кадастр недвижимости связаны между собой правоотношениями: описания земельных участков содержатся в кадастре, а сведения о том, кому эти участки принадлежат, — в реестре прав. В будущем мы занесем туда же и все сведения об объектах капитального строительства, которые сейчас имеются в бывших органах БТИ, — это будет сделано к 2013 г.

Базы данных зданий и сооружений ранее велись на уровне регионов и муниципалитетов, и сейчас Росреестр должен собрать их вместе. То есть несколько тысяч инсталляций СУБД (в данном случае — Oracle) собираются до уровня субъектов Федерации, и мы получаем 83 одинаковые базы. До 1 июня этого года мы должны выпустить так называемый федерализованный ресурс, где все эти 83 ресурса объединяются в один. К ресурсу подключаются данные о транзакциях и взаимоотношениях между объектами, а также сведения о земельных участках из кадастра недвижимости, и создается сервис, обеспечивающий доступ ко всей этой информации. С 1 марта сервис начнет работать для тех, кто имеет право пользоваться им бесплатно, а чуть позже мы реализуем и платные услуги для всех желающих.

Это один из крупнейших проектов такого рода — по количеству объектов мы занимаем первое место в мире, хотя бы потому, что у нас огромная территория. Но дело не только в этом, а еще и в объеме информации, которая должна быть передана нам из органов БТИ. Самое сложное в работе по интеграции этих информационных ресурсов — обеспечить полноту, целостность, качество данных, относящихся к объекту.

В других странах ничего подобного нет?

Если говорить о западноевропейских ведомствах, то там очень многих проблем, которые сейчас стоят перед нами, никогда не существовало. Например, в Голландии есть инфраструктура базовых реестров, и любая сущность, с которой так или иначе сталкивается государство, описана в одном из них. Автомобиль описан в реестре, аналогичном нашему реестру ГИБДД, налоги — в реестре налоговой службы, недвижимость — в кадастре недвижимости и т. д. Основных сущностей немного — семь или восемь, и каждая обладает уникальным идентификатором. Неточности, конечно, попадаются, но существует система ссылок, и действуют постоянные механизмы внесения исправлений: всякий, кто выявит неточность, обязан незамедлительно сообщить об этом в базовый реестр, исправить запись там, а затем и в своем реестре. Если бы мы могли не хранить в реестре прав собственности полные данные о правообладателе, а обходиться только его уникальным идентификатором, может быть, наш информационный ресурс не был бы таким объемным и не требовал бы внесения стольких исправлений.

В России нет единого адресного реестра, и один и тот же объект в разных базах, в том числе наших, записывается по-разному. Мой любимый пример — улица 26 Бакинских комиссаров, адрес на которой может быть записан несколькими разными способами. Точно так же нет уникальных идентификаторов у физических лиц. Представим себе, например, что девочка в 12 лет получила в наследство недвижимость, которая была зарегистрирована на ее свидетельство о рождении. Девочка выросла, получила паспорт, потом вышла замуж, сменила фамилию, получила новый паспорт, да еще и переехала в другой регион… Очевидно, если отправить в Росреестр запрос о том, что принадлежит гражданке такой-то, поиск ничего не найдет. Поэтому задача выравнивания описаний лиц, объектов, выравнивания характеристик объектов за счет централизации — одна из важнейших для нас.

Сегодня у нас в каждом регионе запущен Территориальный информационный ресурс — предтеча федерализованного ресурса. На уровне регионов мы начали чистить базы данных, доставшиеся нам в наследство. Количество неточностей измеряется сотнями тысяч, и иногда у нас даже нет возможности что-то изменить, так как для этого мы должны разыскать и вызвать правообладателя, чтобы он принес нам действующий документ. Но этот аспект полностью относится непосредственно к процессам работы с информацией, в технологии мы пока здесь не погружались.

Тогда перейдем к технологиям.

Главных задач здесь мы видим две. Первая — сокращение сроков предоставления информации, вторая — автоматизация этого процесса, исключение из него человека. На данный момент всякий пользователь, зашедший с запросом в Реестр прав или в Кадастр недвижимости, фактически будет взаимодействовать с сотрудником бэк-офиса, который должен будет заглянуть в базу, проверить запись и при необходимости свериться с бумажными документами. Если он обнаружит неточность, то внесет исправления и лишь после этого сформирует выписку. С 1 июня региональная информация, подписанная цифровой подписью руководителя региона, будет автоматически подниматься в федеральный информационный ресурс, который будет выдавать онлайн-справки без участия человека. Если сегодня получение справки занимает пять дней, то с 1 июня оно будет происходить мгновенно.

Меняются все процессы — накопление данных, их верификация, хранение, эскалация, механизмы взаимодействия и защиты. Соответственно меняются и сами данные. Если раньше мы давали гражданину выписку, с которой он мог пойти, скажем, в банк, то сегодня вы, зная кадастровый номер объекта, можете сказать тому же банку: зайдите в базу Росреестра и узнайте там. Для банка открыт доступ в наш ресурс, ответственный сотрудник просматривает данные и убеждается, что объект действительно принадлежит вам, не обременен долгом и т. д., а значит, его можно, например, взять в залог. Это самое существенное, что будет меняться. Ну и разумеется, скорость.

Если говорить об очистке данных, то для нее существуют определенные вспомогательные технологии, например автоматическая очистка или устранение дублирования. Насколько технологии такого рода полезны в вашем случае?

Сегодня мы можем на них рассчитывать только как на инструмент для выявления объектов, подозрительных на неточность в описании. При этом нам приходится придумывать специальные проверки, исходя из нашей предметной области, — пользоваться готовыми техническими средствами пока не удается. Правда, есть СУБД Oracle как стандартное средство хранения всех данных, с поиском, всевозможными сценариями и другими механизмам работы с данными, которые там реализованы. Однако на данный момент поставщики редко помогают нам мастер-моделями.

В будущем ситуация должна измениться. Сейчас мы разрабатываем новую учетную систему. Для нее взяли инфологическую модель, которая используется в международных стандартах описания объектов недвижимости. Но пока об этом рано говорить — мы находимся на этапе верификации первоначальных сведений, которую проводим с активным привлечением предметной области и бумажных документов. Во всех российских законах до сих пор зафиксирован приоритет бумаги над электронными данными. Мы стремимся полностью исключить бумажный носитель из всех цепочек накопления данных. Когда это осуществится, всякая ошибка, если она куда-то вкрадется, будет одинаковой во всех реестрах, так что можно будет ее исправить сразу везде.

Следующий вопрос — об архитектуре хранения. Если говорить об описании отдельного объекта и его атрибутов, то для этой цели идеальна реляционная модель. Но сейчас появляются новые виды информации, для которых реляционная модель подходит уже не так хорошо. Сталкивались ли вы с чем-то подобным?

Вообще говоря, мы не свободны в выборе архитектуры хранения. Мы, как всякий государственный орган, работаем с типовыми объектами и ситуациями, перечень которых жестко регламентируются законодательством. То же и для информационных ресурсов — если Счетная палата найдет в вашей базе неиспользуемое поле, она может даже наказать вас за нецелевое использование средств. Но что касается процедур предоставления данных, то здесь разного рода инновации в работе с данными, на мой взгляд, вполне уместны и полезны.

Мы совсем недавно стали об этом задумываться, и на данный момент у нас запущен только небольшой пилотный проект. Это контекстный вариант сайта, на котором заявитель описывает свою жизненную ситуацию и получает необходимые ответы. На Западе уже есть такие сайты, и они работают не по реляционному принципу, точнее, не только по нему: можно провести и контекстный поиск, как при использовании поискового сервера в Интернете. Со временем мы тоже займемся этим вплотную, но сначала надо хотя бы реализовать первый этап — «затащить» в реляционную модель все имеющиеся у нас объекты, выверить их и привести к единообразному виду.

Что касается архитектуры нашего большого хранилища, то федеральный ресурс фактически представляет собой зеркало всех региональных ресурсов. Все первичные процедуры, связанные с верификацией данных, осуществляются в регионах — там регулярно исправляются десятки тысяч ошибок. Это сложная кропотливая работа, которая часто требует обращения к бумажному архиву или вызова правообладателей. Иногда исправить документ удается только через суд (решение которого служит доказательством). А федеральный ресурс, куда стекаются более или менее исправленные данные из регионов, занимается выявлением дублей, которые на региональном уровне не видны, — например, одно и то же лицо владеет недвижимостью в нескольких регионах, но занесено в их базы по-разному. Дубли, выявленные на федеральном уровне, снова передаются вниз, чтобы в местные учетные системы были внесены исправления. А наверху уже строятся всевозможные витрины для различных задач, таких как получение выписок (срезов на определенную дату) или подписка на обновления информации. Скажем, вы можете подписаться на новости о своей квартире и своевременно узнать, если кто-то заявит на нее права, запросит информацию о ней и т. д. Частным лицам это, может быть, не так уж и нужно, но крупным правообладателям механизмы выявления изменений очень полезны.

То есть возрастает роль заранее подготовленных информационных агрегатов, а также вычисляемых ресурсов по сравнению с хранимыми исходными данными?

Да, именно так. У нас становится все больше предподготовленных витрин, индексов и прочих подобных ресурсов для того, чтобы система работала быстро. Кроме того, мы предлагаем контрагентам и такой вариант, как доступ к «сырым» данным с возможностью делать без нашего участия свои срезы — аналитические и информационные. Мы даем «сырье» — юридически значимый реестр информации об объектах недвижимости и правах на них, а контрагенты используют эти данные в соответствии со своими потребностями.

Во всем мире сейчас стремительно развивается новая культура потребления больших данных, когда для предоставления данных потребителю «на лету» соединяется несколько ресурсов и Web-сервисов. Причем такое соединение фактически происходит в режиме проведения непрерывных и очень интенсивных вычислений. Госсектор здесь отстает, он пока существует почти исключительно в парадигме разовых транзакций: информационный запрос — информационный ответ. Но у нас на геопортале уже работает публичная кадастровая карта, которая получается путем соединения информации из трех разных источников: один сервис предоставляет космоснимки, другой — топографическую карту, третий — кадастровый слой, то есть данные о границах земельных участков. Геопортал — первый шаг. Мы стараемся развивать этот подход и очень хотим, чтобы примеров такого рода становилось больше.

Проблема производительности стояла всегда, и ее обычно решали «в лоб», путем наращивания вычислительных мощностей. Но сейчас начались качественные изменения — я говорю прежде всего о решениях на базе облачных технологий. Нужны ли вам такие решения, и планируете ли вы их развертывание?

Да, нужны. Нет, не планируем. Поясню свой ответ. Наш сайт занимает третье место по загруженности среди российских государственных ресурсов, при пиковой нагрузке на нем находится порядка 15 тыс. посетителей, а в непиковые моменты их число опускается до 300—400. Очевидно, нам бы очень пригодилась возможность быстрого увеличения производительности по требованию, но мы не можем себе этого позволить, поскольку обязаны соблюдать № 94-ФЗ. А так как закон требует, чтобы мы заранее спрогнозировали все свои потребности, использование облачных технологий представляется нам проблематичным. Для нас существуют ограничения, связанные с защитой персональных данных и иных данных ограниченного распространения, которые у нас тоже есть. Сегодня мы не можем поместить такие данные во внешнее облако — можем, конечно, построить свое облако, но его, точно так же как традиционную инфраструктуру, понадобится сделать достаточно мощным, чтобы выдержать пиковые нагрузки.

Нам уже пришлось столкнуться с пиковыми нагрузками, когда мы вводили плату за сведения из кадастра недвижимости, — количество запросов выросло с 7—8 тыс. до 40—50 тыс. Инфраструктура с таким потоком не справлялась — возникали пробки, как на московских магистралях, и требовалось вручную пропускать заявки вниз и вверх. Для производительности федерального ресурса у нас пока есть только предварительные оценки. Конечно, мы очень надеемся, что наши расчеты верны и инфраструктура выдержит, но если случится иначе, будем наращивать мощность.

Последний, очень короткий вопрос: есть ли у вас понятие устаревших данных?

Собственно устаревших данных у нас нет, поскольку для нашей информации не установлен срок устаревания, но есть сведения архивного характера, которые мы помечаем в реестре прав как неактуальные. Поэтому мы храним много бумажных документов: общая площадь помещений, занятых нашими архивами, — 230 тыс. м2. Кстати, оцифровка бумажных архивов — отдельная интересная тема. У нас есть стратегия архивного хранения, в рамках которой мы пытаемся выявить документы так называемого вечного хранения и увезти их, условно говоря, в «пещеру» с определенной влажностью и климатом. Остальные документы, к которым необходим операционный доступ, мы хотим подвезти поближе к потребителю и с них начать оцифровку всех данных, которые у нас есть. Это важная работа: когда мы ее выполним, станут возможными электронные транзакции в области регистрации прав (сейчас регистрация выполняется только на основе бумажных документов — даже результаты электронного аукциона должны быть распечатаны на бумаге). Так что, как видите, у нас еще много нереализованных возможностей, и нам есть куда расти.