О BigData сегодня не говорит разве что ленивый, но в этих разговорах рынок уже не позволяет ограничиваться общими заявлениями о том, как с помощью современных алгоритмов можно данные превратить в ценность. И если заказчик еще далеко не везде готов плотно заняться конкретной работой, то начать более детально разбираться с ситуацией в отраслях и на определенных локальных рынках необходимо уже сейчас.

Нефтегазовый сектор, безусловно, может и, наверное, должен проявлять интерес к построению практических решений в этой области. Сегодня мы имеем (в том числе и в отечественных компаниях) солидные архивы необработанных исторических данных, которые связаны с выполнением производственных процессов и которые при нынешнем уровне технологий их прикладной обработки можно превратить в знания.

К тому же зависимость перспектив крупных нефтегазовых предприятий от конъюнктуры рынка (как в мировом, так и в национальном масштабе) более чем явная, сама отрасль по понятным причинам всегда была и остается, что называется, на виду и в прессе, и во многих коммерческих отраслях, и во властных коридорах. В таких условиях анализ огромного количества неструктурированной информации, в основном из внешних источников, становится весьма актуальной задачей. А это в свою очередь тоже является одной из типичных задач технологии Больших Данных.

При всем этом отрасль, о которой мы сейчас говорим, не является драйвером практического внедрения концепции BigData и в общем даже не входит в явные лидеры по количеству проектов соответствующей направленности. Хотя отдельные успешные и вполне продвинутые кейсы в мире найти, безусловно, можно. Отечественные компании, как известно, тоже не на передовых позициях. Почему же так происходит? Думается, какого-то одного препятствия, которое можно было бы однозначно выделить, не существует, а имеет место целый комплекс причин.

Препятствия большого пути

Большинство нефтяных компаний в России — это вертикальные холдинги: добывающие предприятия и дочерние бизнесы, занимающиеся логистикой и перевозками. Сеть заправок — опять-таки отдельный бизнес. Существуют еще научно-технические подразделения и конечно же корпоративный центр. Данных в индустрии много, но при этом они находятся в ведении разных юридических лиц. На ИТ-конференциях постоянно говорят о сложности вывода данных из так называемых «силосов» предметных областей (финансовой, маркетинговой, производственной и пр.) в некоторое единое общекорпоративное поле, на котором собственно и должен проводиться анализ.

Но в отечественных холдингах мы сталкиваемся с организационными силосами, в основном обусловленными упомянутой структурной обособленностью, и это намного серьезнее. Хотя бы потому, что здесь нет готовых, многократно проверенных и гарантированно успешных методик и технологий решения проблем. В нефтегазовой отрасли на уровне высшего руководства никогда не было четкого осознания того, что количество и качество информационных ресурсов (не путать с задачей внедрения ключевых ИТ-систем) влияет или по крайней мере в какой-то момент может повлиять на эффективность управления бизнесом. В том же банковском бизнесе это понимание, пусть где-то и неявное, складывалось еще задолго до появления BigData. Здесь непрерывное совершенствование работы с информацией в целом по компании и улучшение ее управляемости воспринимались во многом как естественно связанные между собой вещи.

У нас в отрасли гендиректор компании вряд ли будет всячески стремиться к тому, чтобы поделиться данными, поскольку в результате может быть (и скорее всего будет) выявлена недостаточная эффективность управления организацией. А мы ведь собираем данные именно для оптимизации, значит, будут найдены резервы для повышения эффективности. И при этом, очень вероятно, выяснится, что гендиректор о них и не подозревал. По-хорошему первое лицо компании должно такую деятельность вести самостоятельно, лично управляя формированием информационного ресурса бизнеса с нетехнологических позиций и определяя возможную переоценку значимости его отдельных компонентов. Но много ли таких генеральных директоров в добывающих компаниях, когда все эксперты сосредоточены в научно-технических центрах? И насколько генеральные директора добывающих компаний готовы отдать в научно-технический центр на аутсорсинг свою эффективность?

Далее необходимо сказать, что нефтяные холдинги — это явно не те структуры, где использование интернет-пространства (даже подвергаемого ряду корпоративных ограничений) тесно вплетено к культуру корпоративного управления. Люди на рабочих местах не находятся в онлайне. Пользователям в корпоративной сети недоступны облака, социальные медиа- и профессиональные онлайн-сообщества. Информационные системы — тоже не в онлайне: нет Яндекс-метрик, Яндекс- и Google-карт, соответственно для разработчиков нет доступа к ресурсам GitHub. К тому же некоторые данные (например, о недрах) должны храниться определенным образом, и даже внутри компании не у всех есть доступ к ним. Многие геологи скептически настроены по отношению к ИТ-системам и Большим Данным, потому что помнят свои неудачные попытки загрузить файлы размером более двух гигабайт в 32-разрядные операционные системы.

Экосистема бизнеса в нефтяной отрасли состоит из множества нефтесервисных компаний, выполняющих значительную часть работ, и инновационность отрасли в целом драматически зависит от технологий (в том числе информационных), применяемых подобными подрядчиками. Предполагается, что законы рынка должны заставлять их искать более эффективные решения, чтобы увеличить свою прибыль. Было бы логично ждать от подрядчиков прихода в отрасль новых технологий обращения с данными. На деле же настрой крупных нефтесервисных компаний больше направлен на то, чтобы всех подсадить на иглу своих услуг по высоким ценам: например, стоимость лицензии на одно рабочее место средней конфигурации может составлять 20 млн. руб.! Заметим, что функционал такого рабочего места не может быть использован на 100%. Поэтому представляется экономным часть функций такого рабочего места перевести на Python и сократить число используемых лицензий. С другой стороны, мелкие нефтесервисные компании довольны своим монопольным положением. По цене они выигрывают у западных предприятий в разы, оставаясь по качеству пусть не на высоком, но в целом на достаточном для функционирования отрасли в текущих условиях уровне. Перефразируя вождя, можно сказать, что «и низы могут, и верхи хотят», но вместе с тем революционных изменений ждать неоткуда.

Предпосылки

Однако можно говорить и о том, что в нефтегазовом секторе все-таки складываются определенные предпосылки для внедрения технологии Больших Данных.

Прежде всего речь, конечно же, о возможности финансирования. BigData очень часто является весьма недешевым удовольствием, а возможности нефтегазового сектора вопреки расхожему мнению не безграничны. Но тем не менее они есть, и это ограничение явно не является принципиальным.

С недавних пор нефтегазовая отрасль получила заметный импульс в развитии коммуникаций. Между различными дочерними предприятиями появились каналы связи с достаточной пропускной способностью. Разработки в основном ведутся в труднодоступных местах, но если подобные проекты признаются необходимыми, туда проводят и электричество, и трубы, и дороги. При таком подходе проложить еще и оптоволокно не так сложно, и это делается. Не всегда, правда, есть понимание того, что широкополосная связь критически важна для бизнеса. Но тут, что называется, жизнь заставит, да и никакого другого варианта может уже и не быть.

Следующим шагом после построения единой корпоративной сети традиционно является попытка получить преимущества от учета нефинансовых ресурсов в системах класса ERP. А если разговор об этом заходит, то это можно уже рассматривать как первые полшага к построению бизнеса, основанного на данных (data driven business). О BigData бизнес, конечно, начнет думать уже на весьма зрелых этапах этого пути, и здесь важно, чтобы CIO понимал, что для технологических данных необходимы отдельные хранилища (о чем Gartner, кстати, говорила уже давно). Двести миллионов записей из журналов мониторинга состояний насосов за год нет смысла загружать в SAPBW, а для анализа эти данные важны.

Подводя итог, можно сказать, что в целом ситуация в нашей отрасли не уникальна. Как и везде, существуют организационные, культурологические и технологические (в основном связанные с традициями взглядов на ИТ со стороны руководства, а не с самими ИТ) барьеры на пути внедрения новых подходов к автоматизации. Существуют, разумеется, и факторы, способствующие их развитию в компаниях. Безошибочно локализовать точку, в которой находится бизнес на этом пути, вряд ли возможно, и чтобы сколь-либо объективно оценить это, мне представляется полезным заполнить таблицу, которую и привожу ниже. Она не ориентирована специально на нефтегазовый сектор и, думаю, может представлять интерес специалистам, работающим в самых разных областях.

Отраслевые «точки кристаллизации»

Известно, что концепция BigDаta очень «демократична» по отношению к различным функциональным направлениям корпоративного менеджмента: она может с успехом использоваться буквально везде — на предпроризводственной стадии, в самом производстве, в логистике, продажах и маркетинге. При этом BigData, как известно, в равной степени применима по всей управленческой вертикали — от анализа параметров работы цехового оборудования в реальном времени до создания информационной основы для принятия стратегических решений развития бизнеса. Еще раз повторю, что потенциально все это может быть реализовано с помощью Больших Данных в крупных нефтегазовых компаниях, и тут важно расставить приоритеты, а скорее даже объективно предсказать те «точки кристаллизации», с которых, что называется, процесс пойдет.

Мне представляется, что к использованию BigData больше готовы инженеры — разработчики месторождений. Особенно если они уже имели опыт работы с суррогатными моделями и поняли преимущество аналитических функций, использующих подходы машинного обучения в дополнение к моделям физическим. Бурение и добыча по отношению к данным напоминают производство: все понимают важность прогнозирования надёжности, моделирования наземных и подземных работ на основе накопленных данных.

В разведывательном и добывающем контуре (Upstream) важны также методы распознавания образов на службе у геомеханики, когда по картинке шлифа нужно сделать выводы о физическом состоянии образца породы. Уже несколько лет все признают, что переход на цифровые методы анализа керна приведёт к необходимости анализировать огромные объемы данных и позволит получить показатель проницаемости каждого конкретного кусочка образца породы, даже если он неправильной формы.

В контуре переработки, логистики и сбыта (Downstream), на мой взгляд, стоит ждать прорыва от использования «умной» клиентской аналитики. Образно говоря, несложно представить себе, что вас будет приветствовать по имени заправочная станция при въезде, если вы уже заправлялись на ней, и предлагать специальные предложения по SMS. Думаю, когда для нас это станет очень актуально на практике, можно будет многое взять из опыта компаний так называемых клиенториентированных отраслей.

Интересна одна из интерпретаций будущего развития событий, согласно которой массовый приход BigData в нефтегазовую отрасль может так и не случиться. Скажем, получится примерно так же, как с цифровой телефонией (тоновый набор) на стационарных телефонах в России: от аналоговой телефонии перескочили сразу к мобильной. Не будет проектов по BigData в российской нефтяной отрасли, а появятся ИТ-инструменты с использованием подходов BigData, о которых геологи, разработчики месторождений и ИТ-специалисты не будут знать. На вероятность такого сценария указывает, например, тот факт, что в 2015 году BigData убран из небезызвестного HypeCycle аналитической компании Gartner. На место этого термина встали когнитивные технологии. И одна из них особенно важна для нефтедобывающей отрасли — это машинные интерфейсы вообще и автоматизация управления процессом бурения скважин в частности. Задача таковой автоматизации требует глубокого анализа данных в режиме, близком к реальному времени. Данных здесь много, и на их основе необходимо строить предиктивную аналитику. Уместность анализа возможности использования стека Hadoop в решении этой задачи представляется неоспоримой.