Для борьбы с бедствиями, большими и малыми, природными и социальными, необходимы, конечно, материальные ресурсы, но еще прежде них — данные, которые позволят понять, какие именно ресурсы следует привлечь и на что направить. Чтобы не ходить далеко за примером, вспомним российский добровольный поисково-спасательный отряд «Лиза Алерт»: за четыре года своего существования он провел более 3000 поисковых операций, большинство из которых закончилось благополучно — пропавшие люди были найдены живыми. Это удалось не за счет какого-то особого оборудования или снаряжения, а благодаря мгновенному реагированию, отличной координации и высокой скорости информационного обмена. Как видим, от своевременного поступления данных и быстроты их обработки может напрямую зависеть жизнь человека.
Нередко для благотворительных организаций и волонтерских групп проблемой становится не сбор, а обработка данных — их очистка, разбор, анализ и, наконец, визуализация. На помощь им приходят специалисты, готовые выполнять такую работу безвозмездно или на каких-то иных устраивающих группу условиях. Так возникает волонтерская обработка данных как особый вид благотворительности. Волонтеров — специалистов в области работы с «большими данными» — объединяет группа «Данные без границ» (Data Without Borders, DwB), к которой примыкают сообщества DataKind US и DataKind UK (соответственно, американское и британское). Периодически они проводят рабочие встречи, называемые Datadive (буквально «ныряние в данные»), между негосударственными некоммерческими организациями, у которых есть задачи по обработке данных, и экспертами, которые могут предложить решения. Эту деятельность поддерживает компания Teradata в рамках программы Teradata Cares («Teradata не все равно»). Конференцию Teradata Partners в этом году предваряла встреча Datadive, где был, среди прочего, представлен созданный летом этого года Интернет-ресурс Data for Good («Данные для блага [людей]»), посвященный волонтерским проектам, так или иначе связанным с «большими данными», и предназначенный для обмена идеями. Чтобы показать, насколько разными могут быть идеи, назову три из десяти самых популярных проектов. Это CrisisNET — поиск, обработка и визуализация в доступной форме данных о любых кризисных ситуациях; Eyenaemia — диагностика анемии по фотографии глаза; Radwende — мобильное приложение для проектирования городской сети велодорожек (первоначально разработанное для города Висбадена), которое отслеживает и наносит на карту города путь велосипедиста.
Работа системы CrisisNET проиллюстрирована в ее описании пузырьковой диаграммой, показывающей количество сообщений о разных видах инцидентов. Два самых больших кружка на ней — это «Эбола» и «Болезнь». Действительно, эпидемия, которая охватила Западную Африку, — самая крупная из всех, зафиксированных с момента открытия заболевания в 1976 году, — уже унесла более 5,5 тыс. жизней и признана угрозой мирового масштаба. В борьбу с вирусом включились организации всех типов — и правительственные, и коммерческие, и научные, и благотворительные, — а чем больше участников и чем они разнообразнее, тем нужнее и важнее координация их действий. Как здесь помогают технологии сбора и обработки «больших данных», видно из примера IBM. Исследовательский центр IBM в Найроби (Кения) — на данный момент единственный в Африке — открылся в ноябре прошлого года. Свою главную цель ученые видят в создании на основе достижений науки и техники коммерчески жизнеспособных инноваций, помогающих улучшить условия жизни на континенте. Борьба с инфекцией стала для них боевым крещением.
В Сьерра-Леоне, где сложилась очень тяжелая ситуация, органы здравоохранения пытались информировать население о мерах по защите от болезни, рассылая им SMS-сообщения, но это не действовало. Хотя мобильные телефоны есть практически у всех жителей страны, от 40 до 50% населения неграмотны и не могут ни прочесть SMS и принять к сведению то, что там написано, ни, тем более, написать свое сообщение. Чтобы исправить положение, специалисты IBM совместно с национальной инициативой Сьерра-Леоне «Открытое правительство» (Open Government Initiative, OGI) реализовали систему, дополняющую SMS голосовой связью. Сейчас правительство обращается к гражданам по радио (многие принимают передачи на мобильные телефоны), а сообщения от граждан принимает специализированный центр обработки вызовов. В проекте приняли участие также сотовый оператор Airtel, который предоставил и поддерживает бесплатный номер центра, и кенийский стартап Echo Mobile, специализирующийся на использовании мобильной связи в интересах беднейших общин, — он обеспечивает анонимизацию данных. Количество поступающих звонков исчисляется сотнями тысяч в день, но Юи Стюарт, главный научный сотрудник Африканского исследовательского центра IBM, предпочел бы, чтобы их были миллионы — это позволило бы повысить качество генерируемых данных.
Собранные данные обрабатываются с использованием облачных суперкомпьютеров IBM, распространение результатов осуществляет OGI. Система уже позволила выявить районы, наиболее остро нуждающиеся в тех или иных ресурсах (мыло, электрогенераторы и др.), и помогла выявить некоторые системные проблемы, мешающие победить болезнь.
Так, одна из важнейших санитарных мер в случае лихорадки Эбола — это немедленное захоронение умерших с соблюдением жестких правил предосторожности. Правительство Сьерра-Леоне распространило четкую и ясную информацию о том, как действовать, но когда был запущен центр обработки вызовов, анализ данных показал большое количество сообщений о неубранных трупах. Отчасти это могло объясняться следованием обычаю, но была, как выяснилось, и другая причина — перегрузка инфраструктуры: родные умерших людей, желая точно знать, от чего именно они умерли, ждали вскрытия, а имеющееся в Сьерра-Леоне лабораторное оборудование позволяло сделать не более 50 проб в день. (Ситуация меняется ежедневно, в конце октября пути решения еще обсуждались.)
Программа IBM по борьбе с вирусом Эбола проводилась также в Нигерии, где эпидемия была успешно остановлена. Облачная платформа Connections, та самая, что была ранее развернута для помощи пострадавшим во время землетрясения на Гаити, а затем урагана «Сэнди» в США, будет использоваться правительством Лагоса для профилактических мероприятий против распространения болезни. Волонтеры IBM включились во внутрикорпоративный краудсорсинговый проект по идентификации, инвентаризации и классификации всех открытых источников данных по эпидемии вируса Эбола. Информация заносится в Репозиторий открытых данных по Эбола, базирующийся на технологии IBM SoftLayer cloud, который доступен для безвозмездного использования государственными учреждениями, агентствами по оказанию помощи и исследовательским организациям.