Год назад, в марте 2011 г., IBM приняла решение о создании нового подразделения Watson Solutions, которое займется вопросами практического применения системы искусственного интеллекта Watson.
Шахматный суперкомпьютер Deep Blue после победы над Гарри Каспаровым больше не играл. Сейчас одну его стойку можно видеть в Музее американской истории в Вашингтоне, другую — в Музее компьютерной истории в Маунтин-Вью, и обе они выключены. Системе искусственного интеллекта Watson повезло больше. Компьютер Watson тоже обыграл человека на его поле: в феврале прошлого года он выступил в телевизионном интеллектуальном состязании Jeopardy (его русская версия — «Своя игра») против двух самых знаменитых игроков, Брэда Раттера и Кена Дженнингса, и с большим отрывом занял первое место. (Правда, в коротком матче против группы американских конгрессменов Watson оказался лишь на втором месте, уступив первое Рашу Холту-младшему, в прошлом игроку Jeopardy.) Возможно, новых игр не будет и в этом смысле Watson повторит судьбу Deep Blue. Но проект решено продолжить. Для этого в IBM создано подразделение Watson solutions.
В отличие от шахмат, замкнутой в себе логической игры, Jeopardy — это состязание эрудитов, где игроки должны быстро отвечать на вопросы из разных областей человеческого знания. Соответственно необходимо привлекать значительные объемы внешней информации, что и реализовали разработчики системы. Во время игры компьютер Watson не был подключен к Интернету, но в его распоряжении имелось обширное собрание информационных ресурсов, как структурированных, так и неструктурированных. Это были энциклопедии, словари, тезаурусы, новостные сообщения, тексты литературных произведений, а также базы данных, таксономии и онтологии. В частности, Watson имел доступ к полному тексту английской Википедии, DBPedia (структурированной Википедии), WordNet (словарной базе данных для английского языка) и Yago (базе знаний, основанной на Википедии и связанной с WordNet). Для размещения всего контента потребовалось 4 терабайта дискового пространства.
Итак, Watson перерывает огромные массивы разнородной информации и в результате находит ответы на вопросы. Примерно это же делают и системы, нацеленные на обработку больших данных. Хотя информационные ресурсы, к которым Watson обращался в процессе игры, большими данными, строго говоря, не являются (объем велик, но темпы роста довольно скромные), система способна справиться и с постоянно прибывающим потоком информации. «Возможности Watson, — сказал в одном из интервью глава Watson solutions Маной Саксена, — принесут особенно много пользы в отраслях, интенсивно использующих информацию, таких как здравоохранение, государственное управление, телекоммуникации, финансовые услуги, — там, где все время увеличиваются объем и разнообразие информации».
Хотя название системы по происхождению не связано со спутником Шерлока Холмса доктором Ватсоном (она названа в честь Томаса Уотсона, основателя IBM), практическое применение Watson началось именно с медицины.
Первым клиентом, внедрившим у себя аналитику на базе Watson (в составе системы IBM Content and Predictive Analytics for Healthcare), стала техасская сеть медицинских учреждений Seton Healthcare Family. Основная задача, решать которую призван проект, — прогностический анализ для выявления основных причин (и возможностей предотвращения) повторных госпитализаций. В перспективе — улучшение диагностики и принятия решений по назначению лечения. Договор о совместной разработке соответствующих специализированных решений заключен между IBM и компанией WellPoint, которая занимается медицинским страхованием.
Центр аналитических решений IBM для здравоохранения (Health Analytics Solution Center) в середине прошлого года приступил к внедрению у себя ряда аналитических технологий, использованных в Watson. Планируется, что доступ к системе будет мобильным, причем с возможностью задать вопрос устно. Для анализа вопросов используются специализированная медицинская система распознавания речи от компании Nuance Communications (соглашение с ней заключено в начале 2011 г.) и система управления медицинской терминологией от компании Health Language. В работе участвуют также Медицинский центр при Колумбийском университете и Медицинская школа штата Мэриленд.
И в заключение — проект, относящийся к сфере образования. В Центре изучения потребительских предпочтений Йельской школы менеджмента прошлой весной появился учебный курс по работе с аналитическими технологиями. Курс ориентирован на решение практических задач, возникающих в бизнесе, из сферы маркетинга и других областей, а среди компьютерных инструментов, применяемых в ходе обучения, важное место занимает Watson как самая передовая на сегодня аналитическая система.