Такова была тема семинара, который провели в середине апреля в Москве компании Intel (http://www.intel.ru) и CompTek (http://www.comptek.ru). Ее актуальность подтвердилась в ходе бурных обсуждений продуктов для синтеза и распознавания речи, их технологических особенностей, способов создания подобных прикладных систем, а также в процессе демонстрации возможностей систем преобразования «текст-речь» (RealSpeech) и распознавания речи (SpeechPearl) производства компании ScanSoft (http://www.scansoft.com).
Здесь следует подчеркнуть, что в настоящее время на рынке нет других продуктов, кроме SpeechPearl, которые поддерживают распознавание русского языка на основе естественных русских фонем (остальные используют для анализа русской речи фонемы других языков). Поддержка русской речи в системе RealSpeech будет реализована в коммерческой версии продукта в июле 2003 года.
Среди докладов и презентаций наиболее показательными оказались небольшие демонстрационные примеры решения различных прикладных задач: доступ к сервисной службе сети мобильной связи с возможностью изменения набора услуг (создан CompTek), продажа товаров по каталогу (система реализована фирмой Forte IT), справочная система для единой справочной службы воздушного транспорта «Сирена» (представил Институт проблем управления РАН). Кроме того, руководитель направления компьютерной телефонии CompTek Игорь Чиж продемонстрировал реальные возможности системы распознавания речи RealSpeech, установленной в службе заказа билетов компании American AirLines, попытавшись по телефону заказать билет «куда-нибудь». По мнению присутствующих, голос автоматизированной справочной мало отличим от естественного, а распознавание выполнялось достаточно корректно, несмотря на попытки демонстраторов предложить системе сходные по произношению и сложные по фонемам слова.
Система SpeechPearl наиболее эффективно работает совместно с голосовыми платами серии J или DM3 серии A, которые за счет предварительной обработки речевого сигнала и его специальной буферизации поддерживают непрерывную обработку речевого сигнала (Continuous Speech Processing, CSP). Главный функциональный «козырь» применения технологии CSP — возможность организовать диалог с системой, не дожидаясь окончания предложения или фразы, т. е. возможность перебивать систему (Barge-in), предлагая ей (как реальному собеседнику) ответить только на необходимые вопросы и не выслушивая все варианты ответа.
Кроме таких очевидных применений, как голосовые меню вместо донабора цифр, системы распознавания речи на базе SpeechPearl демонстрируют высокую эффективность при интеграции с CTI-системами и контакт-центрами, где они позволяют значительно сократить количество операторов и ускорить обработку вызовов. По сообщению представителя ScanSoft, в настоящее время система SpeechPearl интегрирована в Call Center компании Genesys и в некоторые CRM-системы. Коммерческих приложений в нашей стране пока нет, поскольку поддержка русской речи появилась в SpeechPearl только в декабре 2002 года.