Случайная новость из Архива Навигатор, понимающий естественную речь
26.02.2014
Компания Fujitsu Ten разработала прототип системы, при помощи которой водитель может управлять навигационными функциями, используя обычную разговорную речь, не строя фразы особым образом.
Система распознавания речи IVRCNU от производителя автонавигаторов марки Eclipse, компании Fujitsu Ten, предназначена для установки в транспортные средства. Устройство, понимающее естественную речь, способно обеспечить интуитивное взаимодействие между водителем и автомобилем.
Система способна понимать намерения водителя, основываясь на ключевых фразах или словах, даже если не была дана точная команда. К примеру, интеллектуальный помощник правильно истолкует намерения человека, если тот скажет: "Найди мне китайский ресторан где-нибудь поблизости" или "Какая будет погода завтра утром?".
Все речевые запросы, получаемые IVRCNU через микрофон, отправляются на сервер, с которым система устанавливает связь посредством мобильного приложения и интернет-соединения. Далее в удаленном центре обработки голосовая команда очищается от шумов, после чего распознаются отдельные фразы и слова, которые сопоставляются с большой словарной базой. Затем информация попадает в систему логического вывода, в которой осуществляется семантический анализ произнесенной фразы. Только после этого формируется голосовой ответ для пользователя, а на экране мультимедийной системы выводятся данные, наиболее релевантные заданному вопросу.
Используя систему, водитель может задавать маршруты в навигаторе, узнавать погодные сводки, набирать номер абонента из памяти подключенного телефона, управлять мультимедийным контентом, и т.д. Значительная часть этих функций (к примеру, набор SMS и отправка почты голосом) уже реализована в современных автомобилях, но при этом речевое управление ограничивается набором из ограниченного числа команд на английском языке, которые, к тому же, могут плохо распознаваться, если произношение водителя далеко от эталонного.
Своей целью Fujitsu Ten видит создание технологии, которая позволит интерпретировать естественную слитную речь человека, управляя различными функциями машины (выйдя при этом за рамки развлечений, музыки и социальных сетей), попросту разговаривая с ним в самой обычной манере. На сегодняшний день IVRCNU умеет поддерживать разговор лишь на английском языке.
Fujitsu Ten уточняет, что в ее разработке применены технологии синтеза речи и распознавания голоса от сторонних разработчиков, в том числе фирм iNAGO и Nuance Communications. Fujitsu Ten покажет прототип системы на выставке Mobile World Congress 2014, которая состоится в Барселоне в конце февраля.
|