Статья загружена 2010-08-13
Исследователи работают над тем, чтобы сделать системы распознавания речи более умными, с которыми можно было бы взаимодействовать.
Те кто ненавидит болтать с телефонными системами распознавания речи , могут утешиться тем, что ученые работают над тем, чтобы сделать подобные системы более одушевленными и менее раздражающими в использовании.
"Из опыта наших покупателей видно, что люди находят такие системы очень раздражающими", сказал Джеймс Аллен, председатель компьютерных наук в Рошестерском университете, выступая на конференции SpeechTEK 2010, проводимый в Нью Йорке на этой неделе.
Большинство компьютеризированных систем распознавания речи могут понимать до 98 процентов произносимой человеком речи, и все же людей раздржает использование автоматизированных телефонных служб технической поддержки. Возможно эти системы стали бы менее надоедливыми, если научить их более широко понимать язык, и сделать их интерактивными, сказал Аллен.
На данный же момент, многие службы технической поддержки большинства больших организаций используют компьютеризированные голосовые системы помощи. Пользователь звонит, и искусственный голос задает звонящему несколько вопросов. Большинство из этих систем основаны на конструкциях, которые представляют собой большие деревья возможных решений. С такими системами "люди находят не то что ищут, а следуют заранее определенному сценарию", сказал он.
Эти системы представляют собой комбинацию различных технологий. Одна из них - распознавание речи, или способность компьютера понимать, или же успешно перевести речь в текст.
Еще одна технология - обработчик естественного языка (natural language processing - NLP) - пытается либо преобразовать сообщение говорящего в команды которые может испольнить компьютер, либо отправляет суммарную информацию человеку оператору.
"Большие шаги были сделаны как в распознавании речи, так и в технологиях NLP в последние несколько десятилетий. Но как видно, они только принесли гнев и раздражение их пользователям. Я звоню в банк когда у меня проблема, и мне приходится сражаться с этой системой. И думаю про себя, что мне сделать, чтобы сразу попасть к оператору" - сказал Аллен.
Академическая исследовательская работа Аллена заключалась в нахождении путей, для того, чтобы мы могли "общаться с машинами так, как мы общаемся с людьми", сказал он.
Очень тяжело научить компьютер говорить и рассуждать как человек. Аллен указал на одну свою ранную работу, в которой он записал разговор в железнодорожной станции, человека подошедшему ко столу справок. Человек подходит к столу, и говорит "8:50 на Виндсор", и провожатый ему отвечает - "путь десятый, задержка на 20 минут". Между тем как провожатый точно знал, какую информацию хочет получить вопрошающий, компьютеризированная система посчитала бы, что утверждение (не вопрос), является здесь лишним.
Аллен полагает, что нынешним системам не хватает двух качеств: способность анализировать что говорит пользователь и способность беседовать с говорящим, для того, чтобы узнать что конкретно он хочет получить.