Голосовое управление различными устройствами реализуется сравнительно давно, но серьезных прорывов в этом направлении пока нет. Конечно, технологии распознавания речи постоянно развиваются и совершенствуются, но до идеала еще очень далеко.
Разработав алгоритм, с помощью которого машина научится максимально точно понимать человека, можно применить его и получить, по истине, фантастические результаты. Голосовые команды перестанут быть шаблонными, а голосовые ассистенты, аналогичные тем, которые предлагаются сейчас на крупнейших программных платформах, станут в разы умнее и адекватнее.
Компания Microsoft известна, как программный гигант, работающий на множестве интересных направлений. Распознавание речи применяется в голосовом помощнике Кортана, используемом в мобильных устройствах, выпускаемых этой компанией. Вероятно, скоро он станет еще умнее – Microsoft научила программу, с достаточной для практического применения точностью, распознавать человеческую речь.
Подробности о новой технологии Microsoft
Как сообщили источники, имеющие непосредственное отношение к компании, точность расшифровки речи достигла уровня, профессиональных операторов, «набивающих» тексты под диктовку или 5,9%. Microsoft применила новые подходы и принципы, поставив во главу угла нейронные модели языка.
Но этот успех не является окончательным – программный гигант не собирается останавливаться на достигнутом. Предполагается доработка технологии в условиях реальной жизни, ведь акценты и выговоры людей, произносящих одни и те же связи, могут восприниматься системой по-разному. Второй аспект, которому будет уделено внимание разработчиков, заключается в «доведении до ума» Кортаны, что не может не радовать пользователей устройств на Виндовс.