Речевые технологии

Технологии распознавания и синтеза человеческой речи используются для голосового управления различными функциями автомобиля, услугами, а также управления автономными автомобилями в перспективе.

Технологии распознавания речи существуют еще с середины 60-х годов минувшего века, говорится в материалах компании Forbes Media. Однако лишь несколько лет назад машинное преобразование речи в текст и аудиоответы пользователям были полноценно поставлены на коммерческий поток. Рывок в развитии речевых технологий произошел за счет того, что стоимость вычислительных ресурсов за последние несколько лет сильно упала, стало экономически выгодно создавать большие нейронные сети и обрабатывать с их помощью массивы данных для решения различных задач. Сегодня существует развитый рынок автоматической обработки речи. На нем развиваются и B2C-технологии виртуальных ассистентов, и B2B-решения распознавания речи.

Технологии распознавания речи сегодня используется и в автомобильной промышленности. Самое примитивное - уже привычные нам навигаторы. Технологии сегодняшнего дня - это голосовое управление различными функциями автомобиля, и это доступно не только в автомобилях класса люкс. Большие успехи делает Ford, оснащая свои машины возможностями для голосового управления навигационной или мультимедийной системами. Технологии скорого будущего - беспилотные автомобили, которыми можно управлять, задавая маршрут как с помощью компьютера, так и голосом. Автономные автомобили Google, электромобиль Tesla, автомобили-роботы MIG (Made in Germany), AKTIV, VisLab, автомобиль из Брауншвейга, получивший имя Leonie - все они предполагают использование искусственного интеллекта и голосового управления.

Несмотря на то, что на российском рынке речевых технологий представлено сразу несколько российских компаний-разработчиков, предлагающих готовые продукты, научно-технический задел в области речевых технологий для применения автомобиле сформирован незначительно и имеет смысл упомянуть только один из проектов.

Одним из приоритетных направлений работы одного из подразделений российской компании Яндекс является автопром. По информации интернет-портала "Роем" речь идет про создание продукта для голосового управления системами автомобиля, такими как: навигация, музыка и радио, климатконтроль, а также голосовое управление месседжерами, почтой и звонками. В авто также актуальны, голосовой поиск информации с озвучиванием найденных ответов, и конечно чтение новостей. Яндекс уже подписал соглашение с КамАЗом, работает с Toyota и Honda. Основные модели монетизации речевых технологий "Яндекса": продажа лицензий на продукт и предоставление речевых технологий в виде облачного сервиса с оплатой за фактическое количество обработанных запросов, а также возможностью покупать пакеты запросов по более привлекательной цене. В целом по прогнозу компании, в перспективе ближайших лет мировой рынок речевых технологий превысит $10 млрд, в Российской Федерации рынок только формируется.