Нейротехнологии и Искусственный интеллект (ИИ)/Распознавание и синтез речи

Материал из CDTOwiki
Перейти к: навигация, поиск

dt2i_ai_3.png Распознавание и синтез речи Использование компьютерного оборудования и программных технологий для идентификации и обработки человеческого голоса, а также для искусственное моделирование речи человека 300 Цифровые сквозные технологии Средняя Полезно IT/soft Да Инфраструктура и инструменты (раздел) Цифровые технологии (раздел) Производные понятия (раздел) Межотраслевое (раздел) Искусственный интеллект (раздел) Технологические решения (раздел) 4 Нейротехнологии и Искусственный интеллект (ИИ)/Распознавание и синтез речи

Распознавание и синтез речи
Использование компьютерного оборудования и программных технологий для идентификации и обработки человеческого голоса, а также для искусственное моделирование речи человека
Сегмент
IT/softIT/soft
Рекомендовано
ПолезноПолезно
Сложность
СредняяСредняя
Направление исследований
 

Распознавание речи - использование компьютерного оборудования и программных технологий для идентификации и обработки человеческого голоса. Он в основном используется для преобразования произнесенных слов в компьютерный текст. Кроме того, автоматическое распознавание речи используется для аутентификации пользователей с помощью их голоса и выполнения действий на основе инструкций, определенных человеком. (Techopedia)

Как работает распознавание речи?

Синтез речи - это искусственное моделирование речи человека с помощью компьютера или другого устройства. В отличие от распознавания голоса, синтез речи в основном используется для перевода текстовой информации в аудиоинформацию и в приложениях, таких как службы с поддержкой голоса и мобильные приложения. Помимо этого, он также используется в вспомогательных технологиях для помощи людям с нарушениями зрения в чтении текстового контента. (Techopedia)

Как работает синтез речи?

Обычные приложения сегодня включают устройства громкой связи, программное обеспечение для диктовки и виртуальные помощники, такие как Siri и Alexa. Многие компании предлагают голосовые услуги центра обработки вызовов для более эффективной обработки вызовов. Распознавание речи также помогает повысить безопасность вождения за счет использования голосовых навигационных систем и возможностей поиска для автомобильных мультимедиа. (IBM)

Примеры разработчиков и решений в рамках суб-СЦТ «Распознавание и синтез речи»:

  • Алиса/Yandex.SpeechKit — Голосовой помощник от компании «Яндекс», умеет распознавать речь человека, вести простые разговоры, управлять большим количеством ПО. Yandex.SpeechKit – набор инструментов для распознавания и синтезирования речи, позволяющий сторонним разработчикам создавать свои приложения.
  • Продукты от компании ЦРТ – различные продукты, позволяющие распознавать речь и звуки, производить автоматическое обслуживание клиентов и другие функции.

Дополнительные материалы

Дата последней редакции 27 мая 20202020/05/27