Audiogram - это сервис, оказывающий услуги по синтезу, распознаванию и клонированию речи.
Во время распознавания могут выполняться дополнительные действия:
-
анализ речи на предмет спуфинг-атаки (является ли речь настоящей или синтезированной);
-
определение пола, возраста и эмоционального настроя говорящего;
-
диаризация речи (разделение и группировка произнесенных реплик по участникам беседы);
-
и другие.
Документация:
Для синхронного распознавания речи:
Для асинхронного (отложенного) распознавания речи:
Для синтеза речи:
Для клонирования голоса:
Демо-клиенты: