Skip to content

mts-ai/audiogram

Repository files navigation

Audiogram

Audiogram - это сервис, оказывающий услуги по синтезу, распознаванию и клонированию речи.

Во время распознавания могут выполняться дополнительные действия:

  • анализ речи на предмет спуфинг-атаки (является ли речь настоящей или синтезированной);

  • определение пола, возраста и эмоционального настроя говорящего;

  • диаризация речи (разделение и группировка произнесенных реплик по участникам беседы);

  • и другие.

В данном репозитории хранятся:

Документация:

Для синхронного распознавания речи:

Для асинхронного (отложенного) распознавания речи:

Для синтеза речи:

Для клонирования голоса:

Демо-клиенты:

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •