Skip to content

Latest commit

 

History

History
45 lines (23 loc) · 4.07 KB

File metadata and controls

45 lines (23 loc) · 4.07 KB

Audiogram

Audiogram - это сервис, оказывающий услуги по синтезу, распознаванию и клонированию речи.

Во время распознавания могут выполняться дополнительные действия:

  • анализ речи на предмет спуфинг-атаки (является ли речь настоящей или синтезированной);

  • определение пола, возраста и эмоционального настроя говорящего;

  • диаризация речи (разделение и группировка произнесенных реплик по участникам беседы);

  • и другие.

В данном репозитории хранятся:

Документация:

Для синхронного распознавания речи:

Для асинхронного (отложенного) распознавания речи:

Для синтеза речи:

Для клонирования голоса:

Демо-клиенты: