Новости

SberDevices представила семейство ИИ-моделей для распознавания речи и эмоций

Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices анонсировали семейство акустических ИИ-моделей для русского языка, которые умеют распознавать речь и эмоции.

В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.

  • Технология GigaAM предобучена на разнообразной русской речи (набор данных из 50 тысяч часов речи). Ее можно использовать для адаптации под различные задачи работы со звуком, включая распознавание речи и эмоций, определение диктора.
  • GigaAM-CTC – модель для распознавания русскоязычных запросов.
  • А GigaAM-Emo – акустическая модель для определения эмоций.

Модели размещены в открытом доступе. Их можно использовать для подготовки дипломных работ и научных статей по некоммерческой лицензии.

Улучшенные версии моделей доступны на платформе SaluteSpeech API, чтобы бизнес мог, например, автоматизировать колл-центры, и в приложении SaluteSpeech App. Модели можно также использовать в повседневной жизни: например, распознать запись совещания или лекции в вузе.

Напомним, OpenAI открыла доступ к ChatGPT без регистрации.

Теги

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть
Закрыть