Новости
SberDevices представила семейство ИИ-моделей для распознавания речи и эмоций
Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices анонсировали семейство акустических ИИ-моделей для русского языка, которые умеют распознавать речь и эмоции.
В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.
- Технология GigaAM предобучена на разнообразной русской речи (набор данных из 50 тысяч часов речи). Ее можно использовать для адаптации под различные задачи работы со звуком, включая распознавание речи и эмоций, определение диктора.
- GigaAM-CTC – модель для распознавания русскоязычных запросов.
- А GigaAM-Emo – акустическая модель для определения эмоций.
Модели размещены в открытом доступе. Их можно использовать для подготовки дипломных работ и научных статей по некоммерческой лицензии.
Улучшенные версии моделей доступны на платформе SaluteSpeech API, чтобы бизнес мог, например, автоматизировать колл-центры, и в приложении SaluteSpeech App. Модели можно также использовать в повседневной жизни: например, распознать запись совещания или лекции в вузе.
Напомним, OpenAI открыла доступ к ChatGPT без регистрации.