Перейти к основному содержанию
Технологии
пт, 17.11.2023 - 17:36
17.11.23 17:36

Приложение SaluteSpeech

Приложение SaluteSpeech

Приложение SaluteSpeech

Фото
открытый источник

Сбер представил новое приложение SaluteSpeech, которое предоставляет удобные инструменты для работы с текстом и речью. В приложении доступны две основные функции: распознавание и синтезирование.

Функция распознавания позволяет пользователям преобразовывать речь из аудиозаписей в текстовый формат. Программа автоматически расшифровывает речь и представляет ее в удобном виде. Это может быть полезно для транскрибирования встреч, лекций или интервью.

Функция синтезирования позволяет озвучивать текст с возможностью настройки пауз и ударений. Пользователи могут выбирать из семи доступных голосов на русском и английском языках, чтобы создавать качественные аудиозаписи синтезированной речи.

SaluteSpeech поддерживает различные форматы аудиофайлов, включая pcm, opus, mp3, flac, alaw и mulaw. Это обеспечивает гибкость при работе с различными типами аудиозаписей.

Одной из интересных особенностей приложения является встроенный GigaChat API. Пользователи могут загружать короткие тезисы, из которых искусственный интеллект подготовит текст для озвучивания. Это удобно для создания кратких аудиозаписей или подготовки выжимок из готового текста.

Приложение SaluteSpeech доступно бесплатно, но для начала работы необходимо подключить платный сервис SaluteSpeech. Минимальная стоимость за месяц использования составляет 600 рублей. Однако также доступен бесплатный тариф Freemium для физических лиц, который предоставляет ограниченное количество минут распознавания и символов синтеза в месяц.