Runtime Speech Recognizer

Документация для плагина Runtime Speech Recognizer.

Получить на Fab
Веб-сайт продукта
Скачать демо (Windows)
Видеоурок
Поддержка плагина и индивидуальная разработка: solutions@georgy.dev (индивидуальные решения для команд и организаций)

Плагин Runtime Speech Recognizer предназначен для распознавания слов из входящих аудиоданных. Он использует слегка модифицированную версию whisper.cpp для работы с движком. Чтобы использовать плагин, выполните следующие шаги:

📄️Как использовать языковые модели

Выбор, загрузка и упаковка моделей

📄️Список параметров распознавания

Эти параметры можно установить только когда распознаватель не работает.

📄️Поддерживаемые языки

Это полный список языков, поддерживаемых доступными языковыми моделями.

📄️Распознавание команд

Вычисление сходства по Левенштейну

📄️Минимизация зависаний

Этот гид рассматривает два распространенных источника зависаний в плагине RuntimeSpeechRecognizer и предлагает практические решения для снижения воздействия на производительность.