Runtime Speech Recognizer
Документация для плагина Runtime Speech Recognizer.
- Получить на Fab
- Веб-сайт продукта
- Скачать демо (Windows)
- Видеоурок
- Поддержка плагина и индивидуальная разработка: solutions@georgy.dev (индивидуальные решения для команд и организаций)
Обзор
Runtime Speech Recognizer Documentation
Как использовать плагин
Плагин Runtime Speech Recognizer предназначен для распознавания слов из входящих аудиоданных. Он использует слегка модифицированную версию whisper.cpp для работы с движком. Чтобы использовать плагин, выполните следующие шаги:
Как использовать языковые модели
Выбор, загрузка и упаковка моделей
Список параметров распознавания
Эти параметры можно установить только когда распознаватель не работает.
Поддерживаемые языки
Это полный список языков, поддерживаемых доступными языковыми моделями.
Распознавание команд
Вычисление сходства по Левенштейну
Минимизация зависаний
Этот гид рассматривает два распространенных источника зависаний в плагине RuntimeSpeechRecognizer и предлагает практические решения для снижения воздействия на производительность.
Устранение неполадок
Проблемы с подготовкой языковой модели
Демонстрационный проект
Упакованный демонстрационный проект для Windows.
Как улучшить производительность
Плагин использует различные методы ускорения на GPU в зависимости от платформы