Runtime Speech Recognizer
Documentation pour le plugin Runtime Speech Recognizer.
- Obtenez-le sur Fab
- Site web du produit
- Télécharger la démo (Windows)
- Tutoriel vidéo
- Support du plugin & Développement sur mesure : solutions@georgy.dev (solutions adaptées pour les équipes et organisations)
Vue d'ensemble
Runtime Speech Recognizer Documentation
Comment utiliser le plugin
Le plugin Runtime Speech Recognizer est conçu pour reconnaître les mots à partir des données audio entrantes. Il utilise une version légèrement modifiée de whisper.cpp pour fonctionner avec le moteur. Pour utiliser le plugin, suivez ces étapes :
Comment utiliser les modèles de langage
Sélection, téléchargement et empaquetage des modèles
Liste des paramètres de reconnaissance
Ces paramètres ne peuvent être définis que lorsque le reconnaisseur n'est pas en cours d'exécution.
Langues prises en charge
Voici la liste complète des langues prises en charge par les modèles de langage disponibles.
Reconnaissance des commandes
Calculer la similarité de Levenshtein
Minimiser les gels
Ce guide aborde deux sources courantes de gels dans le plugin RuntimeSpeechRecognizer et propose des solutions pratiques pour atténuer leur impact sur les performances.
Dépannage
Problèmes de mise en scène du modèle de langage
Projet de démonstration
Projet de démonstration empaqueté pour Windows.
Comment améliorer les performances
Le plugin utilise différentes méthodes d'accélération GPU selon la plateforme