Runtime Speech Recognizer

Documentation du plugin Runtime Speech Recognizer.

Obtenez-le sur Fab
Site web du produit
Télécharger la démo (Windows)
Tutoriel vidéo
Support du plugin & Développement sur mesure : solutions@georgy.dev (solutions adaptées pour les équipes et organisations)

Le plugin Runtime Speech Recognizer est conçu pour reconnaître les mots à partir des données audio entrantes. Il utilise une version légèrement modifiée de whisper.cpp pour fonctionner avec le moteur. Pour utiliser le plugin, suivez ces étapes :

📄️Comment utiliser les modèles de langage

Sélection, téléchargement et empaquetage des modèles

📄️Liste des paramètres de reconnaissance

Ces paramètres ne peuvent être définis que lorsque le reconnaisseur n'est pas en cours d'exécution.

📄️Langues prises en charge

Voici la liste complète des langues prises en charge par les modèles de langage disponibles.

📄️Reconnaissance des commandes

Calculer la similarité de Levenshtein

📄️Minimiser les gels

Ce guide aborde deux sources courantes de gels dans le plugin RuntimeSpeechRecognizer et propose des solutions pratiques pour atténuer leur impact sur les performances.