Runtime Speech Recognizer
Documentazione per il plugin Runtime Speech Recognizer.
- Acquistalo su Fab
- Sito web del prodotto
- Scarica la Demo (Windows)
- Video tutorial
- Supporto Plugin & Sviluppo Personalizzato: solutions@georgy.dev (soluzioni su misura per team e organizzazioni)
Panoramica
Documentazione di Runtime Speech Recognizer
Come utilizzare il plugin
Il plugin Runtime Speech Recognizer è progettato per riconoscere parole dai dati audio in ingresso. Utilizza una versione leggermente modificata di whisper.cpp per funzionare con il motore. Per utilizzare il plugin, segui questi passaggi:
Come utilizzare i modelli linguistici
Selezione, download e impacchettamento dei modelli
Lista dei parametri di riconoscimento
Questi parametri possono essere impostati solo mentre il riconoscitore non è in esecuzione.
Lingue supportate
Questo è l'elenco completo delle lingue supportate dai modelli linguistici disponibili.
Riconoscimento dei comandi
Calcola la somiglianza di Levenshtein
Minimizzare i blocchi
Questa guida affronta due comuni fonti di blocchi nel plugin RuntimeSpeechRecognizer e fornisce soluzioni pratiche per mitigare l'impatto sulle prestazioni.
Risoluzione dei problemi
Problemi di staging del modello linguistico
Progetto Demo
Progetto Demo Impacchettato per Windows.
Come migliorare le prestazioni
Il plugin utilizza diversi metodi di accelerazione GPU a seconda della piattaforma