Runtime Speech Recognizer

Documentazione per il plugin Runtime Speech Recognizer.

Acquistalo su Fab
Sito web del prodotto
Scarica la Demo (Windows)
Video tutorial
Supporto Plugin & Sviluppo Personalizzato: solutions@georgy.dev (soluzioni su misura per team e organizzazioni)

📄️Panoramica

Documentazione di Runtime Speech Recognizer

Il plugin Runtime Speech Recognizer è progettato per riconoscere parole dai dati audio in ingresso. Utilizza una versione leggermente modificata di whisper.cpp per funzionare con il motore. Per utilizzare il plugin, segui questi passaggi:

📄️Come utilizzare i modelli linguistici

Selezione, download e impacchettamento dei modelli

📄️Lista dei parametri di riconoscimento

Questi parametri possono essere impostati solo mentre il riconoscitore non è in esecuzione.

📄️Lingue supportate

Questo è l'elenco completo delle lingue supportate dai modelli linguistici disponibili.

📄️Riconoscimento dei comandi

Calcola la somiglianza di Levenshtein

📄️Minimizzare i blocchi

Questa guida affronta due comuni fonti di blocchi nel plugin RuntimeSpeechRecognizer e fornisce soluzioni pratiche per mitigare l'impatto sulle prestazioni.

📄️Risoluzione dei problemi

Problemi di staging del modello linguistico

📄️Progetto Demo

Progetto Demo Impacchettato per Windows.

📄️Come migliorare le prestazioni

Il plugin utilizza diversi metodi di accelerazione GPU a seconda della piattaforma