Runtime Speech Recognizer

Dokumentacja wtyczki Runtime Speech Recognizer.

Pobierz na Fab
Strona produktu
Pobierz Demo (Windows)
Samouczek wideo
Wsparcie wtyczki & Rozwój na zamówienie: solutions@georgy.dev (spersonalizowane rozwiązania dla zespołów i organizacji)

Wtyczka Runtime Speech Recognizer została zaprojektowana do rozpoznawania słów z przychodzących danych audio. Wykorzystuje nieco zmodyfikowaną wersję whisper.cpp do pracy z silnikiem. Aby użyć wtyczki, wykonaj następujące kroki:

📄️Jak używać modeli językowych

Wybieranie, pobieranie i pakowanie modeli

📄️Lista parametrów rozpoznawania

Te parametry można ustawić tylko wtedy, gdy rozpoznawanie nie jest uruchomione.

📄️Obsługiwane języki

Oto pełna lista języków obsługiwanych przez dostępne modele językowe.

📄️Rozpoznawanie komend

Obliczanie podobieństwa Levenshteina

📄️Minimalizacja zamrożeń

Ten przewodnik omawia dwa powszechne źródła zamrożeń w pluginie RuntimeSpeechRecognizer i dostarcza praktyczne rozwiązania mające na celu złagodzenie wpływu na wydajność.