Runtime Speech Recognizer
Dokumentacja wtyczki Runtime Speech Recognizer.
- Pobierz na Fab
- Strona produktu
- Pobierz Demo (Windows)
- Samouczek wideo
- Wsparcie dla wtyczki & Rozwój na zamówienie: solutions@georgy.dev (spersonalizowane rozwiązania dla zespołów i organizacji)
Przegląd
Runtime Speech Recognizer Documentation
Jak korzystać z wtyczki
Wtyczka Runtime Speech Recognizer została zaprojektowana do rozpoznawania słów z przychodzących danych audio. Wykorzystuje nieco zmodyfikowaną wersję whisper.cpp do pracy z silnikiem. Aby użyć wtyczki, wykonaj następujące kroki:
Jak używać modeli językowych
Wybieranie, pobieranie i pakowanie modeli
Lista parametrów rozpoznawania
Te parametry można ustawić tylko wtedy, gdy rozpoznawanie nie jest uruchomione.
Obsługiwane języki
Oto pełna lista języków obsługiwanych przez dostępne modele językowe.
Rozpoznawanie komend
Obliczanie podobieństwa Levenshteina
Minimalizacja zamrożeń
Ten przewodnik omawia dwa powszechne źródła zamrożeń w pluginie RuntimeSpeechRecognizer i dostarcza praktyczne rozwiązania mające na celu złagodzenie wpływu na wydajność.
Rozwiązywanie problemów
Problemy z przygotowaniem modelu językowego
Projekt demonstracyjny
Spakowany projekt demonstracyjny dla Windows.
Jak poprawić wydajność
Wtyczka wykorzystuje różne metody akceleracji GPU w zależności od platformy