Runtime Speech Recognizer
Documentación para el plugin Runtime Speech Recognizer.
- Consíguelo en Fab
- Sitio web del producto
- Descargar Demo (Windows)
- Tutorial en video
- Soporte del Plugin & Desarrollo Personalizado: solutions@georgy.dev (soluciones a medida para equipos y organizaciones)
Descripción general
Documentación de Runtime Speech Recognizer
Cómo usar el plugin
El plugin Runtime Speech Recognizer está diseñado para reconocer palabras a partir de datos de audio entrantes. Utiliza una versión ligeramente modificada de whisper.cpp para funcionar con el motor. Para usar el plugin, sigue estos pasos:
Cómo usar modelos de lenguaje
Seleccionar, descargar y empaquetar modelos
Lista de parámetros de reconocimiento
Estos parámetros solo se pueden configurar mientras el reconocedor no está en ejecución.
Idiomas admitidos
Esta es la lista completa de idiomas admitidos por los modelos de lenguaje disponibles.
Reconocimiento de comandos
Calcular Similitud de Levenshtein
Minimizar congelamientos
Esta guía aborda dos fuentes comunes de congelamiento en el plugin RuntimeSpeechRecognizer y proporciona soluciones prácticas para mitigar el impacto en el rendimiento.
Solución de problemas
Problemas de preparación del modelo de lenguaje
Proyecto de demostración
Proyecto de demostración empaquetado para Windows.
Cómo mejorar el rendimiento
El complemento utiliza diferentes métodos de aceleración por GPU según la plataforma