Runtime Speech Recognizer

Documentación para el plugin Runtime Speech Recognizer.

Consíguelo en Fab
Sitio web del producto
Descargar Demo (Windows)
Tutorial en video
Soporte del Plugin & Desarrollo Personalizado: solutions@georgy.dev (soluciones a medida para equipos y organizaciones)

📄️Descripción general

Documentación de Runtime Speech Recognizer

El plugin Runtime Speech Recognizer está diseñado para reconocer palabras a partir de datos de audio entrantes. Utiliza una versión ligeramente modificada de whisper.cpp para funcionar con el motor. Para usar el plugin, sigue estos pasos:

📄️Cómo usar modelos de lenguaje

Seleccionar, descargar y empaquetar modelos

📄️Lista de parámetros de reconocimiento

Estos parámetros solo se pueden configurar mientras el reconocedor no está en ejecución.

📄️Idiomas admitidos

Esta es la lista completa de idiomas admitidos por los modelos de lenguaje disponibles.

📄️Reconocimiento de comandos

Calcular Similitud de Levenshtein

📄️Minimizar congelamientos

Esta guía aborda dos fuentes comunes de congelamiento en el plugin RuntimeSpeechRecognizer y proporciona soluciones prácticas para mitigar el impacto en el rendimiento.

📄️Solución de problemas

Problemas de preparación del modelo de lenguaje

📄️Proyecto de demostración

Proyecto de demostración empaquetado para Windows.

📄️Cómo mejorar el rendimiento

El complemento utiliza diferentes métodos de aceleración por GPU según la plataforma