Runtime Speech Recognizer
Documentação para o plugin Runtime Speech Recognizer.
- Obtenha no Fab
- Site do produto
- Baixar Demo (Windows)
- Tutorial em vídeo
- Suporte do Plugin & Desenvolvimento Personalizado: solutions@georgy.dev (soluções sob medida para equipes e organizações)
Visão Geral
Documentação do Runtime Speech Recognizer
Como usar o plugin
O plugin Runtime Speech Recognizer é projetado para reconhecer palavras a partir de dados de áudio recebidos. Ele usa uma versão ligeiramente modificada do whisper.cpp para funcionar com o motor. Para usar o plugin, siga estes passos:
Como usar modelos de linguagem
Selecionando, baixando e empacotando modelos
Lista de parâmetros de reconhecimento
Estes parâmetros só podem ser definidos enquanto o reconhecedor não está em execução.
Idiomas suportados
Esta é a lista completa de idiomas suportados pelos modelos de linguagem disponíveis.
Reconhecimento de comandos
Calcular Similaridade de Levenshtein
Minimizando congelamentos
Este guia aborda duas fontes comuns de congelamento no plugin RuntimeSpeechRecognizer e fornece soluções práticas para mitigar o impacto no desempenho.
Solução de Problemas
Problemas de Preparação do Modelo de Linguagem
Projeto de demonstração
Projeto de Demonstração Empacotado para Windows.
Como melhorar o desempenho
O plugin utiliza diferentes métodos de aceleração por GPU dependendo da plataforma