Runtime Speech Recognizer

Documentação para o plugin Runtime Speech Recognizer.

Obtenha no Fab
Site do produto
Baixar Demo (Windows)
Tutorial em vídeo
Suporte do Plugin & Desenvolvimento Personalizado: solutions@georgy.dev (soluções sob medida para equipes e organizações)

📄️Visão Geral

Documentação do Runtime Speech Recognizer

O plugin Runtime Speech Recognizer é projetado para reconhecer palavras a partir de dados de áudio recebidos. Ele usa uma versão ligeiramente modificada do whisper.cpp para funcionar com o motor. Para usar o plugin, siga estes passos:

📄️Como usar modelos de linguagem

Selecionando, baixando e empacotando modelos

📄️Lista de parâmetros de reconhecimento

Estes parâmetros só podem ser definidos enquanto o reconhecedor não está em execução.

📄️Idiomas suportados

Esta é a lista completa de idiomas suportados pelos modelos de linguagem disponíveis.

📄️Reconhecimento de comandos

Calcular Similaridade de Levenshtein

📄️Minimizando congelamentos

Este guia aborda duas fontes comuns de congelamento no plugin RuntimeSpeechRecognizer e fornece soluções práticas para mitigar o impacto no desempenho.

📄️Solução de Problemas

Problemas de Preparação do Modelo de Linguagem

📄️Projeto de demonstração

Projeto de Demonstração Empacotado para Windows.

📄️Como melhorar o desempenho

O plugin utiliza diferentes métodos de aceleração por GPU dependendo da plataforma