Runtime Speech Recognizer
Runtime Speech Recognizer 플러그인에 대한 문서입니다.
- Fab에서 구입하기
- 제품 웹사이트
- 데모 다운로드 (Windows)
- 비디오 튜토리얼
- 플러그인 지원 및 맞춤형 개발: solutions@georgy.dev (팀 및 조직을 위한 맞춤형 솔루션)
Join our Discord
online · support
개요
Runtime Speech Recognizer 문서
플러그인 사용 방법
Runtime Speech Recognizer 플러그인은 들어오는 오디오 데이터에서 단어를 인식하도록 설계되었습니다. 엔진과 함께 작동하기 위해 약간 수정된 whisper.cpp 버전을 사용합니다. 플러그인을 사용하려면 다음 단계를 따르세요:
언어 모델 사용 방법
모델 선택, 다운로드 및 패키징
인식 매개변수 목록
이 매개변수들은 인식기가 실행 중이지 않을 때만 설정할 수 있습니다.
지원 언어
이것은 사용 가능한 언어 모델에서 지원하는 전체 언어 목록입니다.
명령어 인식
Levenshtein 유사도 계산
멈춤 최소화
이 가이드는 RuntimeSpeechRecognizer 플러그인에서 발생하는 두 가지 일반적인 멈춤 현상에 대한 솔루션을 제시하여 성능 영향을 줄이는 방법을 설명합니다.
문제 해결
언어 모델 스테이징 문제
데모 프로젝트
윈도우용 패키지 데모 프로젝트.
성능 향상 방법
이 플러그인은 플랫폼에 따라 다른 GPU 가속 방법을 사용합니다