Runtime Speech Recognizer
Runtime Speech Recognizer プラグインのドキュメントです。
- Fabで入手する
- 製品ウェブサイト
- デモをダウンロード (Windows)
- ビデオチュートリアル
- プラグインサポート & カスタム開発: solutions@georgy.dev (チームや組織向けのカスタマイズされたソリューション)
Join our Discord
online · support
概要
Runtime Speech Recognizer ドキュメント
プラグインの使用方法
Runtime Speech Recognizer プラグインは、入力されるオーディオデータから単語を認識するように設計されています。エンジンで動作するために、whisper.cpp の若干修正されたバージョンを使用しています。プラグインを使用するには、以下の手順に従ってください:
言語モデルの使用方法
モデルの選択、ダウンロード、パッケージ化
認識パラメータ一覧
これらのパラメータは、認識器が実行中でない場合にのみ設定できます。
対応言語
これは利用可能な言語モデルでサポートされている完全な言語リストです。
コマンド認識
レーベンシュタイン類似度の計算
フリーズの最小化
このガイドでは、RuntimeSpeechRecognizerプラグインにおけるフリーズの一般的な原因を2つ取り上げ、そのパフォーマンスへの影響を軽減するための実用的な解決策を提供します。
トラブルシューティング
言語モデルのステージングに関する問題
デモプロジェクト
Windows用パッケージデモプロジェクト.
パフォーマンスを向上させる方法
このプラグインは、プラットフォームに応じて異なるGPUアクセラレーション手法を使用します。WindowsとLinuxではVulkan、MacとiOSプラットフォームではMetalを使用し、認識プロセスを大幅に高速化します。その他のプラットフォームでは、CPU + 組み込み関数によるアクセラレーションを使用します。ただし、以下の推奨事項に従うことで、プラグインのパフォーマンスをさらに向上させることができます: