Runtime Speech Recognizer

Runtime Speech Recognizer プラグインのドキュメントです。

Fabで入手する
製品ウェブサイト
デモをダウンロード (Windows)
ビデオチュートリアル
プラグインサポート & カスタム開発: solutions@georgy.dev (チームや組織向けのカスタマイズされたソリューション)

📄️プラグインの使用方法

Runtime Speech Recognizer プラグインは、入力されるオーディオデータから単語を認識するように設計されています。エンジンで動作するために、whisper.cpp の若干修正されたバージョンを使用しています。プラグインを使用するには、以下の手順に従ってください：

📄️フリーズの最小化

このガイドでは、RuntimeSpeechRecognizerプラグインにおけるフリーズの一般的な原因を2つ取り上げ、そのパフォーマンスへの影響を軽減するための実用的な解決策を提供します。

このプラグインは、プラットフォームに応じて異なるGPUアクセラレーション手法を使用します。WindowsとLinuxではVulkan、MacとiOSプラットフォームではMetalを使用し、認識プロセスを大幅に高速化します。その他のプラットフォームでは、CPU + 組み込み関数によるアクセラレーションを使用します。ただし、以下の推奨事項に従うことで、プラグインのパフォーマンスをさらに向上させることができます：

Runtime Speech Recognizer

📄️概要

📄️プラグインの使用方法

📄️言語モデルの使用方法

📄️認識パラメータ一覧

📄️対応言語

📄️コマンド認識

📄️フリーズの最小化

📄️トラブルシューティング

📄️デモプロジェクト

📄️パフォーマンスを向上させる方法