メインコンテンツまでスキップ

言語モデルの使用方法

モデルの選択、ダウンロード、パッケージ化

現在、プラグインは単一の言語モデルをサポートするように設計されており、エディタで事前に選択されたモデルがプロジェクトと共にパッケージ化されて使用されます。特定の言語モデルを選択、ダウンロード、ステージングするには、以下の手順に従ってください:

  1. 利用可能なオプションから目的のモデルを選択します。プラグインは以下のモデルをすぐにサポートしています:

    標準モデル:

    • Tiny
    • Base
    • Small
    • Medium
    • Large V1
    • Large V2
    • Large V3
    • Large V3 Turbo

    量子化モデル (ファイルサイズ削減版):

    • Tiny Quantized (Q5_1) - 5ビット、小数点以下1桁への量子化
    • Tiny Quantized (Q8_0) - 8ビット、小数点以下0桁への量子化
    • Base Quantized (Q5_1) - 5ビット、小数点以下1桁への量子化
    • Small Quantized (Q5_1) - 5ビット、小数点以下1桁への量子化
    • Medium Quantized (Q5_0) - 5ビット、小数点以下0桁への量子化
    • Large V2 Quantized (Q5_0) - 5ビット、小数点以下0桁への量子化
    • Large V3 Quantized (Q5_0) - 5ビット、小数点以下0桁への量子化
    • Large V3 Turbo Quantized (Q5_0) - 5ビット、小数点以下0桁への量子化

    蒸留モデル:

    • Distil Small - Smallモデルの蒸留版
    • Distil Medium - Mediumモデルの蒸留版
    • Distil Large V2 - Large V2モデルの蒸留版
    • Distil Large V3 - Large V3モデルの蒸留版

    カスタムモデル:

    • Custom - カスタムモデル名とURLを指定して、サーバーから独自の言語モデルをダウンロード

    各モデル(Customを除く)は、多言語または英語のみのいずれかとして設定できます。

  2. Setup Language Model ボタンをクリックします。これにより、選択した言語モデルがローカルマシンにまだ存在しない場合、自動的にダウンロードするよう求められます。

  3. ダウンロードが完了すると、エディタは "Plugins/RuntimeSpeechRecognizer/Content/LanguageModels/LanguageModel.uasset" に言語モデルアセットを生成します。この言語モデルアセットのみがプロジェクトと共にパッケージ化されます。

Clear Language Models ボタンをクリックすることで、ローカルにダウンロードされた言語モデルを削除することもできます。

別の方法として、https://huggingface.co/ggerganov/whisper.cpp からのみ言語モデルを手動でダウンロードし、"Plugins/RuntimeSpeechRecognizer/Content" フォルダに配置することもできます。

選択された言語モデルのみがプロジェクトと共にパッケージ化されることに注意してください。したがって、他のモデルについては心配する必要はありません。それらはパッケージング段階で除外されます。