Как использовать языковые модели
Выбор, загрузка и упаковка моделей
В настоящее время плагин предназначен для поддержки одной языковой модели, выбранной заранее в редакторе, которая будет упакована и использована с проектом. Следуйте этим шагам, чтобы выбрать, загрузить и подготовить конкретную языковую модель:
-
Выберите желаемую модель из доступных вариантов. Плагин поддерживает следующие модели "из коробки":
Стандартные модели:
- Tiny
- Base
- Small
- Medium
- Large V1
- Large V2
- Large V3
- Large V3 Turbo
Квантованные модели (уменьшенный размер файла):
- Tiny Quantized (Q5_1) - Квантование до 5 бит и 1 знака после запятой
- Tiny Quantized (Q8_0) - Квантование до 8 бит и 0 знаков после запятой
- Base Quantized (Q5_1) - Квантование до 5 бит и 1 знака после запятой
- Small Quantized (Q5_1) - Квантование до 5 бит и 1 знака после запятой
- Medium Quantized (Q5_0) - Квантование до 5 бит и 0 знаков после запятой
- Large V2 Quantized (Q5_0) - Квантование до 5 бит и 0 знаков после запятой
- Large V3 Quantized (Q5_0) - Квантование до 5 бит и 0 знаков после запятой
- Large V3 Turbo Quantized (Q5_0) - Квантование до 5 бит и 0 знаков после запятой
Дистиллированные модели:
- Distil Small - Дистиллированная версия модели Small
- Distil Medium - Дистиллированная версия модели Medium
- Distil Large V2 - Дистиллированная версия модели Large V2
- Distil Large V3 - Дистиллированная версия модели Large V3
Пользовательская модель:
- Custom - Укажите собственное имя модели и URL для загрузки вашей языковой модели с сервера
Каждая модель (кроме Custom) может быть настроена как Многоязычная или Только для английского.
-
Нажмите кнопку Setup Language Model, которая автоматически предложит загрузить выбранную языковую модель, если она еще не присутствует на вашем локальном компьютере.
-
После завершения загрузки редактор создаст ассет языковой модели по пути "Plugins/RuntimeSpeechRecognizer/Content/LanguageModels/LanguageModel.uasset". Этот ассет языковой модели будет единственным, упакованным с вашим проектом.
Вы также можете удалить любые локально загруженные языковые модели, нажав кнопку Clear Language Models.



В качестве альтернативы вы можете вручную загрузить и разместить языковые модели только с https://huggingface.co/ggerganov/whisper.cpp в папку "Plugins/RuntimeSpeechRecognizer/Content".
Обратите внимание, что с вашим проектом будет упакована только выбранная языковая модель. Поэтому вам не нужно беспокоиться о других моделях, так как они будут исключены на этапе упаковки.