Passa al contenuto principale

Panoramica

Documentazione di Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator è un plugin multipiattaforma per Unreal Engine che consente l'integrazione diretta di chatbot AI e servizi di sintesi vocale nei tuoi progetti. Il plugin supporta molteplici fornitori AI leader e offre interazioni di chat flessibili con modalità di risposta sia in streaming che non, oltre a una conversione testo-voce di alta qualità con capacità di streaming.

Funzionalità Supportate

Chat da Testo a Testo

Integra capacità conversazionali alimentate da AI con molteplici fornitori leader.

OpenAI

  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.5 Sonnet
  • Claude 4 Sonnet
  • Claude 4.1 Opus
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (con output di ragionamento dedicato)

Gemini (Google)

  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212
  • Grok 2 1212
  • Grok Vision Beta

Sintesi Vocale (TTS)

Converti testo in voce dal suono naturale utilizzando fornitori TTS leader, con opzioni sia standard che in streaming.

OpenAI TTS

Multiple opzioni vocali con supporto regolare e in streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelli:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Molti modelli con supporto regolare e in streaming:

  • Eleven V3 (Ultimo modello con generazione vocale umana ed espressiva, supporta 70+ lingue)
  • Eleven TTV V3 (Modello di progettazione Text to Voice con voce umana ed espressiva, supporta 70+ lingue)
  • Eleven Multilingual V2 (Modello più realistico con ricca espressione emotiva)
  • Eleven Turbo V2 (Modello di alta qualità, bassa latenza ottimizzato per l'inglese)
  • Eleven Turbo V2.5 (Modello di alta qualità, bassa latenza con supporto multilingue)
  • Eleven Flash V2 (Modello ultra-veloce ottimizzato per l'uso in tempo reale in inglese)
  • Eleven Flash V2.5 (Modello ultra-veloce ottimizzato per l'uso in tempo reale con supporto multilingue)
  • Eleven Monolingual V1

Google Cloud TTS

Voci neurali di alta qualità con ampio supporto linguistico:

  • Voci Neural2
  • Voci Studio
  • Voci Wavenet
  • Voci Standard
  • Supporto per Voci Personalizzate
  • Molteplici lingue e localizzazioni
  • Supporto SSML per un controllo granulare

Azure TTS

Servizio di sintesi vocale cognitiva di Microsoft con ampie opzioni vocali:

  • Voci neurali in molteplici lingue
  • Stili vocali ed emozioni
  • Supporto per voci personalizzate
  • Supporto per markup SSML

Caratteristiche Principali

  • Compatibilità multipiattaforma (Windows, Mac, Android, iOS, Linux, Meta Quest e altro)
  • Supporto per più provider di AI e TTS
  • Risposte di chat in streaming e non in streaming
  • TTS in streaming per la sintesi e l'elaborazione audio in tempo reale
  • Supporto per modelli di ragionamento con output separati di ragionamento e contenuto (DeepSeek, Grok)
  • Sintesi vocale di alta qualità con latenza minima
  • Integrazione facile con Unreal Engine Blueprints e C++
  • Opzioni di configurazione flessibili
  • Supporto per oltre 70 lingue con i modelli ElevenLabs V3
  • Elenco e scoperta delle voci per Google Cloud e Azure TTS

Prerequisiti

Per utilizzare il plugin, avrai bisogno delle credenziali di accesso API da uno dei provider supportati:

Per l'elaborazione audio, puoi implementare la tua soluzione o utilizzare il plugin Runtime Audio Importer, che può importare dati audio in vari formati (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Per maggiori informazioni, vedi qui.

Risorse Aggiuntive