Descripción general

Runtime MetaHuman Lip Sync es un complemento que habilita la sincronización labial en tiempo real, sin conexión y multiplataforma tanto para personajes MetaHuman como personalizados. Te permite animar los labios de un personaje en respuesta a una entrada de audio de varias fuentes, incluyendo:
- Entrada de micrófono a través de la onda sonora capturable de Runtime Audio Importer
- Voz sintetizada desde Runtime Text To Speech o Runtime AI Chatbot Integrator
- Datos de audio transmitidos o importados en múltiples formatos a través de Runtime Audio Importer
- Cualquier dato de audio en formato PCM de punto flotante (un array de muestras de punto flotante)
El complemento genera internamente visemas (representaciones visuales de fonemas) basándose en la entrada de audio. Dado que funciona directamente con datos de audio en lugar de texto, el complemento admite entrada multilingüe, incluyendo pero no limitado a inglés, español, francés, alemán, japonés, chino, coreano, ruso, italiano, portugués, árabe e hindi. Literalmente, cualquier idioma es compatible, ya que la sincronización labial se genera a partir de fonemas de audio en lugar de un procesamiento de texto específico del idioma.
El Modelo Estándar produce 14 visemas y realiza la animación de sincronización labial utilizando un activo de pose predefinido. En contraste, los Modelos Realistas (exclusivos para personajes MetaHuman) generan 81 cambios de control facial sin depender de un activo de pose predefinido, lo que resulta en animaciones faciales significativamente más realistas.
Compatibilidad de Personajes
A pesar de su nombre, Runtime MetaHuman Lip Sync funciona con una amplia gama de personajes más allá de los MetaHumans:
Sistemas de Personajes Comerciales Populares
- Personajes Daz Genesis 8/9
- Personajes Reallusion Character Creator 3/4 (CC3/CC4)
- Personajes Mixamo
- Avatares ReadyPlayerMe
Soporte de Estándares de Animación
- Sistemas de blendshape basados en FACS
- Estándar de blendshape Apple ARKit
- Conjuntos de fonemas Preston Blair
- Sistemas de fonemas de 3ds Max
- Cualquier personaje con objetivos de morfos personalizados para expresiones faciales
Para instrucciones detalladas sobre cómo usar el complemento con personajes que no son MetaHuman, consulta la Guía de Configuración de Personajes Personalizados.
Vista Previa de Animación
Echa un vistazo a estas animaciones cortas para ver la calidad de la animación de sincronización labial producida por el complemento en diferentes tipos de personajes y modelos:




Características Clave
- Sincronización labial en tiempo real desde entrada de micrófono
- Soporte para procesamiento de audio offline
- Compatibilidad multiplataforma con soporte específico por plataforma para modelos
- Soporte para múltiples sistemas de personajes y estándares de animación
- Mapeo de visemas flexible para personajes personalizados
- Soporte de idioma universal: funciona con cualquier idioma hablado mediante análisis de audio
- Animación facial consciente del estado de ánimo para mayor expresividad
- Tipos de salida configurables (cara completa o solo controles de boca)
Modelos de Sincronización Labial
El plugin ofrece múltiples modelos de sincronización labial para adaptarse a diferentes necesidades del proyecto:
- Modelo Estándar
- Modelo Realista
- Modelo Realista con Estado de Ánimo
El modelo de sincronización labial estándar proporciona un rendimiento eficiente y multiplataforma con amplia compatibilidad de personajes:
- Funciona con MetaHumans y todo tipo de personajes personalizados
- Optimizado para rendimiento en tiempo real
- Requisitos de recursos más bajos
- Compatibilidad total con TTS local (plugin Runtime Text To Speech)
- Soporte de Plataforma: Windows, Android, plataformas basadas en Android (incluyendo Meta Quest)
Para usar el Modelo Estándar, necesitas instalar un plugin de extensión adicional. Consulta la sección de Prerrequisitos para instrucciones de instalación.
El modelo de sincronización labial realista ofrece una fidelidad visual mejorada específicamente para personajes MetaHuman:
- Exclusivo para MetaHumans con animación facial avanzada (81 controles faciales)
- Mayor calidad visual con movimientos de boca más naturales
- Requisitos de rendimiento ligeramente superiores
- Soporte limitado para TTS local (se recomiendan servicios TTS externos)
- Ideal para experiencias cinemáticas e interacciones de personajes en primer plano
- Soporte de Plataforma: Windows, Mac, iOS, Linux, Android, plataformas basadas en Android (incluyendo Meta Quest)
- Tres niveles de optimización: Original, Semi-Optimizado y Altamente Optimizado
El Modelo Realista está incluido en el plugin principal y no requiere extensiones adicionales para su uso.
El modelo realista con estado de ánimo proporciona animación facial consciente de las emociones para personajes MetaHuman:
- Exclusivo para MetaHumans con animación facial sensible al estado de ánimo
- 12 tipos diferentes de estado de ánimo (Neutral, Feliz, Triste, Seguro, etc.)
- Intensidad del estado de ánimo configurable (0.0 a 1.0)
- Tiempo de anticipación ajustable para mejorar la sincronización (20ms a 200ms)
- Tipos de salida seleccionables: Cara Completa o solo controles de Boca
- Procesamiento de audio en streaming para aplicaciones en tiempo real
- Soporte de Plataforma: Windows, Mac, iOS, Linux, Android, plataformas basadas en Android (incluyendo Meta Quest)
::: ::info Características Avanzadas El Modelo con Estado de Ánimo incluye características avanzadas como temporización de anticipación configurable y salida de control selectiva, lo que lo hace ideal para aplicaciones que requieren control de expresión emocional. :::
Puedes elegir el modelo apropiado según los requisitos de tu proyecto en cuanto a rendimiento, compatibilidad de personajes, calidad visual, plataforma objetivo y necesidades de características.
Si bien todos los modelos admiten varios métodos de entrada de audio, el modelo Realista regular tiene compatibilidad limitada con TTS local debido a conflictos del tiempo de ejecución ONNX. Sin embargo, el modelo Realista con Estado de Ánimo es totalmente compatible con TTS local. Para la funcionalidad de texto a voz:
- Modelo Estándar: Compatible con todas las opciones de TTS (local y externa)
- Modelo Realista: Se recomiendan servicios de TTS externos (OpenAI, ElevenLabs)
- Modelo Realista con Estado de Ánimo: Compatible con todas las opciones de TTS (local y externa)
Cómo Funciona
El complemento procesa la entrada de audio de la siguiente manera:
- Los datos de audio se reciben en formato PCM de punto flotante con canales y frecuencia de muestreo especificados
- El complemento procesa el audio para generar datos de control facial o visemas dependiendo del modelo
- Para los modelos con estado de ánimo, se aplica contexto emocional a la animación facial
- Los datos de animación impulsan los movimientos faciales del personaje en tiempo real
Inicio Rápido
Aquí hay una configuración básica para habilitar la sincronización labial en tu personaje:
- Para personajes MetaHuman, sigue la Guía de Configuración
- Para personajes personalizados, sigue la Guía de Configuración de Personajes Personalizados
- Elige y configura tu modelo de sincronización labial preferido
- Configura el procesamiento de entrada de audio en tu Blueprint
- Conecta el nodo de sincronización labial apropiado en el Animation Blueprint
- ¡Reproduce audio y ve a tu personaje hablar con emoción!
Recursos Adicionales
📦 Descargas y Enlaces
- Consíguelo en Fab
- Sitio web del producto
- Descargar Demo (Windows)
- Descargar archivos fuente de la Demo (UE 5.6) – Requiere este complemento + Runtime Audio Importer, opcional: Text To Speech / AI Chatbot. El modelo estándar requiere un pequeño complemento de extensión (ver aquí)
🎥 Tutoriales en Video
Demostración Destacada:
Tutoriales de Modelo Realista (Alta Calidad):
- Sincronización Labial de Alta Calidad con Control de Estado de Ánimo y TTS Local ⭐ NUEVO
- Sincronización Labial de Alta Calidad con ElevenLabs y OpenAI TTS
- Sincronización Labial en Tiempo Real con Micrófono de Alta Calidad
Tutoriales de Modelo Estándar:
- Sincronización Labial en Tiempo Real con Micrófono Estándar
- Sincronización Labial Estándar con Texto a Voz Local
- Sincronización Labial Estándar con ElevenLabs y OpenAI TTS
Configuración General:
💬 Soporte
- Servidor de soporte en Discord
- Desarrollo Personalizado: solutions@georgy.dev (soluciones a medida para equipos y organizaciones)