개요

Runtime MetaHuman Lip Sync은 메타휴먼 및 커스텀 캐릭터 모두에 대해 실시간, 오프라인 및 크로스 플랫폼 립 싱크를 가능하게 하는 플러그인입니다. 이를 통해 다양한 소스의 오디오 입력에 반응하여 캐릭터의 입술을 애니메이션할 수 있습니다. 여기에는 다음이 포함됩니다:

Runtime Audio Importer's를 통한 마이크 입력 캡처 가능한 사운드 웨이브
Runtime Text To Speech 또는 Runtime AI Chatbot Integrator에서 합성된 음성
Runtime Audio Importer를 통해 여러 형식으로 스트리밍 또는 가져온 오디오 데이터
float PCM 형식(부동 소수점 샘플 배열)의 모든 오디오 데이터

이 플러그인은 오디오 입력을 기반으로 내부적으로 비짐(음소의 시각적 표현)을 생성합니다. 텍스트가 아닌 오디오 데이터로 직접 작동하기 때문에, 이 플러그인은 영어, 스페인어, 프랑스어, 독일어, 일본어, 중국어, 한국어, 러시아어, 이탈리아어, 포르투갈어, 아랍어, 힌디어를 포함하되 이에 국한되지 않는 다국어 입력을 지원합니다. 사실상 모든 언어가 지원됩니다. 립 싱크가 언어별 텍스트 처리 대신 오디오 음소에서 생성되기 때문입니다.

표준 모델은 **14개의 비지엠(viseme)**을 생성하고 미리 정의된 포즈 에셋을 사용하여 립 싱크 애니메이션을 수행합니다. 반면, 리얼리스틱 모델(메타휴먼 및 ARKit 기반 캐릭터 전용)은 미리 정의된 포즈 에셋에 의존하지 않고 81개의 얼굴 제어 변화를 생성하여 훨씬 더 사실적인 얼굴 애니메이션을 구현합니다.

캐릭터 호환성

이름과 달리 Runtime MetaHuman Lip Sync는 메타휴먼뿐만 아니라 다양한 캐릭터와 함께 작동합니다:

애니메이션 표준 지원

FACS 기반 블렌드셰이프 시스템
Apple ARKit 블렌드셰이프 표준
Preston Blair 음소 세트
3ds Max 음소 시스템
얼굴 표정을 위한 커스텀 모프 타겟을 가진 모든 캐릭터

비메타휴먼 캐릭터 중 표준 모델을 사용하는 경우 커스텀 캐릭터 설정 가이드를 참조하세요. ARKit 기반 캐릭터 중 리얼리스틱 모델을 사용하는 경우 모프 타겟 세트 선택을 참조하세요.

애니메이션 미리보기

이 플러그인이 다양한 캐릭터 유형과 모델에서 생성하는 립 싱크 애니메이션의 품질을 확인하려면 다음 짧은 애니메이션을 확인하세요:

MetaHuman 캐릭터를 사용한 사실적인 모델

메타휴먼 캐릭터가 포함된 표준 모델

표준 모델과 커스텀 캐릭터

주요 기능

마이크 입력으로 실시간 립싱크
오프라인 오디오 처리 지원
모델별 플랫폼 지원을 통한 크로스 플랫폼 호환성
다중 캐릭터 시스템 및 애니메이션 표준 지원
커스텀 캐릭터를 위한 유연한 비짐 매핑
범용 언어 지원 - 오디오 분석을 통해 모든 음성 언어와 호환
향상된 표현력을 위한 표정 인식 얼굴 애니메이션
구성 가능한 출력 유형 (전체 얼굴 또는 입 전용 제어)
깜빡임 및 시선 추적을 위한 선택적 눈 애니메이션 도우미

립 싱크 모델

이 플러그인은 다양한 프로젝트 요구 사항에 맞는 여러 립 싱크 모델을 제공합니다:

표준 모델
현실적인 모델
감정 반영 사실적 모델

표준 립 싱크 모델은 효율적인 크로스 플랫폼 성능과 광범위한 캐릭터 호환성을 제공합니다:

MetaHuman 및 모든 커스텀 캐릭터 유형과 호환
실시간 성능에 최적화됨
더 낮은 리소스 요구 사항
플랫폼 지원: Windows, Android, Android 기반 플랫폼 (Meta Quest 포함)

확장 플러그인 필요

표준 모델을 사용하려면 추가 확장 플러그인을 설치해야 합니다. 설치 방법은 사전 요구 사항 섹션을 참조하세요.

프로젝트 요구 사항에 따라 성능, 캐릭터 호환성, 시각적 품질, 대상 플랫폼 및 기능 요구 사항에 적합한 모델을 선택할 수 있습니다.

작동 방식

이 플러그인은 오디오 입력을 다음과 같은 방식으로 처리합니다:

오디오 데이터는 지정된 채널과 샘플 레이트를 가진 float PCM 형식으로 수신됩니다.
플러그인은 오디오를 처리하여 모델에 따라 얼굴 제어 데이터 또는 비지엠을 생성합니다.
감정 지원 모델의 경우, 감정적 맥락이 얼굴 애니메이션에 적용됩니다.
애니메이션 데이터는 캐릭터의 얼굴 움직임을 실시간으로 구동합니다.

성능 아키텍처

Runtime MetaHuman Lip Sync은 CPU 전용 추론을 사용하여 실시간 애플리케이션에 적합한 일관되고 지연 시간이 짧은 립싱크 결과를 제공합니다. 기본적으로 플러그인은 10밀리초마다 립싱크 처리를 수행합니다(조정 가능 - 플러그인 구성에서 처리 청크 크기, 스레드 수 및 기타 성능 매개변수를 포함한 모든 설정 확인 가능).

모델 아키텍처 개요

립 싱크 모델은 멜-스펙트로그램 분석을 통해 오디오를 처리하는 소형 트랜스포머 기반 신경망을 사용합니다. 이 경량 아키텍처는 효율적인 CPU 추론과 최소한의 메모리 사용량으로 실시간 성능을 제공하도록 특별히 설계되었습니다.

왜 CPU 추론인가?

실시간 립싱크와 같이 작고 빈번한 추론 작업의 경우, CPU 처리가 GPU보다 더 나은 지연 시간 특성을 제공합니다. 배치 크기 1에 10~100ms 추론 간격에서는 PCIe 전송 및 커널 실행으로 인한 GPU 오버헤드가 실제 계산 시간을 초과하는 경우가 많습니다. 또한 게임 엔진에서 GPU는 이미 렌더링, 셰이더, 물리 연산으로 포화 상태여서 리소스 경합이 발생하고 예측 불가능한 지연 시간 급증을 초래합니다.

하드웨어 호환성

이 플러그인은 전용 그래픽 하드웨어 없이도 대부분의 중급 이상 CPU에서 효율적으로 작동하며, 데스크톱, 모바일 및 VR 플랫폼에서 실시간 성능을 제공합니다. 성능이 낮은 하드웨어의 경우 모델 유형을 반최적화 또는 고도 최적화로 조정하거나, **처리 청크 크기**를 늘려 응답성이 약간 낮아지더라도 실시간 성능을 유지할 수 있습니다.

빠른 시작

다음은 캐릭터에 립 싱크를 활성화하기 위한 기본 설정입니다:

메타휴먼 캐릭터의 경우 설정 가이드를 따르세요
커스텀 캐릭터의 경우 커스텀 캐릭터 설정 가이드를 따르세요
원하는 립싱크 모델을 선택하고 구성하세요
블루프린트에서 오디오 입력 처리를 설정하세요
애니메이션 블루프린트에서 적절한 립싱크 노드를 연결하세요
오디오를 재생하고 캐릭터가 동기화되어 애니메이션되는 것을 확인하세요

선택적 눈 애니메이션

이 플러그인은 메타휴먼의 자동 눈 깜빡임과 시선 추적을 위한 선택적 도우미도 포함합니다. 이는 립 싱크와 독립적이며 단독으로 사용하거나 그 위에 레이어로 적용할 수 있습니다. 눈 애니메이션 도우미를 참조하세요.

추가 자료

📦 다운로드 및 링크

데모 프로젝트:

두 가지 즉시 사용 가능한 데모 프로젝트가 제공됩니다. 자세한 내용, 다운로드 및 워크스루는 전용 데모 프로젝트 페이지를 참조하세요.

전체 AI 대화형 NPC 워크플로우 - 음성 인식 + LLM 챗봇 + TTS + 립 싱크
기본 립 싱크 데모 - 마이크 입력, 오디오 파일, TTS

두 데모 모두 크로스 플랫폼(Windows, Mac, Linux, iOS, Android, Meta Quest)을 지원하며, 패키징된 빌드와 전체 UE 5.6+ 소스 프로젝트로 제공됩니다.

🎥 비디오 튜토리얼

현실적인 모델 (고품질) 튜토리얼:

표준 모델 튜토리얼:

일반 설정:

💬 지원

맞춤 개발: solutions@georgy.dev (팀 및 조직을 위한 맞춤형 솔루션)

Join our Discord

online · support

개요

캐릭터 호환성

인기 있는 상업용 캐릭터 시스템

애니메이션 표준 지원

애니메이션 미리보기

주요 기능

립 싱크 모델

작동 방식

성능 아키텍처

모델 아키텍처 개요

왜 CPU 추론인가?

하드웨어 호환성

빠른 시작

선택적 눈 애니메이션

추가 자료

📦 다운로드 및 링크

🎥 비디오 튜토리얼

추천 데모:

현실적인 모델 (고품질) 튜토리얼:

표준 모델 튜토리얼:

일반 설정:

💬 지원

캐릭터 호환성​

인기 있는 상업용 캐릭터 시스템​

애니메이션 표준 지원​

애니메이션 미리보기​

주요 기능​

립 싱크 모델​

작동 방식​

성능 아키텍처​

모델 아키텍처 개요​

왜 CPU 추론인가?​

하드웨어 호환성​

빠른 시작​

선택적 눈 애니메이션​

추가 자료​

📦 다운로드 및 링크​

🎥 비디오 튜토리얼​

추천 데모:​

현실적인 모델 (고품질) 튜토리얼:​

표준 모델 튜토리얼:​

일반 설정:​

💬 지원​

캐릭터 호환성

인기 있는 상업용 캐릭터 시스템

애니메이션 표준 지원

애니메이션 미리보기

주요 기능

립 싱크 모델

작동 방식

성능 아키텍처

모델 아키텍처 개요

왜 CPU 추론인가?

하드웨어 호환성

빠른 시작

선택적 눈 애니메이션

추가 자료

📦 다운로드 및 링크

🎥 비디오 튜토리얼

추천 데모:

현실적인 모델 (고품질) 튜토리얼:

표준 모델 튜토리얼:

일반 설정:

💬 지원