Ana içeriğe geç

Eklenti Yapılandırması

Model Yapılandırması

Standart Model Yapılandırması

Create Runtime Viseme Generator düğümü, çoğu senaryo için iyi çalışan varsayılan ayarları kullanır. Yapılandırma, Animation Blueprint karıştırma düğümü özellikleri aracılığıyla ele alınır.

Animation Blueprint yapılandırma seçenekleri için aşağıdaki Dudak Senkronizasyonu Yapılandırması bölümüne bakın.

Gerçekçi Model Yapılandırması

Create Realistic MetaHuman Lip Sync Generator düğümü, oluşturucunun davranışını özelleştirmenize izin veren isteğe bağlı bir Configuration parametresi kabul eder:

Model Türü

Model Türü ayarı, gerçekçi modelin hangi sürümünün kullanılacağını belirler:

Model TürüPerformansGörsel KaliteGürültü İşlemeÖnerilen Kullanım Senaryoları
Yüksek Optimize Edilmiş (Varsayılan)En yüksek performans, en düşük CPU kullanımıİyi kaliteArka plan gürültüsü veya ses olmayan seslerle fark edilebilir ağız hareketleri gösterebilirTemiz ses ortamları, performans kritik senaryolar
Yarı Optimize Edilmişİyi performans, orta düzeyde CPU kullanımıYüksek kaliteGürültülü sesle daha iyi kararlılıkDengeli performans ve kalite, karışık ses koşulları
OrijinalModern CPU'larda gerçek zamanlı kullanım için uygunEn yüksek kaliteArka plan gürültüsü ve ses olmayan seslerle en kararlıYüksek kaliteli prodüksiyonlar, gürültülü ses ortamları, maksimum doğruluk gerektiğinde

Performans Ayarları

Intra Op Threads: Dahili model işleme operasyonları için kullanılan iş parçacığı sayısını kontrol eder.

  • 0 (Varsayılan/Otomatik): Otomatik algılama kullanır (tipik olarak mevcut CPU çekirdeklerinin 1/4'ü, maksimum 4)
  • 1-16: Manuel olarak iş parçacığı sayısını belirtin. Daha yüksek değerler çok çekirdekli sistemlerde performansı artırabilir ancak daha fazla CPU kullanır

Inter Op Threads: Farklı model operasyonlarının paralel yürütülmesi için kullanılan iş parçacığı sayısını kontrol eder.

  • 0 (Varsayılan/Otomatik): Otomatik algılama kullanır (tipik olarak mevcut CPU çekirdeklerinin 1/8'i, maksimum 2)
  • 1-8: Manuel olarak iş parçacığı sayısını belirtin. Genellikle gerçek zamanlı işleme için düşük tutulur

İşleme Parça Boyutu

İşleme Parça Boyutu, her bir çıkarım adımında kaç örneğin işlendiğini belirler. Varsayılan değer 160 örnek'tir (16kHz'de 10ms ses):

  • Daha küçük değerler daha sık güncellemeler sağlar ancak CPU kullanımını artırır
  • Daha büyük değerler CPU yükünü azaltır ancak dudak senkronizasyonu yanıt hızını azaltabilir
  • Optimal hizalama için 160'ın katlarının kullanılması önerilir

İşleme Parça Boyutunu Ayarlama

Ruh Hali Etkin Model Yapılandırması

Create Realistic MetaHuman Lip Sync With Mood Generator düğümü, temel gerçekçi modelin ötesinde ek yapılandırma seçenekleri sağlar:

Temel Yapılandırma

İleri Bakış Ms: Daha iyi dudak senkronizasyonu doğruluğu için ileri bakış zamanlaması.

  • Varsayılan: 80ms
  • Aralık: 20ms ila 200ms (20'ye bölünebilir olmalı)
  • Daha yüksek değerler daha iyi senkronizasyon sağlar ancak gecikmeyi artırır

Çıktı Türü: Hangi yüz kontrollerinin üretileceğini kontrol eder.

  • Tam Yüz: Tüm 81 yüz kontrolü (kaşlar, gözler, burun, ağız, çene, dil)
  • Sadece Ağız: Sadece ağız, çene ve dil ile ilgili kontroller

Performans Ayarları: Normal gerçekçi modelle aynı Intra Op Threads ve Inter Op Threads ayarlarını kullanır.

Ruh Hali Ayarları

Mevcut Ruh Halleri:

  • Nötr, Mutlu, Üzgün, İğrenme, Öfke, Şaşkınlık, Korku
  • Kendinden Emin, Heyecanlı, Sıkılmış, Oyunbaz, Kafası Karışmış

Ruh Hali Yoğunluğu: Ruh halinin animasyonu ne kadar güçlü etkilediğini kontrol eder (0.0 ila 1.0)

Çalışma Zamanı Ruh Hali Kontrolü

Çalışma zamanında aşağıdaki işlevleri kullanarak ruh hali ayarlarını ayarlayabilirsiniz:

  • Ruh Halini Ayarla: Mevcut ruh hali türünü değiştir
  • Ruh Hali Yoğunluğunu Ayarla: Ruh halinin animasyonu ne kadar güçlü etkilediğini ayarla (0.0 ila 1.0)
  • İleri Bakış Ms'yi Ayarla: Senkronizasyon için ileri bakış zamanlamasını değiştir
  • Çıktı Türünü Ayarla: Tam Yüz ve Sadece Ağız kontrolleri arasında geçiş yap

Ruh Hali Yapılandırması

Ruh Hali Seçim Kılavuzu

İçeriğinize göre uygun ruh hallerini seçin:

Ruh HaliEn İyi Kullanım AlanıTipik Yoğunluk Aralığı
NötrGenel konuşma, anlatım, varsayılan durum0.5 - 1.0
MutluOlumlu içerik, neşeli diyalog, kutlamalar0.6 - 1.0
ÜzgünMelankolik içerik, duygusal sahneler, kasvetli anlar0.5 - 0.9
İğrenmeOlumsuz tepkiler, tatsız içerik, reddetme0.4 - 0.8
ÖfkeAgresif diyalog, çatışmalı sahneler, hayal kırıklığı0.6 - 1.0
ŞaşkınlıkBeklenmedik olaylar, açıklamalar, şok tepkileri0.7 - 1.0
KorkuTehdit edici durumlar, kaygı, gergin diyalog0.5 - 0.9
Kendinden EminProfesyonel sunumlar, liderlik diyaloğu, iddialı konuşma0.7 - 1.0
HeyecanlıEnerjik içerik, duyurular, coşkulu diyalog0.8 - 1.0
SıkılmışMonoton içerik, ilgisiz diyalog, yorgun konuşma0.3 - 0.7
OyunbazGündelik konuşma, mizah, hafif kalpli etkileşimler0.6 - 0.9
Kafası KarışmışSoru ağırlıklı diyalog, belirsizlik, şaşkınlık0.4 - 0.8

Animasyon Blueprint Yapılandırması

Dudak Senkronizasyonu Yapılandırması

Blend Runtime MetaHuman Lip Sync düğümünün özellikler panelinde yapılandırma seçenekleri bulunur:

ÖzellikVarsayılanAçıklama
Geçiş Hızı25Dudak hareketlerinin visemler arasında ne kadar hızlı geçiş yapacağını kontrol eder. Daha yüksek değerler daha hızlı ve ani geçişlere neden olur.
Sıfırlama Süresi0.2Dudak senkronizasyonunun sıfırlanacağı saniye cinsinden süre. Bu, ses durduktan sonra dudak senkronizasyonunun devam etmesini önlemek için kullanışlıdır.

Kahkaha Animasyonu

Ses içinde tespit edilen kahkahalara dinamik olarak yanıt verecek kahkaha animasyonları da ekleyebilirsiniz:

  1. Blend Runtime MetaHuman Laughter düğümünü ekleyin
  2. RuntimeVisemeGenerator değişkeninizi Viseme Generator pin'ine bağlayın
  3. Zaten dudak senkronizasyonu kullanıyorsanız:
    • Blend Runtime MetaHuman Lip Sync düğümünün çıkışını Blend Runtime MetaHuman Laughter düğümünün Source Pose pin'ine bağlayın
    • Blend Runtime MetaHuman Laughter düğümünün çıkışını Output Pose'nin Result pin'ine bağlayın
  4. Yalnızca kahkaha kullanıyorsanız (dudak senkronizasyonu olmadan):
    • Kaynak pozunuzu doğrudan Blend Runtime MetaHuman Laughter düğümünün Source Pose pin'ine bağlayın
    • Çıkışı Result pin'ine bağlayın

Blend Runtime MetaHuman Laughter

Seste kahkaha tespit edildiğinde, karakteriniz buna göre dinamik olarak animasyonlanacaktır:

Laughter

Kahkaha Yapılandırması

Blend Runtime MetaHuman Laughter düğümünün kendi yapılandırma seçenekleri vardır:

ÖzellikVarsayılanAçıklama
Geçiş Hızı25Dudak hareketlerinin kahkaha animasyonları arasında ne kadar hızlı geçiş yapacağını kontrol eder. Daha yüksek değerler daha hızlı ve ani geçişlere neden olur.
Sıfırlama Süresi0.2Kahkahanın sıfırlanacağı saniye cinsinden süre. Bu, ses durduktan sonra kahkahanın devam etmesini önlemek için kullanışlıdır.
Maksimum Kahkaha Ağırlığı0.7Kahkaha animasyonunun maksimum yoğunluğunu ölçekler (0.0 - 1.0).

Not: Kahkaha tespiti şu anda yalnızca Standard Model ile kullanılabilir.

Mevcut Animasyonlarla Birleştirme

Lip senkronizasyonu ve kahkaha efektlerini, mevcut vücut animasyonlarını ve özel yüz animasyonlarını geçersiz kılmadan birlikte uygulamak için:

  1. Vücut animasyonlarınız ile son çıktı arasına bir Layered blend per bone düğümü ekleyin. Use Attached Parent özelliğinin true olduğundan emin olun.
  2. Katman kurulumunu yapılandırın:
    • Layer Setup dizisine 1 öğe ekleyin
    • Katman için Branch Filters'a aşağıdaki Bone Name değerleriyle 3 öğe ekleyin:
      • FACIAL_C_FacialRoot
      • FACIAL_C_Neck2Root
      • FACIAL_C_Neck1Root
  3. Özel yüz animasyonları için önemli: Curve Blend Option'da "Use Max Value" seçeneğini seçin. Bu, özel yüz animasyonlarının (ifadeler, duygular vb.) lip senkronizasyonunun üzerine düzgün şekilde katmanlanmasına olanak tanır.
  4. Bağlantıları yapın:
    • Mevcut animasyonlar (örneğin BodyPose) → Base Pose girişi
    • Yüz animasyon çıktısı (lip senkronizasyonu ve/veya kahkaha düğümlerinden) → Blend Poses 0 girişi
    • Katmanlı karıştırma düğümü → Son Result pozu

Layered Blend Per Bone

Lip Senkronizasyon Davranışını İnce Ayarlama

Dil Çıkıntısı Kontrolü

Standart dudak senkronizasyonu modelinde, belirli fonemler sırasında aşırı ileri dil hareketi fark edebilirsiniz. Dil çıkıntısını kontrol etmek için:

  1. Dudak senkronizasyonu blend node'unuzdan sonra bir Modify Curve düğümü ekleyin
  2. Modify Curve düğümüne sağ tıklayın ve Add Curve Pin seçin
  3. Adı CTRL_expressions_tongueOut olan bir curve pin ekleyin
  4. Düğümün Apply Mode özelliğini Scale olarak ayarlayın
  5. Dil uzatmasını kontrol etmek için Value parametresini ayarlayın (örn., çıkıntıyı %20 azaltmak için 0.8)

Çene Açma Kontrolü

Gerçekçi dudak senkronizasyonu, ses içeriğinize ve görsel gereksinimlerinize bağlı olarak aşırı duyarlı çene hareketleri üretebilir. Çene açma yoğunluğunu ayarlamak için:

  1. Dudak senkronizasyonu blend node'unuzdan sonra bir Modify Curve düğümü ekleyin
  2. Modify Curve düğümüne sağ tıklayın ve Add Curve Pin seçin
  3. Adı CTRL_expressions_jawOpen olan bir curve pin ekleyin
  4. Düğümün Apply Mode özelliğini Scale olarak ayarlayın
  5. Çene açma aralığını kontrol etmek için Value parametresini ayarlayın (örn., çene hareketini %10 azaltmak için 0.9)

Ruh Haline Özel İnce Ayar

Ruh hali etkin modeller için belirli duygusal ifadeleri ince ayarlayabilirsiniz:

Kaş Kontrolü:

  • CTRL_expressions_browRaiseInL / CTRL_expressions_browRaiseInR - İç kaş kaldırma
  • CTRL_expressions_browRaiseOuterL / CTRL_expressions_browRaiseOuterR - Dış kaş kaldırma
  • CTRL_expressions_browDownL / CTRL_expressions_browDownR - Kaş indirme

Göz İfadesi Kontrolü:

  • CTRL_expressions_eyeSquintInnerL / CTRL_expressions_eyeSquintInnerR - Göz kısma
  • CTRL_expressions_eyeCheekRaiseL / CTRL_expressions_eyeCheekRaiseR - Yanak kaldırma

Model Karşılaştırması ve Seçimi

Modeller Arasında Seçim Yapma

Projeniz için hangi dudak senkronizasyonu modelini kullanacağınıza karar verirken bu faktörleri göz önünde bulundurun:

DeğerlendirmeStandart ModelGerçekçi ModelRuh Hali Etkin Gerçekçi Model
Karakter UyumluluğuMetaHumans ve tüm özel karakter türleriSadece MetaHumansSadece MetaHumans
Görsel Kaliteİyi dudak senkronizasyonu ve verimli performansDaha doğal ağız hareketleriyle gelişmiş gerçekçilikDuygusal ifadelerle gelişmiş gerçekçilik
PerformansMobil/VR dahil tüm platformlar için optimize edilmişDaha yüksek kaynak gereksinimleriDaha yüksek kaynak gereksinimleri
Özellikler14 visem, kahkaha tespiti81 yüz kontrolü, 3 optimizasyon seviyesi81 yüz kontrolü, 12 ruh hali, yapılandırılabilir çıktı
Platform DesteğiWindows, Android, QuestWindows, Mac, iOS, Linux, Android, QuestWindows, Mac, iOS, Linux, Android, Quest
Kullanım AlanlarıGenel uygulamalar, oyunlar, VR/AR, mobilSinematik deneyimler, yakın plan etkileşimlerDuygusal hikaye anlatımı, gelişmiş karakter etkileşimi

Motor Sürüm Uyumluluğu

UE 5.2 Uyumluluk Sorunu

Unreal Engine 5.2 kullanıyorsanız, Gerçekçi Modeller UE'nin yeniden örnekleme kütüphanesindeki bir hata nedeniyle doğru çalışmayabilir. Güvenilir dudak senkronizasyonu işlevselliğine ihtiyaç duyan UE 5.2 kullanıcıları için lütfen Standart Model'i kullanın.

Bu sorun yalnızca UE 5.2'ye özgüdür ve diğer motor sürümlerini etkilemez.

Performans Önerileri

  • Çoğu proje için Standart Model, kalite ve performans arasında mükemmel bir denge sağlar
  • MetaHuman karakterler için en yüksek görsel kaliteye ihtiyaç duyduğunuzda Gerçekçi Model'i kullanın
  • Uygulamanız için duygusal ifade kontrolü önemli olduğunda Ruh Hali Etkin Gerçekçi Model'i kullanın
  • Modeller arasında seçim yaparken hedef platformunuzun performans yeteneklerini göz önünde bulundurun
  • Belirli kullanım durumunuz için en iyi dengeyi bulmak için farklı optimizasyon seviyelerini test edin

TTS Uyumluluğu

Model TürüYerel TTS Desteği (Runtime Text To Speech aracılığıyla)Harici TTS DesteğiNotlar
Standart Model✅ Tam destek✅ Tam destekTüm TTS seçenekleriyle uyumlu
Gerçekçi Model❌ Sınırlı destek✅ Tam destekONNX çalışma zamanı yerel TTS ile çakışıyor
Ruh Hali Etkin Gerçekçi Model✅ Tam destek✅ Tam destekTüm TTS seçenekleriyle uyumlu

Sorun Giderme

Yaygın Sorunlar

Gerçekçi Modeller için Üreteç Yeniden Oluşturma: Gerçekçi Modellerle güvenilir ve tutarlı çalışma için, bir süre hareketsizlikten sonra yeni ses verisi beslemek istediğinizde üreteci her seferinde yeniden oluşturmanız önerilir. Bunun nedeni, sessizlik dönemlerinden sonra üreteçleri yeniden kullanırken dudak senkronizasyonunun çalışmayı durdurmasına neden olabilen ONNX çalışma zamanı davranışıdır.

Yerel TTS Uyumluluğu: Runtime Text To Speech eklentisi tarafından sağlanan yerel TTS, ONNX çalışma zamanı çakışmaları nedeniyle şu anda normal Gerçekçi model ile desteklenmemektedir. Ancak, hem Standart model hem de Ruh Hali Etkin Gerçekçi model ile tamamen uyumludur. TTS işlevselliği ile özellikle normal Gerçekçi modele ihtiyacınız varsa harici TTS hizmetlerini kullanın.

Dudak Senkronizasyonu Tepki Süresinde Bozulma: Streaming Sound Wave veya Capturable Sound Wave kullanırken dudak senkronizasyonunun zamanla daha az duyarlı hale geldiğini fark ederseniz, bu bellek birikiminden kaynaklanıyor olabilir. Varsayılan olarak, yeni ses eklendiğinde bellek her seferinde yeniden tahsis edilir. Bu sorunu önlemek için, biriken belleği serbest bırakmak için ReleaseMemory işlevini periyodik olarak (örneğin her 30 saniyede bir) çağırın.

Performans Optimizasyonu:

  • Gerçekçi modeller için İşleme Parça Boyutu'nu performans gereksinimlerinize göre ayarlayın
  • Hedef donanımınız için uygun iş parçacığı sayılarını kullanın
  • Tam yüz animasyonuna ihtiyaç duyulmadığında, ruh hali etkin modeller için Yalnızca Ağız çıktı türünü kullanmayı düşünün