Microsoft umí v reálném čase rozhýbat fotku podle audia. Je to tak dobré, že to raději nikomu nedá
Datum publikování: 18. 4. 2024
Asijská pobočka Microsoft Research zveřejnila svůj framework VASA-1, který z jediné fotografie či klidně jen nakresleného obrázku a audio stopy vytvoří reálně působící video mluvící postavy. Hlavní inovací jsou pokročilé možnosti animace přenášející emoce a pohyby hlavy pro přirozeně působící ...