Berta Sándor
Stabilabbak lehetnek a videotelefon-beszélgetések
Mindez az nVidia által kifejlesztett Maxine mesterséges intelligencia platform segítségével válik lehetővé.
Az új rendszer a felvételek tömörítését nem a klasszikus videokodekek, hanem neurális hálózatok segítségével végzi. Az új fejlesztéshez számos érdekes funkció is társul, azok egyike például a digitális ruházat vagy a virtuális hajstílusok alkalmazása a saját videoavatár esetében.
Arun Mallya, az nVidia kutatója kijelentette, hogy a mesterséges intelligencia bevonásával egy jobb videokommunikációs élményt akarnak biztosítani a felhasználók számára azért, hogy akár azok az emberek is átválthassanak a videotelefon-beszélgetésekre, akiknek csupán nagyon kis sávszélességek állnak rendelkezésre. A Maxine a teljes képek helyett csupán egy kompakt adatcsomagot továbbít, az utóbbiban csak az arc bizonyos fő területei, például a szemek, a száj és az orr szerepelnek. A teljes képek rekonstrukciójához a címzett számítógépén vagy okostelefonján az úgynevezett Generative Adversarial Network (GAN) lép működésbe. A két neurális hálózat munkájához a rendelkezésre álló grafikus chipek számítási teljesítménye bőven elegendő. A kisebb küldött adatmennyiségnek köszönhetően stabilabb videotelefon-kapcsolatok alakíthatók ki, miközben a hagyományos videotelefon-beszélgetésekhez szükséges sávszélességnek csak a tíz százalékát igényli a Maxine.
Ting-Chun Wang, az nVidia munkatársa hozzátette, hogy a megoldás előnye még, hogy lehetővé teszi az eddiginél természetesebb videotelefon-beszélgetések lefolytatását azáltal, hogy úgy tűnik, mint ha mind a két fél közvetlenül a kamerába nézne.
Az új rendszer a felvételek tömörítését nem a klasszikus videokodekek, hanem neurális hálózatok segítségével végzi. Az új fejlesztéshez számos érdekes funkció is társul, azok egyike például a digitális ruházat vagy a virtuális hajstílusok alkalmazása a saját videoavatár esetében.
Arun Mallya, az nVidia kutatója kijelentette, hogy a mesterséges intelligencia bevonásával egy jobb videokommunikációs élményt akarnak biztosítani a felhasználók számára azért, hogy akár azok az emberek is átválthassanak a videotelefon-beszélgetésekre, akiknek csupán nagyon kis sávszélességek állnak rendelkezésre. A Maxine a teljes képek helyett csupán egy kompakt adatcsomagot továbbít, az utóbbiban csak az arc bizonyos fő területei, például a szemek, a száj és az orr szerepelnek. A teljes képek rekonstrukciójához a címzett számítógépén vagy okostelefonján az úgynevezett Generative Adversarial Network (GAN) lép működésbe. A két neurális hálózat munkájához a rendelkezésre álló grafikus chipek számítási teljesítménye bőven elegendő. A kisebb küldött adatmennyiségnek köszönhetően stabilabb videotelefon-kapcsolatok alakíthatók ki, miközben a hagyományos videotelefon-beszélgetésekhez szükséges sávszélességnek csak a tíz százalékát igényli a Maxine.
Ting-Chun Wang, az nVidia munkatársa hozzátette, hogy a megoldás előnye még, hogy lehetővé teszi az eddiginél természetesebb videotelefon-beszélgetések lefolytatását azáltal, hogy úgy tűnik, mint ha mind a két fél közvetlenül a kamerába nézne.