Berta Sándor

Stabilabbak lehetnek a videotelefon-beszélgetések

Mindez az nVidia által kifejlesztett Maxine mesterséges intelligencia platform segítségével válik lehetővé.

Az új rendszer a felvételek tömörítését nem a klasszikus videokodekek, hanem neurális hálózatok segítségével végzi. Az új fejlesztéshez számos érdekes funkció is társul, azok egyike például a digitális ruházat vagy a virtuális hajstílusok alkalmazása a saját videoavatár esetében.

Arun Mallya, az nVidia kutatója kijelentette, hogy a mesterséges intelligencia bevonásával egy jobb videokommunikációs élményt akarnak biztosítani a felhasználók számára azért, hogy akár azok az emberek is átválthassanak a videotelefon-beszélgetésekre, akiknek csupán nagyon kis sávszélességek állnak rendelkezésre. A Maxine a teljes képek helyett csupán egy kompakt adatcsomagot továbbít, az utóbbiban csak az arc bizonyos fő területei, például a szemek, a száj és az orr szerepelnek. A teljes képek rekonstrukciójához a címzett számítógépén vagy okostelefonján az úgynevezett Generative Adversarial Network (GAN) lép működésbe. A két neurális hálózat munkájához a rendelkezésre álló grafikus chipek számítási teljesítménye bőven elegendő. A kisebb küldött adatmennyiségnek köszönhetően stabilabb videotelefon-kapcsolatok alakíthatók ki, miközben a hagyományos videotelefon-beszélgetésekhez szükséges sávszélességnek csak a tíz százalékát igényli a Maxine.

Ting-Chun Wang, az nVidia munkatársa hozzátette, hogy a megoldás előnye még, hogy lehetővé teszi az eddiginél természetesebb videotelefon-beszélgetések lefolytatását azáltal, hogy úgy tűnik, mint ha mind a két fél közvetlenül a kamerába nézne.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • kvp #1
    Ez nem videotelefon beszelgetes, gyakorlatilag egy valosideju motion capture alapjan mozgatott digitalis avatar, amire mondjuk volt mar pelda a Jetson csaladban is, de innentol semmi nem garantalja, hogy a digitalis avatar forras ordalan tenyleg az a szemely van akinek az avtar-jat latjuk. Mondjuk a Jetson-os felhasznalasra, tehat az agybol eppen kikelve, rendezetlen hajjal, mosakodas nelkul, pizsamaban is tokeletes kepet mutatni egy videohivasban pont jo lesz. Csak hat eppen a videohivas lenyege veszik el igy, mert ennyi erovel egy muppet figura is tatoghatna a kepernyon. (ahogy pl. az Apple facetime-ja mar jelenleg is kepes erre, ott a lejatszo es a motion capture mar megvan, csak az automatikus digitalis avatar generalas hianyzik hozza)