SG.hu

Az Adobe licencelt tartalmakon képzett MI videógenerátort mutatott be

Az Adobe bejelentette a Firefly Video Model nevű új, mesterséges intelligenciával működő szövegből videót generáló eszközt. Ez az OpenAI, a Runway, a Google és a Meta hasonló ajánlataihoz csatlakozik az egyre zsúfoltabb mezőnyben. A versenytársaktól eltérően az Adobe azt állítja, hogy a Firefly Video Model kizárólag licencelt tartalmakon lett képezve, így elkerülhetők azok az etikai és szerzői jogi problémák, amelyek más generatív MI-eszközöket sújtanak.

A licencelt képzési adatok miatt az Adobe a Firefly Video Modelt „az első olyan nyilvánosan elérhető videomodellnek nevezi, amelyet úgy terveztek, hogy kereskedelmi szempontból biztonságos legyen”. A San Jose-i, kaliforniai székhelyű szoftvercég azonban nem jelentett be megjelenési dátumot, és a béta tesztidőszak alatt csak a várólistán szereplők számára biztosít hozzáférést. A legalább 2023 áprilisa óta készülő új modell az Adobe által a Firefly képszintetizáló modelljeihez kifejlesztett technikákra épül. Akárcsak a szövegből képet generáló eszközt - amelyet a vállalat később a Photoshopba integrált -, az Adobe a Firefly videomodellt is a médiaszakembereknek, például videók készítőinek és szerkesztőinek szánja. A vállalat állítása szerint modellje olyan felvételeket képes előállítani, amelyek zökkenőmentesen illeszkednek a hagyományosan létrehozott videótartalmakhoz.


Az Adobe kifejezetten "kereskedelmi szempontból biztonságos" média létrehozására tervezte a Firefly-t. A vállalat nem képezte ki a Firefly-t olyan képekre és videókra, amelyek kábítószert, meztelenséget, erőszakot, politikai szereplőket vagy szerzői jogvédelem alatt álló anyagokat tartalmaznak. A modell a felkérés specifikációitól függően animált tartalmakat és fotórealisztikus médiát egyaránt létre tud hozni. A Firefly - legalábbis elméletben - képes szöveges videók készítésére is, amivel a mesterséges intelligenciával működő képgenerátorok történelmileg nehezen boldogultak. A Firefly videós webes alkalmazás tartalmazza a kamerapásztázások, a kameramozgás intenzitásának, a szögnek és a felvett képméretnek a beállításait.

A Premiere Pro béta alkalmazásban a felhasználók kipróbálhatják a Firefly Generative Extend funkcióját, amellyel akár két másodperccel is meghosszabbíthatják a videoklipeket. A funkció célja, hogy a kamera és a téma mozgását folytatva egy extra ütemet generáljon egy jelenetben. Ilyenkor a háttérhang is meghosszabbításra kerül - a nagyközönség első ízben kaphat ízelítőt az Adobe által csendben kidolgozott MI hangmodellből. A háttérhang-kiterjesztés azonban nem fog hangokat vagy zenét újrateremteni, hogy elkerülje a lemezkiadók szerzői jogi pereit.

Az Adobe azt állítja, hogy nagyobb hangsúlyt fektetett az MI szerkesztési funkciókra, mint az MI videók létrehozására, valószínűleg azért, hogy a felhasználói bázisának kedvében járjon. "A mi közönségünk a világ legpixelkényesebb közönsége” - mondta Alexandru Costin, az Adobe generatív AI-ért felelős alelnöke. "Azt akarják, hogy az MI segítsen nekik a meglévő eszközök bővítésében, variációk létrehozásában vagy szerkesztésében, nem pedig új eszközök generálásában. Tehát számunkra nagyon fontos, hogy először a generatív szerkesztést végezzük el, és majd csak utána a generatív létrehozást." Bár az Adobe még nem nevezett meg olyan ügyfeleket, akik használják, a Reuters jelentése szerint néhány nagy márka már bevetette a képgeneráló technológiát. A PepsiCo-hoz tartozó Gatorade azt tervezi, hogy az Adobe MI-modelljét egy egyedi palacktervezési weboldalhoz használja. A Mattel az Adobe eszközeit használja a Barbie-termékek csomagolásának tervezéséhez.


Az Adobe a hírek szerint 3 dollárt fizet a fotósoknak és művészeknek minden egyes perc videóért, amelyet a Firefly AI modell képzése céljából küldenek be. A Firefly automatikusan beilleszt egy vízjelet az így létrehozott videók metaadataiba. Az ötlet lényege, hogy a platformok vagy magánszemélyek - amennyiben a tartalom tartalmazza a megfelelő metaadat vízjeleket - az ilyen MI-azonosító eszközöket használhatják annak meghatározására, hogy mi hiteles és mi nem. Az Adobe videói azonban alapértelmezés szerint nem lesznek látható címkékkel ellátva, amelyek az emberek számára könnyen olvasható módon tisztázzák, hogy mesterséges intelligencia által generáltak.

Az Adobe még komoly vállalati támogatás mellett is jelentős ellenállásba ütközhet az MI-videógenerátorral egyes kreatívok körében. Sok alkotó nem örül annak, hogy a mesterséges intelligencia funkciók hamarosan felváltják azt a munkát, amelyet évtizedek óta egérrel, billentyűzettel és tollal végeznek. Júniusban az OpenAI Sora videomodelljével készített, mesterséges intelligenciával generált Toys „R” Us reklámfilm negatív reakciókat váltott ki az online kommentelőkből, akik gyakran kritizálják a mesterséges intelligencia-generált eszközök használatának etikáját és a kimenetek minőségét. "Gúnyolódjatok csak a Toys 'R' Us mesterséges intelligenciával készített szpotján, de ez csak a kezdet” - írta egy Dan Goldgeier nevű reklámszövegíró. "A legtöbb fogyasztó nem fogja felismerni a különbséget, vagy nem fogja érdekelni, és a legtöbb marketinges több mint boldog lesz, ha kevesebb pénzért készíthet egy ilyen szpotot”.


Mindazonáltal Alexandru Costin azt üzeni az érintett kreatívoknak, hogy a generatív MI-eszközök nagyobb keresletet fognak teremteni a munkájuk iránt, nem pedig kevesebbet: "Ha belegondolunk a vállalatok azon igényeibe, amelyek személyre szabott és hiper-személyre szabott tartalmat akarnak létrehozni a velük kapcsolatba lépő bármely felhasználó számára, akkor ez végtelen kereslet.” Az Adobe MI vezetője szerint az embereknek figyelembe kellene venniük, hogy más technológiai forradalmak hogyan tettek jót, és az MI-eszközök megjelenését a digitális kiadáshoz és a digitális fényképezéshez hasonlítja. Megjegyzi, hogy ezeket az áttöréseket eredetileg fenyegetésnek tekintették, és azt mondja, ha a kreatívok elutasítják az MI-t, akkor nehéz dolguk lesz. "Használja ki a generatív képességeket, hogy feljebb lépjen, és olyan kreatív szakemberré váljon, aki százszor több tartalmat tud létrehozni ezekkel az eszközökkel” - mondta Costin. "A tartalom iránti igény megvan, és most már az életed feláldozása nélkül is legyárthatod. Fogadd el a technológiát. Ez az új digitális írástudás.”

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Tetsuo #1
    A licencelt fonalgombolyag jobb minőségű?