SG.hu

MI-vel fordítja le dokumentumfilmjeit az IMAX hálózat

Mivel a globális tartalomfogyasztás növekszik, és a nem angol nyelvű tartalmak iránti kereslet meghaladja az angol nyelvű filmek és műsorok iránti keresletet, az IMAX MI-t használ tartalmainak lokalizációjára.

A PwC jelentése szerint a szórakoztató- és médiaipar 5%-kal, 2,8 billió dollárra nőtt 2023-ra. Az iparág várhatóan tovább bővül, bár a következő öt évben szerény, közel 4%-os, 3,4 billió dollárra emelkedő éves összetett növekedési ütemmel számolnak. A nem angol nyelvű tartalmak még az angol piacokon is gyorsan növekednek, beleértve az Egyesült Államokat, az Egyesült Királyságot, Ausztráliát és Kanadát. Tavaly a Netflix arról számolt be, hogy az elmúlt három évben 90%-kal nőtt a nem angol nyelvű tartalmak nézettsége az Egyesült Királyságban. Az IMAX mindezt figyelembe véve azt vizsgálja, hogy MI segítségével megoldható-e a lokalizáció, hogy még több nézőhöz jussanak el tartalmai.

A hatalmas mozijairól és magával ragadó filmélményeiről ismert kanadai produkciós mozitársaság bejelentette, hogy partnerséget kötött a dubaji Camb.ai startuppal, hogy annak MI beszédmodelljeit eredeti tartalmak, köztük dokumentumfilmek fordítására használja. A Camb.ai már használt MI szinkront és beszédfordítást élő sportesemények és bajnokságok, köztük az Australian Open, az Eurovision Sport és a Major League Soccer számára. A cég Boli nevű modelljét beszédből szöveges leirat készítésére, Mars modelljét pedig beszédemulációra kínálja. A modellek a startup DubStudio platformján keresztül érhetők el, amely 140 nyelvet támogat, köztük számos olyan szűk körben beszélt nyelvet, amelyekről nem állnak rendelkezésre jelentős mennyiségű adatok az interneten.

"Az olyan cégeknek, mint az OpenAI és az Anthropic más elképzelésük van a társadalomról” - mondta Akshat Prakash, a Camb.ai társalapítója és műszaki igazgatója. "Olyan modelleket próbálnak építeni, amelyek nagyon horizontálisak, és a feladatok széles skáláját képesek lefedni. Nekünk egyáltalán nem kell ezt tennünk. Néhány modellünk kevesebb mint 100 millió paramétert tartalmaz, és szuper specializált”. Prakash korábban az Apple mérnökeként dolgozott a Siri számára AI- és ML-modelleket fejlesztő csapatban. Tavaly alapította meg édesapjával, Avneesh Prakash-szal a Camb.ai-t. "Egy generációnyira vagyunk egymástól, és Indiában nőttünk fel. Harminc év különbséggel ugyanazokkal a nyelvi kihívásokkal találkoztunk” - mondta a technológiai igazgató.

A Camb.ai a modelljeinek 70%-át olyan akadémiai licencű adathalmazok felhasználásával képezte, amelyek kereskedelmi forgalomban is felhasználhatók. A fennmaradó 30% az adatok finomhangolását jelenti, amelyeket partnereken keresztül kap, akik a modelljeit MI-alapú szinkronizáláshoz és fordításhoz alkalmazzák. "Amit nem teszünk, és nagyon óvatosak voltunk, mert teljesen elkerültük, az az internet teljes letöltése” - állította Prakash. „Egyes vállalatok úgy érzik, hogy megúszhatják a szerzői jogsértéseket, mert egy fogyasztóbarát alkalmazást vagy eszközt építenek, és úgy gondolják, hogy az internet 10 petabájtnyi részének helyben tárolása rendben van.”


A Camb.ai „háromrétegű” megközelítést alkalmaz az MI-alapú fordítás biztosításához, amely a Boli és a Mars modellek alaprétegéből, az ezeket az MI-modelleket befogadó infrastrukturális rétegből, majd a DubStudio platformból áll a front endhez. Más MI-alapú modellekkel ellentétben Boli a bemeneti beszédjeleket veszi, a kimeneti szövegjeleket a lefordított nyelven állítja elő, és megtartja az árnyalatokat, állítja Prakash. Miután a Boli létrehozta a szöveget, a Mars lefordítja a szöveget beszédre, ugyanazt a bemeneti hangjelet használva, hogy rögzítse a tényleges hangot, beleértve a környezeti zajokat, például a sportesemények esetében a közönség szurkolásának háttérzsongását - mondta. A Camb.ai technológiája akár 10 nyelven biztosít beszédfordítást egyidejűleg, 20-30 másodperces késleltetéssel, amit a streaming és műsorszórás rövid késleltetése elrejthet.

Az IMAX az MI-fordításokat fokozatosan fogja bevezetni, kezdve a nagy forrásigényű nyelvekkel. A telepítésre a Camb.ai technológiájának az eredeti tartalmakon végzett belső tesztelése után kerül sor. "Bár a partnerségnek még csak a kezdeti szakaszában vagyunk, továbbra is együtt fogunk dolgozni, hogy jobban feltárjuk a benne rejlő lehetőségeket, és hogy hogyan tud minket a legjobban előrevinni” - mondta Mark Welton, az IMAX Global Theatres elnöke. Welton jelezte, hogy a mesterséges intelligencia bevezetése segít nekik a fordítási költségek megtakarításában.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
Nem érkezett még hozzászólás. Legyél Te az első!