Sg.hu - Bárkiből profi hangmérnököt csinál az Adobe új MI-szoftvere

2024. február 29. 9:03, csütörtök

SG.hu

Bárkiből profi hangmérnököt csinál az Adobe új MI-szoftvere

Az Adobe reményei szerint új generatív MI eszközük lesz a zenészek Photoshopja: szöveges parancsokkal generálhatunk hangokat, melyeket utána kedvünk szerint alakíthatunk tovább.

Az Adobe legújabb generatív MI-projektjének célja, hogy segítsen az embereknek zenét készíteni és testre szabni anélkül, hogy bármilyen professzionális hagmérnöki tudásuk lenne. A brooklyni Hot Pod Summiton bejelentett Project Music GenAI Control még csak prototípus, de már most lehetővé teszi a felhasználók számára, hogy szöveges utasítások segítségével zenét generáljanak, majd az eredményt módosítsák anélkül, hogy átváltanának egy dedikált szerkesztőprogramra.

Először is meg kell adni, hogy milyen stílusú zenét szeretnénk generálni, például "boldog dance" vagy "szomorú jazz". Az integrált szerkesztési vezérlők lehetővé teszik a felhasználók számára, hogy testre szabják ezeket az eredményeket, beállíthatnak ismétlődő mintákat, tempót, intenzitást és struktúrát. A zenei szakaszok újrakeverhetők, és a hang ismétlődhet, ha valakinek például háttérzenére van szüksége a tartalomkészítéshez. Az Adobe szerint az eszköz képes a generált hangot egy referencia-dallam alapján előállítani és meghosszabbítani a hangklipek hosszát olyan dolgokhoz, mint például egy rögzített animáció vagy podcast-szegmensek. A generált hang szerkesztésének tényleges felhasználói felületét még nem fedte fel a cég.

Az Adobe a nyilvános Project Music GenAI Control demóhoz közkincsnek számító tartalmakat töltött fel, de az nem világos, hogy az eszköz lehetővé teszi-e bármilyen hanganyag közvetlen feltöltését az eszközbe referenciaanyagként, vagy hogy milyen klipek hosszabbíthatók meg.

Bár hasonló eszközök már elérhetőek vagy fejlesztés alatt állnak - mint például a Google MusicLM és a Meta nyílt forráskódú AudioCraft -, ezek csak azt teszik lehetővé, hogy a felhasználók szöveges utasításokon keresztül hangot generáljanak, és alig vagy egyáltalán nem támogatják a zenei kimenet szerkesztését. Ez azt jelenti, hogy addig kell a semmiből generálni a hangot, amíg az ember el nem éri a kívánt eredményt, vagy kézzel, hangszerkesztő szoftverrel kell elvégeznie a szerkesztést. "A legizgalmasabb dolog ezekben az új eszközökben az, hogy nem csak a hanggenerálásról szólnak" - mondta Nicholas Bryan, az Adobe Research vezető kutatója. "A kreatívok számára ugyanolyan mélyreható irányítást biztosítanak a hang formálásához, finomításához és szerkesztéséhez, mint a Photoshop. Ez egyfajta pixel-szintű vezérlés a zenéhez."

Az Adobe a Project Music GenAI-t a Kaliforniai Egyetemmel és a Carnegie Mellon Egyetem Számítástechnikai Karával együttműködve fejleszti. A társaság "korai fázisú" kísérletnek nevezi, így bár ezek a funkciók beépülhetnek majd a vállalat meglévő szerkesztőeszközeibe, például az Auditionbe és a Premiere Pro-ba, de ez még eltart egy ideig. Az eszköz egyelőre nem elérhető a nyilvánosság számára, és nem jelentettek be megjelenési dátumot sem.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)

Tetsuo #7 2024.03.03. 16:57

Nem tudom hány éves vagy, a naivitásod, happyendizmusod örvendetes, viszont a valóságtól messze van.
Amiről egyáltalán nem veszel tudomást az az, hogy az emberek többsége, a csőcselék igénytelen, ráadásul egyre igénytelenebb. Az AI egy idő után simán átveszi a művészek szerepét nem csak az audió de a vizualitás terén is. Az embereket nem fogja meghatni, hogy nem valós személyek kreálják a sok szutykot, amit általában fogyasztanak.
Te lehet hogy ragaszkodsz a hús-vér előadókhoz (én meg pláne, nekem az általad felsoroltak is AI-kategória), de nem mi leszünk kiszolgálva, hanem a tömeg. Ezért züllik általában a kultúra...

Válasz 'reptile1313' üzenetére (#6)

https://www.youtube.com/shorts/zECTF2H8Jp8
reptile1313 #6 2024.03.03. 14:24

"Egyébként keverést meg utómunkát is végezhet az AI idővel, hiszen ott is adott szabályoknak kell megfelelni"

Igen a maradek 5-10 %ot, ami mastering, stereo image, spektrum balance, viszont sound design szinten, ahol tobb szaz %okat is valtozik a hang, ott nincs sok eselye.
Hacsak nem etetnek meg vele mindent, akkor masolni tud majd barmit, viszont ha erre kepes, akkor az emberek is tobbre lesznek kepesek.
Tehat, amikor az AI es az ember kollaboral.
AI + ember > AI
AI + ember > ember

Ergo mindenki nyer vele azok kozul, aki profi, es jo izlessel rendelkezik, es AI nelkul is jokat csinal. az AI-jal inkabb a bufeszakosok, es az amugyis izles nelkuli pancserek vesztenek piacot, hiszen ok se egyedul, se AI-jal nem tudnak jot csinalni, oket fogja helyettesiteni az AI, sot rajuk ver par nagysagrendet :)

Igy van ez minden szakmaban, a programozok kozul is a copy paste kodolokat helyettesiti, illetve azokat akik robotikus muveleteket csinaltak csak.
Aki meg amugy is zsenialis programozo, az felgyorsul az AI-jal, hiszen a robotikus unalmas dolgokat megcsinaltatja vele, es marad ido a muveszi kodokra, amit az AI fel sem tud fogni, hacsak nem kap meg 2 haztombnyi NVIdea magot, de az meg nem kifizetodo.
AI + ember mindig tobb lesz, mint csak az AI, ha az ember onalloan intelligens/intuitiv.
Utoljára szerkesztette: reptile1313, 2024.03.03. 14:28:19

Válasz 'Tetsuo' üzenetére (#4)
reptile1313 #5 2024.03.03. 14:18

Ahhoz,hogy zenet irj, foleg pop zenet, eleg egy egyszeru dallam, amit akarki el tud futyulni. 95%ban a pop zene a sound. Ahhoz igenis hangmernoknek kell inkabb lenni, profinak pofatlanul jo izlessel. Persze vannak komplexebb pop zenek is. Oda osszhangzattan/dallam is kell ES sound.
Emellett ez a f.s App hangszint is tud generalni.
Mondom, nem ezzel van a baj, hanem azzal,hogy profinak allitanak be egy junk Appot. Amikor ilyen szintu soundot, akarki tud csinalni random presetekkel. ;)

"Az igényteleneknek, tehát az emberek többségének elég lesz bőven."
Az,hogy par embernek ez eleg, semmit nem jelent, mert senki nem fog ra(juk) klikkelni.

Lady Gagara is azert klikkelnek ennyien, mert olyan b.szottul jol szol,hogy egy tescos hangfalon is hallatszik a morgos bass, es a nyalcsorgatoan organikus / analog sound. Vagy lehet digitalis szinti soundot is jol csinalni, ha valaki profi, de arra nem klikkelnek annyiran mint egy organikus TRONos Daft Punkos SAWre / 303ra.

Utoljára szerkesztette: reptile1313, 2024.03.03. 14:21:55

Válasz 'Tetsuo' üzenetére (#4)
Tetsuo #4 2024.03.03. 10:07

A cikk a zeneírásról szól, nem a hangmérnöki munkáról. Tehát zeneíróként akarják használni az AI-t, különböző sablonokat összerakosgatva, adott zsánerre jellemző szabályoknak megfelelve. Nem lesz egyik mű sem korszakalakotó, hanem középszerű, tök átlagos mindegyik. Már ha rendesen működik majd. Lássuk be, a mai popkoltúrában nagyjából erre is van igény.
Egyébként keverést meg utómunkát is végezhet az AI idővel, hiszen ott is adott szabályoknak kell megfelelni - igaz, mindenféle művészi érték nélkül végzi majd el. Az igényteleneknek, tehát az emberek többségének elég lesz bőven.
Én maradok a régi lemezeknél.

Válasz 'reptile1313' üzenetére (#3)

https://www.youtube.com/shorts/zECTF2H8Jp8
reptile1313 #3 2024.03.03. 09:45

A hangmernokbol tobbfele van. Van a zenei hangmernok, az pl felveszi a studioban az anyagot.
Van az aki kever. Van aki masterel. Van aki sound designer iranyba ment el. Es van az aki kicsit mindegyik, dallamot ritmikat ir, es meg egyben kever is.

A cikkel ott van a baj, ami hazugsag, es egy atlagos embert megvezet, hogy profi hangmernokot mondanak, hogy azt helyettesiti. megneznem, hogy az MI mikor keverne, masterelne ugy egy zenet, hogy ugy szoljon,mint az a zene, amit pl Silk (Sellyei Tamas) kevert. (Meg amikor elt a mester...)
Vagy megneznem mikor alkot akkorat egy ilyen f.s app, mint Redone(Lady Gaga), Dr Luke(hosszu lenne felsorolni), Billie Eilish & testvere, Ramin Djawadi, Harry Gregson Williams, Charlie Clouser, Hans Zimmer, Grayson Matthew etc.
Utoljára szerkesztette: reptile1313, 2024.03.03. 09:49:08

Válasz 'Tetsuo' üzenetére (#1)
reptile1313 #2 2024.03.03. 09:40

Meghallgattam, jot rohogtem. Az ugyvedeket, oltonyosoket, robotmelokat, dietetikusokat siman lecsereli sot ubereli az AI, de a muveszeket nem.
(Najo a jobb eletmodorvosokat mint pl Dr Marky Adam, vagy a jobb gasztroenterologusokat, mint Dr Schwab Richard nem tudna helyettesiteni, de egy emberek eletet tonkretevo ketost, paleost (=kuruzslot, sarlatant), vagy atlagos 50 evvel elmaradott "expertet" siman uberel, es jobb tanacsot ad, elobb biznam ra magam egy AIra,mint egy atlagos orvosra.)

Utoljára szerkesztette: reptile1313, 2024.03.03. 09:41:38
Tetsuo #1 2024.03.01. 15:57

A hangmérnök nem zenét ír, hanem keveri azt és utómunkálja.
Aztán ha AI ír zenét különböző stílusorientált sablonokból, az az igazi vagy "komolyabb" művészeket nem veszélyezteti, de a sok percembert igen - amivel semmi gond szerintem.

https://www.youtube.com/shorts/zECTF2H8Jp8

További bejegyzések a fórumban...