SG.hu
Bárkiből profi hangmérnököt csinál az Adobe új MI-szoftvere
Az Adobe reményei szerint új generatív MI eszközük lesz a zenészek Photoshopja: szöveges parancsokkal generálhatunk hangokat, melyeket utána kedvünk szerint alakíthatunk tovább.
Az Adobe legújabb generatív MI-projektjének célja, hogy segítsen az embereknek zenét készíteni és testre szabni anélkül, hogy bármilyen professzionális hagmérnöki tudásuk lenne. A brooklyni Hot Pod Summiton bejelentett Project Music GenAI Control még csak prototípus, de már most lehetővé teszi a felhasználók számára, hogy szöveges utasítások segítségével zenét generáljanak, majd az eredményt módosítsák anélkül, hogy átváltanának egy dedikált szerkesztőprogramra.
Először is meg kell adni, hogy milyen stílusú zenét szeretnénk generálni, például "boldog dance" vagy "szomorú jazz". Az integrált szerkesztési vezérlők lehetővé teszik a felhasználók számára, hogy testre szabják ezeket az eredményeket, beállíthatnak ismétlődő mintákat, tempót, intenzitást és struktúrát. A zenei szakaszok újrakeverhetők, és a hang ismétlődhet, ha valakinek például háttérzenére van szüksége a tartalomkészítéshez. Az Adobe szerint az eszköz képes a generált hangot egy referencia-dallam alapján előállítani és meghosszabbítani a hangklipek hosszát olyan dolgokhoz, mint például egy rögzített animáció vagy podcast-szegmensek. A generált hang szerkesztésének tényleges felhasználói felületét még nem fedte fel a cég.
Az Adobe a nyilvános Project Music GenAI Control demóhoz közkincsnek számító tartalmakat töltött fel, de az nem világos, hogy az eszköz lehetővé teszi-e bármilyen hanganyag közvetlen feltöltését az eszközbe referenciaanyagként, vagy hogy milyen klipek hosszabbíthatók meg.
Bár hasonló eszközök már elérhetőek vagy fejlesztés alatt állnak - mint például a Google MusicLM és a Meta nyílt forráskódú AudioCraft -, ezek csak azt teszik lehetővé, hogy a felhasználók szöveges utasításokon keresztül hangot generáljanak, és alig vagy egyáltalán nem támogatják a zenei kimenet szerkesztését. Ez azt jelenti, hogy addig kell a semmiből generálni a hangot, amíg az ember el nem éri a kívánt eredményt, vagy kézzel, hangszerkesztő szoftverrel kell elvégeznie a szerkesztést. "A legizgalmasabb dolog ezekben az új eszközökben az, hogy nem csak a hanggenerálásról szólnak" - mondta Nicholas Bryan, az Adobe Research vezető kutatója. "A kreatívok számára ugyanolyan mélyreható irányítást biztosítanak a hang formálásához, finomításához és szerkesztéséhez, mint a Photoshop. Ez egyfajta pixel-szintű vezérlés a zenéhez."
Az Adobe a Project Music GenAI-t a Kaliforniai Egyetemmel és a Carnegie Mellon Egyetem Számítástechnikai Karával együttműködve fejleszti. A társaság "korai fázisú" kísérletnek nevezi, így bár ezek a funkciók beépülhetnek majd a vállalat meglévő szerkesztőeszközeibe, például az Auditionbe és a Premiere Pro-ba, de ez még eltart egy ideig. Az eszköz egyelőre nem elérhető a nyilvánosság számára, és nem jelentettek be megjelenési dátumot sem.
Az Adobe legújabb generatív MI-projektjének célja, hogy segítsen az embereknek zenét készíteni és testre szabni anélkül, hogy bármilyen professzionális hagmérnöki tudásuk lenne. A brooklyni Hot Pod Summiton bejelentett Project Music GenAI Control még csak prototípus, de már most lehetővé teszi a felhasználók számára, hogy szöveges utasítások segítségével zenét generáljanak, majd az eredményt módosítsák anélkül, hogy átváltanának egy dedikált szerkesztőprogramra.
Először is meg kell adni, hogy milyen stílusú zenét szeretnénk generálni, például "boldog dance" vagy "szomorú jazz". Az integrált szerkesztési vezérlők lehetővé teszik a felhasználók számára, hogy testre szabják ezeket az eredményeket, beállíthatnak ismétlődő mintákat, tempót, intenzitást és struktúrát. A zenei szakaszok újrakeverhetők, és a hang ismétlődhet, ha valakinek például háttérzenére van szüksége a tartalomkészítéshez. Az Adobe szerint az eszköz képes a generált hangot egy referencia-dallam alapján előállítani és meghosszabbítani a hangklipek hosszát olyan dolgokhoz, mint például egy rögzített animáció vagy podcast-szegmensek. A generált hang szerkesztésének tényleges felhasználói felületét még nem fedte fel a cég.
Az Adobe a nyilvános Project Music GenAI Control demóhoz közkincsnek számító tartalmakat töltött fel, de az nem világos, hogy az eszköz lehetővé teszi-e bármilyen hanganyag közvetlen feltöltését az eszközbe referenciaanyagként, vagy hogy milyen klipek hosszabbíthatók meg.
Bár hasonló eszközök már elérhetőek vagy fejlesztés alatt állnak - mint például a Google MusicLM és a Meta nyílt forráskódú AudioCraft -, ezek csak azt teszik lehetővé, hogy a felhasználók szöveges utasításokon keresztül hangot generáljanak, és alig vagy egyáltalán nem támogatják a zenei kimenet szerkesztését. Ez azt jelenti, hogy addig kell a semmiből generálni a hangot, amíg az ember el nem éri a kívánt eredményt, vagy kézzel, hangszerkesztő szoftverrel kell elvégeznie a szerkesztést. "A legizgalmasabb dolog ezekben az új eszközökben az, hogy nem csak a hanggenerálásról szólnak" - mondta Nicholas Bryan, az Adobe Research vezető kutatója. "A kreatívok számára ugyanolyan mélyreható irányítást biztosítanak a hang formálásához, finomításához és szerkesztéséhez, mint a Photoshop. Ez egyfajta pixel-szintű vezérlés a zenéhez."
Az Adobe a Project Music GenAI-t a Kaliforniai Egyetemmel és a Carnegie Mellon Egyetem Számítástechnikai Karával együttműködve fejleszti. A társaság "korai fázisú" kísérletnek nevezi, így bár ezek a funkciók beépülhetnek majd a vállalat meglévő szerkesztőeszközeibe, például az Auditionbe és a Premiere Pro-ba, de ez még eltart egy ideig. Az eszköz egyelőre nem elérhető a nyilvánosság számára, és nem jelentettek be megjelenési dátumot sem.