SG.hu

Hanggenerátort adott ki a Stability AI

A Stability AI, a Stable Diffusion nevű mesterséges intelligenciával működő képgenerátor mögött álló startup egy nyílt MI modellt adott ki hangok és dalok generálására, amelyet állítása szerint kizárólag jogdíjmentes felvételeken képeztek ki.

A Stable Audio Open nevű generatív modell egy szöveges leírás alapján (pl. „Stúdióban játszott rock, dobolás akusztikus szetten”) legfeljebb 47 másodperc hosszúságú felvételt ad ki. A modellt a FreeSound és a Free Music Archive ingyenes zenei könyvtárakból származó mintegy 486 000 mintával képezték ki. A Stability AI szerint a modell felhasználható dobütések, hangszerriffek, környezeti zajok és „produkciós elemek” létrehozására videók, filmek és tévéműsorok számára, valamint meglévő dalok „szerkesztésére”, illetve egy dal stílusának (pl. smooth jazz) alkalmazására egy másikra.

„A nyílt forráskódú kiadás egyik legfontosabb előnye, hogy a felhasználók saját, egyedi hangadataikon finomhangolhatják a modellt” - írta a Stability AI a vállalati blogján közzétett bejegyzésében. „Például egy dobos finomhangolhat saját dobfelvételeinek mintáin, hogy új ütemeket generáljon”. A Stable Audio Open-nek azonban megvannak a maga korlátai: nem tud teljes dalokat, dallamokat vagy énekeket előállítani - legalábbis nem jó dalokat. A Stability AI szerint nem erre van optimalizálva, és azt javasolják, hogy az ilyen képességekre vágyó felhasználók válasszák a cég prémium Stable Audio szolgáltatását.

A Stable Audio Open szintén nem használható kereskedelmi célokra; a szolgáltatási feltételei ezt tiltják. És nem teljesít egyformán jól a különböző zenei stílusok és kultúrák között, illetve az angolon kívüli nyelveken készült leírások esetében sem - a Stability AI a képzési adatokra hárítja a felelősséget. "Az adatok forrása potenciálisan nem sokszínű, és nem minden kultúra van egyformán képviselve az adathalmazban” - írja a Stability AI a modell leírásában. „A modell által generált minták tükrözni fogják a képzési adatokból származó torzításokat”.


A Stability AI - amely már régóta küzd, hogy megfordítsa lanyhuló bevételi számait - nemrégiben a létezése is veszélybe került, miután az egyik alelnök, Ed Newton-Rex lemondott, mivel nem értett egyet a vállalat álláspontjával, miszerint a generatív MI modellek képzése szerzői jogvédelem alatt álló műveken „tisztességes felhasználásnak” minősül. Úgy tűnik, hogy a Stable Audio Open kísérletet tesz arra, hogy megfordítsa ezt a trendet, miközben nem túl finoman reklámozza a Stability AI fizetős termékeit.

Ahogy a zenei generátorok - köztük a Stabilityé is - egyre népszerűbbé válnak, a szerzői jog - és az, hogy a generátorok egyes alkotói milyen módon élnek vissza vele - egyre inkább a figyelem középpontjába kerül. Májusban a Sony Music - amely olyan művészeket képvisel, mint Billy Joel, Doja Cat és Lil Nas X - levelet küldött 700 MI-vállalatnak, amelyben figyelmeztetett a tartalmai "jogosulatlan felhasználására” a hanggenerátorok képzésénél. Márciusban pedig Tennessee államban aláírták az Egyesült Államok első olyan törvényét, amelynek célja a mesterséges intelligenciával való visszaélések visszaszorítása a zenében.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Tetsuo #2
    Valakik másként gondolják.
  • ZenMillitia #1
    harmatgyenge a minosege. nem a muveszeket kene tamadni ilyenekkel. nem azert akarok MIt,hogy elvegezze helyettem a szorakozast, a muveszetet, hogy tobbet dolgozhassak. az MI csinalja csak a rabszolga munkakat, azert,hogy tobb idom legyen foglalkozni a muveszettel. nevetseges.
    Utoljára szerkesztette: ZenMillitia, 2024.06.07. 22:15:34