SG.hu·

A klasszikus zenét évszázadok óta nem tudta legyőzni semmi, de a MI-nek sikerülhet

A klasszikus zenét évszázadok óta nem tudta legyõzni semmi, de a MI-nek sikerülhet
A generatív MI egyszerre kínál új kreatív lehetőségeket a klasszikus zenének és fenyegeti azokat a készségeket amelyek évszázadokon át meghatározták a zeneszerzés művészetét.

A zeneszerzők mindig is kísérleteztek az új technológiákkal, ám a legújabb fejlesztések már a "készségek halálával" fenyegetik ezt az évszázados művészeti formát. Mozart idejében a mechanikus hangszerek számítottak a legnagyobb szenzációnak. Az önmagukat megszólaltató hangszerek nem voltak újdonságok, hiszen az első zenei automatákat már évszázadokkal korábban megalkották. Az óraműmechanizmusok fejlődése azonban valami egészen különlegessé tette a felvilágosodás kori automatákat. Az a látványos újdonság, hogy egy hangszer emberi közreműködés nélkül játszik, annyira lenyűgözte az embereket, hogy az óraműves orgonák Európa elitjének kötelező státuszszimbólumaivá váltak. Maga Mozart is komponált darabokat önjátszó hangszerekre, ahogyan Beethoven és Haydn is.

A klasszikus zenészek hosszú múltra tekintenek vissza abban, hogy a legújabb technológiákkal dolgozva tágítsák a zene lehetőségeit. Ma ezt a szerepet a mesterséges intelligencia tölti be - bár a zeneszerzők ezen a területen is már évtizedek óta kísérleteznek. Jó példa erre a Voyager, egy mesterséges intelligenciával működő rendszer, amelyet az elismert zeneszerző, George E. Lewis fejlesztett ki az 1980-as években azzal a céllal, hogy emberekkel improvizáljon élőben. Amikor az ember működés közben látja, egy felügyelet nélkül játszó billentyűs hangszer szólal meg a zenészek mellett, ugyanazt a vizuális különlegességet idézve meg, amely a 18. századi közönséget is elbűvölte. A mechanikus orgonával ellentétben azonban a Voyager nem egy zeneszerző által megírt művet játszik, hanem alkot. Lewis rendszereit arra tanítják, hogy "döntéseket hozzanak" - mondja. "Párbeszédben állsz velük, és nincs kontrollod afelett, mit csinálnak." A stílus kísérleti és atonális, időnként a free jazz határát súrolja, de nincs két egyforma Voyager-előadás.


George E. Lewis

Lewis mélyen elgondolkodott azon, mi motiválja a MI-vel való munkában, milyen adatokat használ, és hogyan lehet az emberi kreativitást a középpontba helyezni. Az improvizáló rendszerei azonban nagyon különböznek az olyan nagy nyelvi modellektől, mint a ChatGPT, vagyis attól a generatív MI-formától, amely ma a hírek címlapjain szerepel. Azok az eszközök, amelyek szöveges utasításokból képesek hatalmas mennyiségű művészi tartalmat létrehozni, alapjaiban alakítják át a kreatív iparágakat. A vállalatok egymás után jelentik be új modelljeiket grandiózus állításokkal a kreatív munka "demokratizálásáról", majd rövid időn belül több millió vagy milliárd dollárra értékelik őket.

Először a DALL-E demokratizálta a képgenerálást 2021-ben, majd a ChatGPT az írást 2022-ben, 2026-ra pedig az OpenAI értéke elérte a 852 milliárd dollárt, miközben az UNESCO arra figyelmeztet, hogy a generatív MI hatására az alkotók bevételeinek akár 24 százalékát is elveszíthetik 2028-ra. Most a zenét generáló modellek, mint a Suno, az Udio és a Stability AI, a zene demokratizálására készülnek. Csak idő kérdése, hogy ez a technológia a klasszikus zenészeket is arra kényszerítse, hogy újragondolják, mit csinálnak és miért - ugyanúgy, ahogy az írókkal és képzőművészekkel már megtörtént.

Azok körében, akik már most generatív MI-vel dolgoznak, érezhető bizonyos optimizmus azzal kapcsolatban, mit kínálhat ez a klasszikus zenének. Harry Yeff énekes, aki Reeps100 művésznéven lép fel, az elmúlt tíz évben olyan hanggeneráló MI-rendszereket használt, amelyeket saját hangjára tanítottak be, hogy ezzel feszegethesse saját vokális képességeinek határait. Úgy véli, hogy egy saját maga által betanított MI-rendszer inspiráló ellenfélként működik, mert éppen egy hajszálnyival lép túl az emberi teljesítményen. Yeff előadásai az általa "MI-ikerként" emlegetett rendszerrel virtuóz bemutatók. Énekel, beatboxol a rendszerrel együtt és ellene is, miközben az a hangját egy kísértetiesen gépies változattá alakítja át, amely egyszerre hasonlít és nem hasonlít Yeff saját hangjára. "Az ellenfelek lehetnek a legjobb együttműködő partnereink. Szerintem a tanulásnak és az emberi potenciálnak egészen más dinamikája bontakozik ki, amikor versenyhelyzetben vagy" - magyarázza.


Stephanie Dinkins művész jól példázza, hogy a nagy nyelvi modellek miként változtathatják meg azt, kiből válhat zenész. A képzőművész az adatokban rejlő torzításokat és azok kijavításának lehetőségeit kutatja, munkáját pedig 2023-ban a Time magazin a MI területének száz legbefolyásosabb embere közé emelte. Júniusban a londoni Royal Ballet and Opera négynapos SHIFT fesztiválján mutatja be a Cosmologies From the Bay című "hangközpontú performanszt és installációt", amely a MI klasszikus zenében való felhasználását vizsgálja - Lewis és Yeff művei mellett. Ez azonban Dinkins "élete első zeneszerzői tapasztalata". A művet ChatGPT segítségével komponálta, miközben Samantha Rose Williams énekessel konzultált, aki elő is adja majd a darabot. "Ez hatalmasra bővíti a művészi eszköztáramat" - mondja Dinkins. "Számomra ez elképesztő."

Mégis, Dinkins aggodalommal tekint erre a kibővített képességre. "Imádom, hogy képes vagyok rá, ugyanakkor úgy érzem, nem kellene képesnek lennem rá" - vallja be. Ha ugyanis már olyan összetett zenéket is elő lehet állítani, amelyek korábban komoly zenei képzést és készségeket igényeltek, akkor fennáll a veszélye annak, hogy az emberek elveszítik ezeket a képességeket. Miért tanítsunk olyasmit, amit egyszerűen le lehet generálni?

"Az emberek nagyon is tudatában vannak annak, hogy ez miként hathat arra, ahogyan a társadalom a zeneszerzői készségekre tekint. Vajon továbbra is értékesnek számítanak?" - mondja Daniel Lewis, a PRS for Music klasszikus zenei kapcsolatokért felelős vezetője. Ez az Egyesült Királyságban működő szervezet engedélyezi a zenék felhasználását és gyűjti a jogdíjakat. "Nagyon óvatosnak kell lennünk, és tudatosan el kell kerülnünk a készségek halálát" - állítja Yeff. "A kiterjesztés alkotás, az automatizálás helyettesítés."

Mivel a nagy nyelvi modellek rendkívül gyorsan képesek hatalmas mennyiségű zenét előállítani, fennáll a veszélye annak, hogy tisztességtelen versenyt teremtenek az emberi alkotókkal szemben. A klasszikus zene bizonyos területeit valószínűleg közvetlenebbül érinti majd a változás, mint másokat. Daniel Lewis rámutat, hogy a koncerttermekbe szánt művek - például a szimfóniák - a közönség elvárásai miatt "védettebbek" lehetnek, mint azok a műfajok, ahol a zene inkább "háttérszinten hallgatott" tartalomként jelenik meg - elsősorban a filmzenék, televíziós zenék, videojáték-zenék, reklámzenék és ambient művek esetében.

Ez azonban nemcsak az ezekben a műfajokban dolgozó zenészek számára jelent komoly aggodalmat, hanem az MI-vel telített médiaipar tovagyűrűző hatásai is nehezen kiszámíthatók. A médiazenei műfajok - különösen a filmzene - jelentős szerepet játszanak abban, hogy új közönséget vonzzanak a klasszikus zenéhez, emellett fontos megélhetési forrást jelentenek a zenészek számára. Még ha a koncertzene egyelőre védettnek is tűnik az automatizálással szemben, az azt támogató infrastruktúra éppen azokra a műfajokra épül, amelyek a leginkább veszélyeztetettek.


Ez az új világ különösen sértőnek tűnhet a zenészek számára annak fényében, hogy mára világossá vált: különféle szerzői joggal védett zenéket használtak fel különböző nagy nyelvi modellek betanítására. "Az emberek számára ez egy ponton túl már sértőnek érződik" - mondja Daniel Lewis arról a felismerésről, hogy a munkájukat engedély nélkül használták fel olyan tartalmak létrehozására, amelyek később velük versenyeznek majd. A PRS saját kutatása szerint tagjaik 93 százaléka szeretné, ha az alkotók kompenzációt kapnának, ha a zenéjüket MI-betanításhoz használják, és 92 százalék nagyobb átláthatóságot vár el a betanító adatokkal kapcsolatban. A szervezet arra ösztönzi a kormányt, hogy jogi kötelezettséget írjon elő a MI-fejlesztők számára a szerzői joggal védett művek nyilvánosságra hozására a teljes MI-ellátási lánc mentén, valamint arra, hogy a MI által generált tartalmakat egyértelműen jelöljék.

Mindeközben sok zenész bízik abban, hogy a könnyen generálható zene éppen az élő előadások értékét növeli majd a közönség szemében. "Remélem, ebből a szempontból ez csak segíteni fogja az élő művészeteket" - mondja Robin Coops rendező. Az In the Ring című produkciója - amelyet az RBO fesztiválon mutatnak be - generatív MI segítségével helyezi a közönséget egy Wagner Ring-ciklusán alapuló szerepjáték világába. Olyasmi ez, mintha a Dungeons & Dragons találkozna az operával. Coops szerint a technológiával való kapcsolata mindig is "szerelem és gyűlölet" volt egyszerre, részben pedig azért használ MI-t, hogy a közönséget ráébressze arra, hogy "megkérdőjelezze a technológiát".

Talán létezik egy olyan jövő, amelyben a nagy nyelvi modellek valóban azt a pozitív zenei forradalmat hozzák el, amelyet híveik hirdetnek. Ehhez azonban körültekintő szabályozásra és arra is szükség lesz, hogy megkérdőjelezzük azokat a túlzó állításokat, amelyek szerint ezek a rendszerek mindenki számára elérhetővé teszik a zenét. "Ha valóban demokratizálni akarnánk a zenélést" - jegyzi meg Daniel Lewis -, "létezik egy fantasztikus dolog, amit úgy hívnak, hogy állami oktatás, és lehetne fuvolákat adni a gyerekeknek." Lehet, hogy ez nem annyira látványos megoldás - de a Suno legutóbbi finanszírozási körében összegyűjtött 250 millió dollárból rengeteg fuvolát lehetne vásárolni.

Kapcsolódó cikkek és linkek

Hozzászólások

Jelentkezz be a hozzászóláshoz.

Nem érkezett még hozzászólás. Legyél Te az első!