shutterstock_2528661673.jpg

Zajsávval gátolják a mesterséges intelligenciát a zenetanulásban

Noha bő másfél évtizede készítenek mesterséges intelligenciával pop-rock slágereket, lemezeket, videóklipeket, no meg virtuális együtteseket, előadókat, most először fordult elő, hogy egyetlen hónap alatt közel másfél milliós hallgatóságot szerzett egy AI-rockbanda. Mondjuk, az nem kevéssé árulkodó, hogy a május óta „létező” Velvet Sundown júniusban és júliusban négy nagylemezzel jött ki.

Válaszolt az AI

Mindenekelőtt megkérdeztem több AI-programot a mesterséges intelligencia kreálta előadókról, zenekarokról. Íme az első válasz: „Az MI-alapú rendszerek már képesek dallamot, szöveget és hangszerelést generálni, ami eddig soha nem látott módon teszi lehetővé a zeneszerzést.”

És jön a valódi disztópia, amikor az AI kifejti, milyen előnyökkel járnak az „MI-generált pop-rock előadók”. Ez a leghajmeresztőbb: „Demokratizálás: a technológia hozzáférhetővé teszi a zeneszerzést azok számára, akik korábban nem rendelkeztek a szükséges eszközökkel vagy tudással.” Nem kommentálnám ezt a mondatot.

Zárásként a program így fogalmazott: „Természetesen felmerülnek etikai és jogi kérdések is: Ki birtokolja az MI által generált zene jogait? Milyen mértékben szabad manipulálni az emberi alkotói folyamatot? Ezek a kérdések a társadalom számára új kihívásokat jelentenek.”

A-retro-style-AI-generated-pop-singer-performing-in-a-1980s-inspired-setting.jpg
A kép illusztráció. Fotó: Microsoft Copilot

Következzék még egy AI-szöveg: „Az MI hangszintetizálási képességei egyre inkább valósághűvé válnak, ami lehetővé teszi, hogy virtuális előadók hiteles énekszóval rendelkezzenek. Azonban a zene nem csupán technikai precizitás kérdése. A pop-rockban az érzelem, a spontaneitás és a közönséggel való interakció kulcsszerepet játszik. E tényezőkben az MI jelenleg még messze elmarad az emberi előadóktól. Az igazi zenei élményhez a zenész személyisége, története és a színpadon átélt pillanatok keltik életre a valódi kapcsolatot a közönséggel. Nem szabad tehát kétségbeesni, hogy az MI hamarosan teljesen kiszorítja a humán előadókat. Az MI-technológiák inkább új lehetőségeket nyithatnak a zenei világban. Segíthetnek zenészeknek inspirációt szerezni, új hangzásokat felfedezni, és hatékonyabban végezni a munkájukat. Az MI a pop-rock jövőjében valószínűleg a humánkreativitás kiegészítőjeként fog szerepelni, nem pedig a helyettesítőjeként. A zene mágikus ereje továbbra is az emberi lélekből fakad.”

Lássuk, mit mondott a harmadik „megszólaló”: „Elképzelhetünk egy világot, ahol mindenki bármilyen stílust játszhat, hiszen az MI bármire képes.

Nem kell évtizedekig gyakorolni, elég egy ötlet, és az MI megvalósítja.

Az MI-generált zene forradalmasíthatja a zenét, de számos etikai és filozófiai kérdést is felvet. Az biztos, hogy izgalmas időket élünk, és a jövő zenéje most születik meg.”

Jöjjön egy utolsó idézet: „A digitális előadók mögött álló cégek szerint az MI-sztárok sosem fáradnak el, mindig trendik, és bármilyen stílushoz alkalmazkodnak. A közösségi médiában ezek az előadók aktívak, reagálnak a rajongókra, sőt, néha még botrányokba is keverednek – természetesen szigorúan szkriptelt módon. A jövőben várhatóan még több AI-előadó jelenik meg, egyre kifinomultabb hangzással és vizuális megjelenéssel.

A mesterséges intelligencia nemcsak a zenét, hanem a rajongói élményt is új szintre emeli – például interaktív koncertekkel, személyre szabott dalokkal vagy a virtuális valóságban zajló turnékkal.

Nem létező sztárok

A mesterséges intelligencia generálta fenti szövegek a jelent és a jövőt taglalják, azonban az AI-popsztárság közel két évtizedes. Hatsune Miku (máskor Hacune Miku) eredetileg egy 2007-es hangszintetizáló szoftver. A program Fudzsita Szaki japán színésznő hangját vette alapul, amelyet a Yamaha Vocaloid elnevezésű technikájával szinkronizáltak. A hologram formában koncertező „énekes” neve azt jelenti: az első hang a jövőből.

Jóval fiatalabb az első minden ízében mesterséges intelligencia generálta sztár, Anna Indiana. Neve szintén beszédes, tudniillik az „Artificial Neural Networks Accelerate Innovative New Developments, Igniting A New Age” (A mesterséges neurális hálózatok felgyorsítják az innovatív fejlesztéseket, új korszakot indítva el) mondatból képzett betűszó.

Négy esztendeje tűnt fel FN Meka. A „rapper” „sárvérű”, amennyiben hangját ember adta, az alap és a szöveg ellenben MI-kreálmány, amelyet megfelelő promptokkal pontosítottak a producerek.

A Devil Inside esetében számos fórumon vitatkoztak már arról, vajon AI generálta vagy valódi zenekarról van-e szó. A banda természetesen nem létezik. A country és a rock elemeit vegyíti, miként tette/teszi ezt az Eagles vagy a southern rock csapatok, például a Lynyrd Skynyrd, illetve még a dark country stílusjegyeit használja. Ez utóbbi műfaj Johnny Cashtől ered, és ma olyan kiváló előadók tolják, mint Amigo The Devil, civil nevén Danny Kiranos.

A Devil Inside producerei nem finomkodnak, évente tíz albumot kreálnak a mesterséges intelligenciával, amely az erős vizualitásról is gondoskodik.

A jól bejáratott „devil” jelző – az „ördög barátjához” hasonlóan – megjelenik egy valódi zenekar nevében is, ez a Devil Makes Three. Csak az összehasonlítás végett.

Az idei év AI-sztárja eddig kétségtelenül a Velvet Sundown. A Spotifyon csak ebben a hónapban 634 ezren hallgatták a produkciót. Legnagyobb slágere, a Dust on the Wind 560 ezer lejátszás fölé jutott.

Maradva a tehetség és a tudás pártján, íme a Dust in the Wind (bizonyára „véletlen”, hogy a cím egyetlen betűben tér csak el), a Kansas 1977-es slágere.

Az AI-zeneőrület főképp Dél-Koreában tombol, ahol számos virtuális K-pop-csapat és -előadó nem kizárólag a világhálón, de koncerten is megtekinthető, persze virtuális formában. Az Eternityt a Pulse9 kreálta. A szöuli techcég fő profilja virtuális látvány generálása az interneten, kiállítási térben.

Megesik, hogy a létrehozók valóban átvernek mindenkit. Az 1971-ben alakult kubai Concubanas zenekar 1973-as Rumba Congo című lemeze, miként a teljes csapat, kitaláció, AI-projekt, amely sokakat megtévesztett, dacára annak, hogy a hosszú és részletes YouTube-információk végén jelezték az alkotók: „A hang- vagy a képanyag jelentős mértékben módosított vagy digitálisan generált.”

Nézzünk valami hasznosat is. Az Endel számítógépes algoritmus, amelyet a berlini Endel Sound fejlesztett. A program valós időben generál a hallgató lelkiállapotának, környezetének, kívánalmainak megfelelő muzsikát, ezzel segítve a befogadó jó mentális állapotát, koncentrációját.

Mások viszont jól visszaélnek a mesterséges intelligenciával, amikor például Kollár-Klemencz László három éve feloszlott, Kistehén zenekara nevében két albumot töltöttek fel a zenelejátszókra, az Árnyékzene Recordsot tüntetve fel kiadóként.

A pénz beszél

A szórakozás, időmúlatás, tréfa mellett nem elhanyagolandó, hogy a zeneipari profit döntő hányadát ma már a streamingfelületek adják. Ami ismert, hogy a teljes tavalyi bevétel (29,6 milliárd dollár) 69 százaléka az internetes megosztásokból jött össze. Hogy ebből mennyi az AI-produkciók aránya, azt nem lehet tudni. Mit volt mit tennem, megkérdeztem a Copilotot, amely megtette a maga becslését, mely szerint év végére a szektor részesedése körülbelül 1,72 milliárd dollár lesz, ami 2030-ra 3,58 milliárdra nő.

Azaz a tavalyi 20,4 milliárd dolláros streamingbevételnek durván nyolc és fél százaléka jött össze MI-produkciókból.

Nem csoda, hogy a pop-rock fellegvárában több mint ezer muzsikus (köztük Kate Bush, Damon Albarn, Annie Lennox, Paul McCartney, Elton John és Andrew Lloyd Webber) tiltakozásul kiadott egy tizenkét számos néma lemezt, Is This What We Want? (Tényleg ezt akartuk?) címmel, amely 47,7 perc csendet tartalmaz, s minden track szerzőjeként ezer brit művészt tüntet fel.

A végére pedig jöjjön a jó hír. A mostanság megalkotott HarmonyCloak szoftver a zenéhez az emberi fül számára hallhatatlan zajsávot ad, amely megtanulhatatlanná teszi a mesterséges intelligencia számára a kompozíciót.

Ez is érdekelheti

Hírmozaik – november 30.

Új előzetest kapott a Csendes barát, először lehet bitcoinnal fizetni Magyarországon egy aukción, tisztújító gyűlést tartott a Magyar Írószövetség – napi hírösszefoglalónk.

Ők nyertek az AI inspirálta filmkészítői pályázaton

Az Umbrella AI-laborja, a Codepunk sikeresen lezárta a Generation AI VOL2 filmalkotó pályázatát, amelynek fő célja, hogy felfedezze és támogassa az AI által inspirált kreatív filmes tehetségeket, támogassa a mesterséges intelligencia által inspirált filmalkotásokat, bemutassa a legtehetségesebb alkotókat és ösztönözze az AI-technológia innovatív alkalmazását a filmkészítés területén.

Elindult az első magyar AI zenei streaming platform

Mysongs.ai néven elindult az első magyar, kizárólag mesterséges intelligencia által generált zenéket kínáló streaming platform. Az oldal számos funkcióval rendelkezik, köztük zene generálása, feltöltése, hallgatása, playlist készítése, és hamarosan feltöltött képekből is lehet klipet készíteni. A mysongs.ai a készítők szerint egy közösségi tér, ami zenei rádióként is funkcionál, és a bevezető időszakban ingyenesen használható.

Hol húzódnak a mesterséges intelligenciával való képalkotás határai?

Viktória királynő kiretusált tokájától a virtuális modellekig: az ember-gép együttműködés a gyakorlatban nem csupán a fotográfiát érintő etikai, de képtechnológiai és médiapolitikai kérdéseket egyaránt felvet.