shutterstock_2409058727.jpg

Hol húzódnak a mesterséges intelligenciával való képalkotás határai?

Viktória királynő kiretusált tokájától a virtuális modellekig: az ember-gép együttműködés a gyakorlatban nem csupán a fotográfiát érintő etikai, de képtechnológiai és médiapolitikai kérdéseket egyaránt felvet.

2023-ban vírusként terjedtek a közösségi médiában a néhai Ferenc pápáról készült fotók, amelyeken az akkor 86 éves pontifex vaskos, derékban összefogott fehér pufikabátban hagyja el a Vatikánt. Sokan azzal vicceltek: az egyházfőt netán a Moncler vagy a Balenciaga szponzorálja? A képről persze nagyon hamar kiderült, hogy nem igazi, hanem a mesterséges intelligencia (MI) alkotása. Ha nagyítóval vizsgáltuk, valóban feltűnhetett: az elnagyolt vagy éppen túl éles vonások és részletek, pontatlan fények egyaránt árulkodhattak a turpisságról.

Azóta persze nagyot fordult a világ: MI-modelleket látunk katalógusokban, az amerikai elnök a hivatalos csatornáján oszt meg manipulált képeket, és az óriási írói és színészsztrájkok dacára van olyan ügynökség, amely képes bemutatni egy általa reprezentált MI-színészt.

Két kattintás, és bárki készíthet magáról profilképet a legendás japán animációs stúdió, a Ghibli stílusában - noha alapítója, Mijazaki Hajao szerint az AI konkrétan sértés az életre nézve. 

A fake news, azaz a hamis információkat megjelenítő tartalmak a közösségi oldalak berobbanásával a mindennapjaink szerves részévé váltak, és a nagyobb hozzáférés velejárója, hogy mindig lesz olyan, aki tényellenőrzés nélkül továbboszt bármit. De vajon mióta trükközünk a valósággal, és hol kéne meghúzni a határt?

Viktória királynő tokája

A fotóművészet története egészen 1839-ig nyúlik vissza, egészen a dagerrotípia feltalálásáig. A képek manipulációja pedig nem a modern kor találmánya, csupán az eszközök változtak: már a 19. században is igyekeztek az emberek előnyösebb képet mutatni magukról. A tendencia persze ha jobban belegondolunk, akkor egészen az ókorig visszavezethető, hiszen Ehnaton egyiptomi fáraó, az újbirodalmi XVIII. dinasztia tizedik uralkodója volt az első, aki azt parancsolta, hogy képmásai a valóságot tükrözzék – görbe háttal, hosszúkás arccal. Az egyiptomi fáraók addig kigyúrt istenként tetszelegtek a falfestményeken és szobrokon – holott mérget vehetünk rá, hogy a sok rokonházasság miatt ezek a képek nem a valóságot tükrözték.

Queen_Victoria_by_Bassano.jpg
Viktória királynő. Üveg negatív másolat. Fotó: Alexander Bassano/Wikipedia

A képalkotás mindig is az emberi hiúság egyik eszköze volt: a festők és fotográfusok gyakran idealizálták alanyaikat, hogy megfeleljenek a kor szépségideáljainak vagy a megrendelők elvárásainak. Viktória királynő fiatal korában még festményekhez állt modellt, később pedig a korai fotográfiákon kiretusáltatta a tokáját. Ekkor a retusálás persze még kézi munkát jelentett: ecsettel, tintával vagy akár kaparókéssel javították a képeket hosszú órákon át.

Eltüntették a bőrhibákat, lágyították az arcvonásokat, vagy éppen a testalkatot próbálták előnyösebbnek mutatni. Az 1880-as években már a korabeli újságok is azt találgatták, valójában hogy nézhet ki a királynő.

A 19. század végén akadtak még szórakoztatóbb manipulációk is: William Henry Wheeler brit fotográfus legtöbb alanya póznán vagy a kardján tartja a fejét, esetleg zsonglőrködött vele. Az amerikai William H. Martin és Alfred Stanley Johnson Jr. olyan képeslapokat készítettek, amelyeken különböző városok vagy államok büszkélkedhettek óriási halfogásaikkal vagy terményeikkel – amelyeket nyilván a fotósok nagyítottak fel. Két angol lány, Elsie Wright és Frances Griffiths 1917–1920 között készítettek egy elhíresült sorozatot, melyen táncoló tündérek láthatóak. A lányok egészen 1981-ig kitartottak fotóik valódisága mellett, amelyek valószínűleg ügyesen kivágott papírképek segítségével érték el azt a hatást, mintha valódi lények lennének körülöttük.

Stalin_Volga.jpg
Nyikolaj Jezsov Sztálinnal a Volga-gát mentén, manipulált fotó. Jezsovot a nagy tisztogatás után eltávolították a képről. A fénykép 1937 áprilisában készült. Fotó: Wikipedia

A 20. század első felében a vezetők néha kínos dolgokat radíroztak le a róluk készült fotókról. Sztálin például a mögötte lépkedő Nyikolaj Jezsovot, aki 1936–1938 között a Szovjetunió belügyi népbiztosa, 1937–1938-ban pedig állambiztonsági főkomisszár volt, ám 1939 tavaszán minden tisztségétől megfosztották, letartóztatták és később kivégezték. Jelenléte ezáltal nyilván kellemetlenné vált még a régebbi fotókon is, így egyszerűen eltüntették.

Egy 1942-es képen Mussolini hősies pózban ül egy lovon, amit azonban egy férfi vezetett száron – tehát nyilvánvalóan utólag leretusálták róla. A nyugatnémet kancellár, Willy Brandt és Leonyid Brezsnyev 1971-es találkozóján készült egyik fotón pedig három sörösüveg látszik az asztalon: a német lapokban az üvegek látszanak, a szovjet újságokban viszont eltűntek – hiszen egy jó kommunista vezető nem iszik.

Mágneses lasszó és gyógyító ecset

A nyolcvanas évek végén a Thomas és John Knoll testvérpár fejéből pattant ki a világ talán legjelentősebb képszerkesztő programjának ötlete. A Photoshop márkanév persze már amióta az eszünket tudjuk, egyet jelent a vizuális manipuláció fogalmával: igeként is hivatkozik rá a nyelv („fotosopolni”) – ha valami kamuról vagy turpisságról, látható manipulációról van szó. Az első verziókban már ott volt a jól ismert varázspálca és klónozó ecset, ma pedig már a legfrissebb mesterséges intelligenciával megtámogatott eszközök segítik a program felhasználóit, hogy a valóságot tükröző fotókból más képeket varázsolhassanak.

Az már csak hab a tortán, hogy ennek az eszköznek köszönhetjük gyakorlatilag a mémeket.

Az 1990 februárjában megjelent 1.0-s verzió elfért egy floppyn, de 1993-ig kellett várni, hogy kiadják Windowsra is (addig csak Macen futott a program). A 3.0-s verzióban jelent meg a forradalmi újdonságnak számító rétegkezelés, amely lehetővé tette, hogy az eredeti kép módosítása nélkül dolgozzunk annak különböző részletein, a fotók manipulációja pedig a 7-es verzióra vált igazán kifinomulttá a mágneses lasszóval, valamint a gyógyító és foltozó ecsettel. 2020-ban pedig megjelent a Sensei mesterséges intelligenciás algoritmusára épülő objektumkiválasztó eszköz. Ennek segítségével egyetlen mozdulattal ki tudtunk jelölni egy tárgyat, ha az láthatóan elkülönül más tárgyaktól és a háttértől – persze ez csupán a kezdet volt.

000_SAHK970903080770.jpg
Az elektronikai és számítógépes kiállítás látogatói az Adobe Photoshop szoftver bemutatóját nézik 1997. szeptember 3-án Pekingben. Fotó: Robyn Beck / AFP Photo

Szabályozatlan, új terület

A sajtófotóversenyeken a fotómanipuláció esetében ott húzzák meg a határt, hogy amit a régi labortechnikával meg lehetett csinálni, az ma is elfogadott. Lehet tehát például vágni-újrakeretezni, vagy éppen sötétíteni és világosítani egyes részeket a képen. Az MI segítségével már képi elemeket lehet hozzárakni vagy eltüntetni, ez persze tilos. A dokumentarista és a piaci vagy éppen művészeti műfaj viszont egészen más tészta: az MI-t már mindenhol használják, például a stockfotók piacára is betört. Egy jól lepromptolható eseményt már simán (és olcsón) összerak az MI az adatbázis által biztosított képekből – ám egyelőre a sajtófotóval is dolgozó nagy ügynökségek, például a Getty Images vagy a Reuters illusztrációként sem enged használni manipulált képeket.

Az MI-vel való képalkotás szabályozatlan, még mindig újnak számító terület,

Ráadásul több képmegosztó- feltöltő alkalmazás és közösségi oldal apró betűs részén szerepel, hogy a feltöltött fotókat – amennyiben ezt nem tiltjuk le – felhasználhatják a mesterséges intelligencia fejlesztésére.

A manipulációt felismerő szoftverek egyre fejlettebbek, mozgókép esetében archőtérképek segítségével képesek kiszúrni a manipulációt – más kérdés, hogy amikor az avatatlan szem ránéz például egy háborús képre, vajon lefuttatja-e az ellenőrzést, hogy valódi fotót lát.

Egy háború jelentős médiafigyelemmel kísért és jól dokumentált történelmi esemény, ezáltal könnyebb leleplezni a hazug elemeket, de amikor már olyan esetek jönnek szembe, mint idén tavasszal Carl De Keyzer új projektje, akkor már a fotós felelőssége is felmerül. A Magnum Photos tagja áprilisban ugyanis a mesterséges intelligencia segítségével készítette el legújabb albumának képeit: mivel a Covid–19 és az ukrajnai háború miatt nem tudott Oroszországba utazni, a Midjourney nevű programot használta, hogy megvalósítsa elképzeléseit. Az ezzel elég nagy botrányt okozó Keyzer célja az volt, hogy az MI-t a saját fotográfiai látásmódjára hangolja, és képeket hozzon létre Putyin Oroszországáról anélkül, hogy fizikailag jelen lenne – ami ugyebár egy dokumentarista esetében pont a lényeg lenne: az igazságot megmutatni.

Kisebb figyelmet kapó események esetében még nagyobb lehet a félretájékoztatás veszélye: olyan eseménynél vagy akár bírósági eseteknél, ahol előkerül mondjuk egyetlen felvétel, és nincs viszonyítási alap.

Mindez már túllép a mesterséges intelligencián: képtechnológiai és médiapolitikai kérdés.

Az amerikai jog szerint egyébként a mesterséges intelligenciával létrehozott mű szellemi, szerzői joga a megalkotóját illeti meg, amennyiben alapvető módosítások és nem csak ráncfelvarrások történtek az eredeti képen.

Az ember-gép együttműködés alapja, hogy a felhasználó dönt arról, hogy ő mit enged meg, mit használ, amivel – egy fotográfus vagy újságíró esetében – a saját szakmájának jövőjébe is beleszól. A mesterséges intelligencia 2022-ben óriásit fejlődött, ma pedig már szinte megállíthatatlannak tűnik. Tömeges szinten használható, legyen szó szinte bármilyen területről.

Minden információ egy helyen van, ehhez pedig az MI hozzáfér, és pillanatok alatt elkészít egy fotót, mondjuk Sebastião Salgado stílusában, az általunk kért amazonasi esőerdőről. Az egyetemek egy-két éve már külön szoftvereket használtak az MI használatának kiszűrésére, ma pedig már inkább azt szabályozzák, hogy mire és hogyan megengedett a használata. A hatalmas tiltakozás és felháborodás dacára pedig megjelentek az AI-modellek és -színészek, „akik” újabb etikai és az egész társadalmat érintő kérdéseket vetnek fel. 

shutterstock_2400648421.jpg
A kép illusztráció. Fotó: Shutterstock/Ju Jae-young

Korábban úgy voltunk vele, hogy az MI-t tudósok fejlesztik és használják, de az emberi kommunikációt újraalkotni képes és 2025-re gyakorlatilag már jogászként, tanácsadóként vagy éppen pszichológusként használt ChatGPT-vel és a képgenerátorokkal a hétköznapokat is meghatározza. Ma már talán nem adjuk meg az adatainkat egy „bajba jutott afrikai hercegnek”, aki a bankkártyánkhoz való hozzáférésért cserébe azt ígéri, hogy megosztja majd velünk busás vagyonát, ám digitális immunrendszerünk még csak most lépett át a felnőttkor küszöbén. 2025-re az ember-gép együttműködés pedig olyan szintre jutott, hogy felmerül a kérdés: vajon milyen közel vagyunk ahhoz, hogy maga a gép alkosson a semmiből valamit?

Ez is érdekelheti

Hírmozaik – november 30.

Új előzetest kapott a Csendes barát, először lehet bitcoinnal fizetni Magyarországon egy aukción, tisztújító gyűlést tartott a Magyar Írószövetség – napi hírösszefoglalónk.

Ők nyertek az AI inspirálta filmkészítői pályázaton

Az Umbrella AI-laborja, a Codepunk sikeresen lezárta a Generation AI VOL2 filmalkotó pályázatát, amelynek fő célja, hogy felfedezze és támogassa az AI által inspirált kreatív filmes tehetségeket, támogassa a mesterséges intelligencia által inspirált filmalkotásokat, bemutassa a legtehetségesebb alkotókat és ösztönözze az AI-technológia innovatív alkalmazását a filmkészítés területén.

Magyarország legnagyobb fái kitartásra tanítanak

Kállai Márton fotográfus öt éven át járta az ország minden zugát ismert és ismeretlen fák után kutatva, most pedig végre kézbe vehető a Matuzsálemek című album.

A fotográfia múltja és jövője egymásnak feszült Párizsban

A Paris Photón, a világ első számú fotográfiai vásárán jártunk, ahol idén kifejezetten erős volt a felhozatal, akárcsak a magyar jelenlét.