Ecsetet ragadtak a robotok, egyszer akár művész is válhat belőlük

Szerző: Kömlődi Ferenc
2022.07.12. 19:00

Hogyan alakítja a mesterséges intelligencia (MI) a képzőművészetet, készíthet-e valóban saját alkotásokat a gépi értelem, szüksége van/lesz a kreatív folyamatban az emberre, milyen korlátokba ütközik, és egyáltalán hol tart ma a gépi kreativitás?

Ecsetet ragadtak a robotok, egyszer akár művész is válhat belőlük

Terjed az a művészi (és hacker) gyakorlat, hogy képosztályozó és speciális ideghálók együttes használatával hoznak létre alkotásokat. E rendszerek egyike, az OpenAI nyílt forrású és már rengeteget tanult CLIP-je – szöveges leírást, egy mondatot és néhány paramétert adunk meg neki az elképzelt műről, mire kutakodni kezd, a hálózat is dolgozik, lesz egy seregnyi iteráció, korrekció, aztán a megadott küszöbértéket remélhetőleg túlteljesítő, ínyenceknek értékesíthető végeredmény.

MI-művészet a gyakorlatban

A Google MélyÁlom (DeepDream) mesterségesintelligencia-programjának alkotásait 2017-ben egy San Franciscó-i galériában árusították borsos összegért. Előtte csak online ismertük, például elküldtünk egy fotót magunkról, az idegháló mintázatokat keresett rajta, képpel állt elő, amit aztán elfogadható végeredményig javított. A DeepDream jellegzetes pszichedelikus darabokkal szórakoztatta a megrendelőt (ingyen volt), utólag persze mi is finomíthattunk rajtuk.

2018. október 25-én a Christie’s New Yorki aukcióház a becsült hét-tízezer dollár sokszorosáért, 432 ezerért értékesítette Edmond Belamy portréját. A kép a párizsi Obvious művészcsoport, pontosabban

egy MI munkája volt.

Algoritmust és a 14. és a 20. század között készült 15 ezer arcképből álló adatsort használtak hozzá. Az adatokon gyakorló, belőlük tanuló gépi értelem végül megörökítette a fiktív Belamyt, és ez volt az első alkalom, amikor egy világhírű aukciós ház árverezett el MI által készített műalkotást. 2020-ban – a Jägermeister finanszírozásában – egy berlini MI a világ különböző pontjain tevékenykedő tizenkét művésszel közösen dolgozott a graffitit, a nagyvárosi gerillaművészetet és a latinamerikai falfestészetet (murales) közös nevezőre hozó street art alkotásokon.

Az irányzat legismertebb lépviselője Banksy, legeredetibb urbánus „közgyűjteménye” a chilei Valparaiso városa. A (remekmű) projekt alkotásai a művészek Instagram-fiókjából összegyűjtött vizuális adatok alapján készültek, amelyeket betápláltak az azokat nullákká és egyekké alakító, bennük mintázatokat, alakzatokat és kontextusokat azonosító MI-be. A street art jövőjét szemléltetni hivatott munkákat a berlini Kreuzberg falaira vetítették ki.

Az Oxford Egyetem Ada Byronról (Lady Lovelace) elnevezett Ai-Da robotja kameraszemét és kézfej-ecsetjét használva alkot. 2019-ben mutatkozott be, embereket, organikus világokat örökít meg, ma már verseket is ír. A 2022-es Velencei Biennálén Ugrás a Metaverzumba címmel önálló kiállítása volt, az emberi tapasztalat és az Mi-technológia közötti interfészt vizsgálta Alan Turingtól a Metaverzumig, és még Dante purgatórium- és pokol-elképzelését is lerajzolta.

A Georgia Tech két PhD-hallgatója júniusban mutatta be GTGraffitit, a földkerekség első graffitifestő robotját.

A rendszert fizikai gépbe ágyazták, mozgásmegragadással (motion capture) utánozza a humán művész alkotófolyamat közbeni kézmozdulatait. Egyelőre nem hoz létre önálló műalkotásokat, hanem az embert segíti – például nehezen és kockázatosan megközelíthető helyeken dolgozik helyette –, az ember-gép együttműködés, a valósidejű művész-robot interakció szép példája. A kezdeteknél tartanak, időnek kell eltelnie ahhoz, hogy GTGraffiti ne csak előre meghatározott formákat használjon (most az ábécé betűivel próbálkozik).

Mennyire kreatív a számítógépes kreativitás?

Az MI-ben rejlő művészi potenciál beláthatatlan. Jelenleg meg tudnak szólalni halott személyek hangján (például Anthony Bourdainén), szöveges utasítások alapján képet hoznak létre, hiányos szövegekben pótolják az adott részeket, mindenféle irodalmi stílust utánoznak, kiszámíthatatlanul, de meggyőzően beszélő karakterek, egyszerű cikkeket írnak, melódiákat komponálnak, festmények restaurálásában segédkeznek, elveszett műalkotásokat keltenek életre, táncba, filmbe, vizuális művészetekbe segítenek be, alapos tanulás után önállónak tűnő képeket generálnak.

És ez csak a felszín, mert napjainkban azt kapirgálják.

De mit is nevezünk tulajdonképpen MI-művészetnek? A definíció egyértelmű: minden műalkotást, amely az MI közreműködésével jön létre. Gépi rendszer önállóan és az emberrel együttműködve is alkothat, és az autonómia szintje sem mindegy. A jövőben mindkét trend felerősödése, „exponenciális növekedése” várható. Kérdés, hogy mikor lesz képes egy MI önmagától, mindenféle segítség nélkül humán művészekkel legalább azonos szintű munkát, a humán befogadóban ugyanolyan szellemi-érzelmi hatást kiváltó műveket letenni az asztalra.

Ettől távol vagyunk – és itt túl is lépünk a gépi művészetek témakörén, mert ez már az általános MI (AGI) topik –, valami mindig hiányzik. Senkinek nincs szüksége pocsék verseket író gépekre, tehetségtelen MI-festőkre, van épp elég humán fűzfapoéta és piktor. A kialakulóban lévő MI-művészet egyedi valóság, felvirágoztatásához egyedi gyakorlatra lesz szükség, hogy képesek legyünk túllépni a hagyományos kategóriákon, és az alkotásokat eddig nem ismert módokon tudjuk befogadni.

Rövidtávú veszélyt a technológia gyors fejlődése jelent: mire kialakulna, bizonyítana egy-egy területére épülő művészeti módszer, addigra az adott terület máris elavulttá válik.

Gépi művészettörténet

A gépi értelem hosszú utat tett meg a művészetekben, amíg eljutott a mai sekélyes, de bíztató szintig. Az első ismert robotikus festőrendszer a programozó képzőművész Harold Cohen AARON-ja volt. 1973-ban mutatta be, és folyamatosan továbbfejlesztette. AARON robotkezével megfogta az ecsetet, vászonra festett. Amikor embercsoportot örökített meg egy botanikus kertben, nem meglévő kép másolatát kellett elkészítenie, hanem annyi egyedi alkotást generálnia, amennyi csak lehetséges. Soha nem látott embereket botanikus kertben, de szabályalapú tájékozottsággal rendelkezett kertről, emberi mozgásról. Ismereteit nem emberi módon, tapasztalataira alapozva szedte össze, és gyarapította.

A világot sem élte meg, viszont az ő tudása is fokozatosan bővült.

Ha megismerte például a levél fogalmát, ismereteit akkor hasznosította, amikor szüksége volt rá. A növények fizikai tulajdonságaik alapján számszerűsítve léteztek számára. Minél több és változatosabb tulajdonságukkal volt tisztában, annál szélesebb skálán tudott képet generálni róluk. Az emberi testről, testrészekről, azok kapcsolatáról, mozgásukról, mozgáskoordinációról szintén kellett tudnia valamit, és az általános szabályokat (két kezünk, két lábunk van stb.) mindig betartotta, azaz soha nem „gondolt” arra, hogy egykarú embert fessen.

Összességében akár egy lebutított művészeti Turing-teszten is átmehetett volna, képeit mindenesetre a londoni Tate-ben és a San Franciscói Modern Művészetek Múzeumában is kiállították. Szépséghibájuk, hogy inkább Cohen, és nem az ő műveinek tekinthetők.

Simon Colton 2000-es években megjelent Festőbolondja sokkal autonómabb volt AARON-nál. A szoftver fizikailag ugyan nem vitt fel festéket a vászonra, digitálisan viszont különféle stílusokat, és akár kollázsokat is tudott szimulálni. Viszonylag kevés útmutatás alapján kereste online, közösségimédia-oldalakon az alkotáshoz szükséges forrásokat.

2009-ben például híreken alapuló, civileket, robbanásokat és sírokat megjelenítő, saját afganisztániháború-értelmezéssel állt elő.

Karl Sims és Jon McCormack szintén MI-technikákat, például evolúciós számításokat alkalmazva hoztak létre folyamatosan fejlődő, mozgásban lévő alkotásokat, kreatív ökoszisztémákat. Ide kapcsolódnak az 1990-es években és a rákövetkező évtized elején divatos – szintén az evolúció ihlette, és a gépi reprodukcióval is foglalkozó Neumann János sejtautomatájáig visszavezethető – absztrakt formák komplex alakzatokká válásának folyamatát megörökítő mesterségesélet-kísérletek és rendszerek (emergens módon kialakuló, állandóan változó digitális létformák és ökoszisztémák) is, például az amerikai ökológus Thomas S. Ray Tierra projektje.

A mesterséges ideghálók kora

A 2010-es években felfuttatott gépi tanulás, a többrétegű ideghálók által lehetővé vált mélytanulás drasztikusan felgyorsította az MI-fejlesztéseket, és minden területre, így a számítógépes kreativitásra is komoly hatással van. A „tanulás forradalma” jelenleg is tart, ez a legígéretesebb MI-megközelítés. Az új rendszerek már nem világmodell-alapúak, sokkal dinamikusabb, folyamatosan bővülő ismereteikre tanulással tesznek szert, intelligenciájuk viszont változatlanul szűk területre terjed ki, problémákat ezeken a területeken belül képesek kezelni.

A francia Belamy név az angol Goodfellow (jóbarát) tükörfordítása, és a festmény tisztelgés is a mai gépi művészetekben kulcsszerepet játszó generatív ellenséges ideghálókat (GAN) kitaláló Ian Goodfellow előtt. Egy GAN két összetevőből (ideghálóból), generátorból és megkülönböztetőből áll: előbbi az adatsor irdatlan mennyiségű képéből, az inputból generál egy outputot, utóbbi pedig kritikával illeti azt.

Az első kép még távol van az óhajtott darabtól, a megkülönböztető nagyon pontosan tudja, hogy nem ember munkája, azonosítja, hogy miben különbözik az eredetitől.

Utána a generátor javít valamit az első képen, társa ismét bírálja, és az „adok-kapok”, a folyamatos alkotás-visszacsatolás, a két idegháló versengése mindaddig folytatódik, amíg minőségi önálló alkotás, az óhajtott output (portré, tájkép, akt, bármi) létre nem jön. Az önállóság minden MI által generált műalkotásnál relatív, mert az algoritmus nem az agyában a semmiből kipattant ötletet formálja művészi minőséggé, hanem mindig kész, hozott anyagból dolgozik, egy kicsit úgy, mintha mondjuk, a Mona Lisán végeznénk kismillió iterációt, aztán valami kijönne belőle, ami persze új minőség, de inkább újraalkotás, átértelmezés.

GAN-ok a képzőművészet mellett más területeken is alkalmazhatók. Továbbgondolt változatuk egyrészt az OpenAI CLIP+GAN kombinációja, másrészt az emberi alkotótevékenység mintázatait használni igyekvő kreatív ellenséges hálózatok (CAN). Az eredmények még véletlenszerűbbek és meglepőbbek, mint egy szimpla GAN esetében. Az output arra is felhasználható, hogy a rendszer megtudja, mely furcsaságok vonzók, és melyek nem. Az utóbbi esztendők egyik legismertebb kreatív MI-je a Rutgers Egyetem CAN-alapú AICAN rendszere.

Fejlesztői szerint majdnem autonóm művésznek tekinthető, megtanulta a létező stílusokat és esztétikákat, és ezek alapján mindig valami újat akar kidolgozni.

Ez a megközelítés azon a koncepción alapul, hogy unjuk a megszokottat, az újdonságra viszont odafigyelünk, de hogy legyen benne csavar is: az újdonság azonban mégsem legyen gyökeresen új, legyenek gyökerei. A reneszánsztól a jelenig ívelő adatsoron, 80 ezer képen tanult, munkái kifinomultak és változatosak, címet is tud adni nekik, például Orgia, vagy A Pourville-i tengerpart.

Jobban szereti az absztraktabb, mint a figuratívabb alkotásokat, és az éves kortárs képzőművészeti vásáron, az Art Baselen letesztelték vele a műértő közönséget: humán művészek és AICAN munkáit mutatták nekik, és el kellett dönteniük, melyiket alkotta ember, melyiket gép. Az MI képeinek 75 százalékáról gondolták, hogy ember készítette. A modernizmus a művészet jövőjét élőnek, a posztmodernizmus halottnak képzelte el, míg az MI pedig a szintetikus valóságokban történő újjászületését jelentheti.

NYITÓKÉP: flickr.com/ Ars Electronica / Robert Bauernhansl

Kömlődi Ferenc
Kömlődi Ferenc állandó szerző

Jövőkutató, mesterségesintelligencia-evangelista, író, képalkotó, világutazó, macskaimádó, született gourmand.

olvass még a szerzőtől

Tetszett a cikk?

Az Azonnali hírlevele

Nem linkgyűjtemény. Olvasmány. A Reggeli fekete hétfőn, szerdán és pénteken jön, még reggel hét előtt – tíz baristából kilenc ezt ajánlja a kávéhoz!

Feliratkozásoddal elfogadod az adatkezelési szabályzatot.

Kommentek