Cum va arăta România în 3022, „prin ochii” inteligenței artificiale. MidJourney și schimbările din industria creativă
O expoziție și o dezbatere despre programul de inteligență artificială MidJourney a avut loc weekendul trecut la Dâmbovița Delivery, în București.
S-a creat mare vâlvă pe internet, mai exact în lumea artiștilor, acum vreo două săptămâni când Jason Allen a câștigat primul loc la Colorado State Fair (un concurs anual pentru artiști). Artistul a concurat la categoria „emerging digital artist” cu opera sa intitulată „Théâtre D’opéra Spatial”.
Controversa a apărut atunci când lumea a aflat că el nu a realizat lucrarea într-un mod tradițional, ci s-a folosit de programul MidJourney. Pe scurt, un AI a transformat ceea ce Alleen a tastat pe un server și l-a făcut să plece acasă cu premiul. Artiștilor nu le-a luat mult timp să reacționeze, iar părerile pe care le-am observat pe Twitter nu erau dintre cele mai bune.
Multă lume l-a acuzat pe Allen că ar fi trișat, a apărut o discuție cum că ceea ce a creat el nu poate fi numită artă, ba chiar s-a mers mai departe și oamenii au ajuns să spună că e o amenințare la adresa artiștilor de pretutindeni și a joburilor acestora. Bineînțeles, părerile sunt împărțite chiar și pe platforma urâtă de Erdogan.
Pe lângă cei care spuneau că imaginile generate de AI nu pot fi numite artă, mai sunt un grup de oameni care se întrebau ce anume analizăm atunci când catalogăm ceva drept artă?
Nu este mai degrabă vorba despre produsul final și emoțiile pe care reușește să le scoată de la privitor? Întrebările sunt retorice, dar veneau ca un răspuns la reacțiile puternice ale celor care contestau rezultatul concursului din Pueblo, Colorado.
Hot take: if you think this is not art, you lack imagination at best – and are a gatekeeper at worst. https://t.co/tYOeaQlJuF
— Mark Venturelli \uD83C\uDDE7\uD83C\uDDF7 (@markventurelli) September 3, 2022
Chiar dacă multă lume își imagina că Allen nu a depus efort pentru a lucrarea sa, realitatea nu arăta chiar așa. El a încercat diferite combinații de text și a petrecut aproximativ 80 de ore până să ajungă la rezultatul dorit, potrivit criticului de film și artă, Richard Fitzwilliams, care a declarat asta pentru Al Jazeera.
Ei bine, așa am aflat și eu de MidJourney și mi se părea că oriunde merg aud ceva despre programul ăsta, despre care nu înțelegeam prea multe. Am mers chiar la un date și tipul voia să-mi recomande un subiect și am anticipat ce-o să zică așa că am spus în același timp: „MidJourney” (nu e atât de romantic pe cât pare, vă promit).
Apoi am văzut că, în weekend, avea loc o dezbatere și o expoziție la Dâmbovița Delivery, organizate de Cosmin Pojoranu și Cristina Foarfă. Știam de generare de text, GPT-3, articolele din The Guardian scrise de robot, dar și afinitatea acestui AI pentru poezie. Totuși, MidJourney nu îmi era familiar.
Bineînțeles că am mers pentru că eram curioasă și voiam să văd dacă în sfârșit aș putea să fac și eu ilustrații. Mă chinuiam cu asta la orice proiect de la facultate, pentru că eu voiam la fiecare text să am și ceva ilustrat, iar proiectele mele din Canva cu siguranță nu egalau ceea ce face programul ăsta în câteva minute.
Înainte să detaliez ce-am aflat de la dezbatere, am să fac o introducere despre MidJourney: de unde vine, unde merge, cum funcționează, ce cred artiștii, ce cred cei mai puțin artiști și cum ne putem folosi de această unealtă.
/imagine prompt: Romania in 3022
Pentru explicații, am să folosesc informații dintr-un video de la VOX, ce-am înțeles eu după ce-am folosit programul și ce au mai scris alții. Pe scurt, în 2015, marea inovație din AI era faptul că algoritmii puteau recunoaște obiectele dintr-o imagine și să le numească.
Așa că un grup de cercetători s-a întrebat dacă ar funcționa să întoarcă totul pe dos și să creeze imagini pornind de la un limbaj natural. Ei voiau să vadă cum ar genera inteligența artificială lucruri care sunt puțin probabil să se întâmple în viața reală și dacă ar putea să facă asta. Și a putut. Deci, viitorul e aici și începe acum.
De fapt, a început în 2021 când a apărut DALL-E, un program al cărui nume vine de la, cum probabil ghicește toată lumea, Salvador Dali. Este un sistem de învățare automată, fondat de compania OpenAI fondată de Elon Musk.
Noutatea era că îți puteai imagina un cal făcut din dinți în stilul lui Jan van Eyck și programul putea să scoată asta. În aprilie, DALL-E lansa DALL-E-2, care venea cu o serie de inovații.
Rivalul programului este MidJourney, de care am tot pomenit. Cele două se diferențiază în special prin faptul că MidJourney e mai mult axat pe crearea de spații artistice, care arată ca un tablou. MidJourney e gratis sau, cel puțin, la început. Îți permite să faci vreo 25 de imagini, după care poți să alegi dintre celelalte șase abonamente disponibile.
Ca să intri pe MidJourney, trebuie să îți faci cont pe serverul Discord. Acolo se întâmplă cam toată treaba. Odată ce deschizi serverul, o să vezi o grămadă de camere pentru newbies, mai exact 193.
Dai click pe oricare dintre ele și o să apară un chat, unde tu trebuie să tastezi comanda „/imagine” după care apare prompt-ul tău. Așa se numește adunătura de cuvinte pe care alegi să o pui după comanda respectivă și vine de la „prompt engineering”.
Acolo am ajuns și eu și am stat câteva ore țintită în fața laptopului, până am irosit toate încercările gratis. La început nu m-am prins prea bine de ce vrea mașina, dar era amuzant să văd cum reacționează și ce adaugă. În plus, odată ce te joci tot mai mult, îți dai seama ce combinații de cuvinte trebuie să pui și cât de explicit trebuie să fii.
Ceea ce a început ca un proces intim, cu mine care îmi descriam visele și coșmarurile, s-a terminat cu România văzută de Hieronymus Bosch, România în 3022 și toate încercările mele de a-mi calma anxietățile legate de viitor prin intermediul unui AI care combină imagini.
Câteva ore mai târziu, părea că sunt cea mai mare naționalistă și că orice cream avea legătură cu România. Râdeam în hohote, în mare parte mă amuzam de cât de stupide erau cuvintele pe care le scriam, și, totodată, mi se părea fascinant să văd ce poate să facă cu ele.
Surprinzător, oricum, ce a reușit să scoată din „/imagine: prompt Romania in 3022 future hyper detailed ultrasharp – – ar 9:16”.
Un tool pentru creativitate, dar care afectează industriile creative?
Fondatorul MidJourney, David Holz, a declarat într-un interviu pentru revista Forbes că își dorește să sporească creativitatea oamenilor și că i se pare că poate aduce un plus artiștilor de pretutindeni. Există unele părți în care un artist poate să nu fie atât de încrezător: fie că e vorba de culoare, compoziție sau fundal, deci un astfel de program le poate fi util.
Exact asta spunea și arhitectul Shere Marinescu, care a vorbit la dezbaterea de la Nod Makerspace. Nu se pricepea atât de bine la partea de desen, așa că trebuia să dea altcuiva treaba aia sau să ceară ajutor și acum poate să facă clădirile în MidJourney.
Totuși, întrebarea care răsună în mintea tuturor este: cum îi afectează asta pe artiști sau, mai exact, piața muncii? Am arătat deja reacțiile de la Colorado State Fair, așa că pare că există o anxietate legată de ce ne rezervă viitorul și aceste programe.
Holz spune că nu se teme că va afecta într-un mod negativ piața muncii pentru artiști, ci dimpotrivă asta ar putea duce la o creștere a calității și chiar a salariilor, pentru că lumea va ajunge să aibă o apreciere mai profundă asupra mediilor vizuale. La Dâmbovița Delivery au dezbătut și problema asta.
Moderatoarea Cristina Foarfă i-a întrebat, chiar de la început, pe arhitectul Shere Marinescu și designerul grafic Alin Tămășan ce efect cred ei că vor avea asupra industriilor creative.
Au concluzionat că programul va ridica nivelul, dar asta nu înseamnă că lumea nu va mai angaja artiști. Dimpotrivă, artiștii se vor putea folosi de acest program ca un tool pentru a deveni mai buni. Desigur, momentan tot ceea ce putem face este să speculăm, așa cum semnala și Shere Marinescu.
Există posibilitatea asta, și mai există încă una: cea în care lumea va apela mai degrabă la oameni care nu au atât de multe skill-uri, dar care pot să vină cu o varietate de variante. Ceea ce pentru un singur om sau un singur artist nu este ușor, dar un program poate reuși. Tot fenomenul, în care tehnologia reușește să înlocuiască oamenii și să le facă treaba se numește deskilling.
„Panica reală vine din faptul că în momentul când ai un tool din acesta care democratizează foarte mult creația de imagine și ai cantități enorme, adică e și un tool cantitativ pentru că poți crea cât ai crea în ani, deci asta ar duce la devalorizarea imaginii”, a adăugat Shere Marinescu în cadrul dezbaterii.
Pe lângă asta, mai e problema cu copyright-ul. Momentan, legile privind dreptul de autor nu sunt actualizate la ceea ce poate face tehnologia. Holz, în interviul pentru Forbes, spune că nu a cerut dreptul de autor pentru pozele pe care le folosește programul și asta ar fi aproape imposibil, la momentul de față.
„Ar fi frumos dacă fiecare poză ar avea atașate metadate care să-ți spună cine deține dreptul de autor sau cine e autorul. Dar asta nu se întâmplă, nu există un registru pentru așa ceva”, a declarat Holz pentru Forbes.
Designerul Alin Tămășan crede că vor dispărea mulți dintre ilustratorii sau artiștii care nu sunt „top”, pentru că cei care au un stil consacrat vor primi în continuare job-uri. Profesioniștii nu vor dispărea niciodată, ci mai degrabă se vor reorienta, asta e o altă concluzie la care s-a ajuns în momentul dezbaterii.
De asemenea, cel mai important de subliniat este faptul că MidJourney este o unealtă, nu ar trebui să încercăm să îi dăm trăsături umane sau să ne imaginăm că ar ajunge să ne înlocuiască.
În timp ce stăteam la coadă să generez imagini în MidJourney la standul de la Dâmbovița Delivery i-am auzit pe doi tipi din spatele meu zicând că asta le-a plăcut cel mai mult și cu asta sunt de acord: să nu fie dusă discuția la un oarecare antropomorfism, cum se întâmplă deseori în cultura pop. AI este o unealtă, până la urmă.
Cristina Foarfa, Șerban Marinescu, Alin Tămășan. FOTO: HotNews.ro/ Andra Mureșan
Cum ajungi la un prompt bun?
Sunt diferite articole și video-uri pe youtube care îți dau sfaturi referitor la cum să scrii un prompt sau alte lucruri pe care ai putea să le cunoști. Am citit vreo cinci articole și ce am observat că funcționează este să stai acolo și să tot scrii și să generezi variante noi, până iese ceva apropiat de ceea ce vrei.
Nu am ajuns nici măcar la jumătate și mă vedeam cum stau lipită de ecran de două ore și tastez pentru a zecea oară „a shawarma floating in the air” și el îmi pune o shawarma zburătoare. E o treabă interesantă aici și cu scrisul prompt-urilor, la fel cum discutau și sublinia Marinescu în dezbatere, și anume faptul că ajunge să fie un proces intim.
Sincer, îmi doream tare mult să fac o ilustrație cu Klaus Iohannis jucând golf și îmi doream paleta de culori din filmele lui Wes Anderson. În timp ce scriam prompt-ul mă gândeam la controversa cu Wes Anderson și cât de rușine mi-ar fi să afle cineva cât de stupid sună prompt-ul ăsta (uite că am făcut public într-un articol, până la urmă).
Ca în orice legat de tehnologie, o să fie oameni care se pricep mai bine, care dibuiesc mai bine programul și alții care doar o să se joace și o să se plictisească. Ideea este că lucrurile evoluează foarte repede și, oricum ar fi, o să fie o parte importantă din viața noastră. Urmează să vedem cum vor fi controlate, astfel încât să nu ajungă să înlăture oameni sau să genereze deep fakes.
Frica referitoare la înlocuirea oamenilor de către mașini s-a resimțit și în 2020, la GPT-3, când jurnaliștii de la The Guardian au revenit cu un articol ca să calmeze spiritele.
Dacă articolul scris de robot se numea „Un robot a scris tot acest articol. Deja te-ai speriat, omule?”, cel de-al doilea are titlul „Un om a scris acest articol. Nu ar trebui să îți fie frică de GPT-3”. Lumea se temea că jurnaliștii nu vor mai avea locuri de muncă și că în viitor mașinile vor scrie știrile în locul lor.
Ce să vezi, jurnaliștii încă scriu știri și testez asta pe propria mea piele (nu că m-aș plânge dacă cineva m-ar ajuta să descifrez comunicatele întortocheate de la DNA).
Ceea ce spune articolul și ce am auzit repetat la dezbatere și, ulterior, peste tot pe internet este că mașinile nu există fără noi. Chiar dacă schimbă paradigma sau aduc inovații, tot le lipsește originalitatea și autorul. De aceea au, de fiecare dată, în spatele lor oameni care să le scrie un prompt.
Ca să ne ușurăm munca și anxietățile cred că, cel mai bine, ar fi să încercăm să le înțelegem și să cunoaștem cât mai multe despre ele, nu să le privim ca pe niște posibile amenințări. Oamenii au ceva de spus, dar trebuie să aflăm ce.
/imagine prompt: o lume fără noi, ultra detail, ultra sharp, volumetric cinematic light 8k – – ar 9:16.
E posibil să iasă ceva, dar e doar imaginație.