Unul din marii scriitori ai secolului XX a prefațat, cu 84 de ani în urmă, un paradox care amenință acum internetul

Cum vor evolua în deceniile următoare internetul și societatea umană care a ajuns inextricabil legată de el? Scriitorii de ficțiune au explorat câteva posibilități, arată revista The Conversation.
În „Fall”, romanul său din 2019, autorul de science-fiction Neal Stephenson și-a imaginat un viitor apropiat în care internetul încă există. Însă este atât de poluat cu dezinformare, informații false și reclame, încât a devenit în mare parte inutilizabil.
Este ceea ce vedem acum pe rețelele de socializare ca Facebook, TikTok sau „X”, care au devenit veritabile relee de dezinformare sau canale de distribuire a unor reclame care promovează escrocherii.
Istoria lui Stephenson ca vizionar este impresionantă – a anticipat metaversul în romanul său din 1992, „Snow Crash”, iar un element-cheie din „The Diamond Age” (1995) este un manual interactiv care funcționează într-un mod asemănător unui chatbot.
La prima vedere, chatboții tot mai populari în lumea reală par să ofere o soluție la epidemia de dezinformare. Prezentând conținut factual, ei ar putea fi surse alternative de informație de calitate, oferind rapid informații pentru utilizatorii care le pun întrebări.
Ironia este că, de fapt, tocmai informațiile generate de chatboți pot reprezenta cel mai mare pericol pentru viitorul internetului – un pericol anticipat cu decenii în urmă de scriitorul argentinian Jorge Luis Borges, unul dintre titanii literari ai secolului XX.
Ascensiunea chatboților
Astăzi, o parte semnificativă a internetului este alcătuită în continuare din conținut factual și, în aparență, veridic: articole și materiale care au fost revizuite de experți, verificate sau validate într-un fel.
Dezvoltatorii modelelor lingvistice de mari dimensiuni (LLM) – motoarele din spatele unor chatboți precum ChatGPT, Copilot, Claude sau Gemini – au profitat din plin de această resursă.
Pentru a-și realiza „magia”, aceste modele trebuie să fie antrenate pe cantități imense de text de calitate. O mare parte din acest conținut a fost deja extras din surse online și introdus în modelele LLM când erau la început de drum.
Problema este că internetul, oricât de vast ar părea, este o resursă finită. Textele de calitate care nu au fost deja exploatate devin din ce în ce mai rare, ceea ce a condus la ceea ce The New York Times a numit o „criză emergentă de conținut”.
Acest lucru a obligat companii precum OpenAI să încheie acorduri cu editori pentru a obține și mai mult material brut pentru chatboții lor „flămânzi”. Dar, potrivit unei prognoze publicate în vara anului trecut de institutul de cercetare EpochAI, o lipsă de date de calitate pentru instruirea modelelor LLM ar putea apărea chiar din 2026.
O problemă informațională pe internet
Pe măsură ce outputul chatboților se revarsă pe internet, aceste texte de „generație a doua”, care includ uneori informații fabricate (numite de specialiștii în A.I. „halucinații”) și erori flagrante – cum ar fi sfaturi de a pune lipici pe pizza -, vor polua și mai mult world wide web-ul.
Iar dacă un chatbot „interacționează” cu tipul greșit de conținut din mediul online, poate învăța idei revoltătoare. Microsoft a aflat asta cu ani înainte de toate discuțiile de acum despre A.I. și chatboți. Gigantul tech american a decis în 2016 să oprească „Tay”, un bot care a început să reproducă conținut rasist și misogin.
În timp, toate aceste probleme ar putea face ca informațiile din online să devină și mai puțin de încredere și mai puțin utile decât sunt deja. În plus, LLM-urile hrănite cu conținut „cu calorii goale” pot produce rezultate și mai problematice, care la rândul lor ajung pe web.
Nu este greu de imaginat un cerc vicios în care se produce o degradare continuă, pe măsură ce chatboții se hrănesc din propriul output imperfect.
Un studiu publicat în revista Nature în iulie 2024 a explorat consecințele antrenării modelelor A.I. pe date generate recursiv. Studiul a arătat că „defecte ireversibile” pot duce la „colapsul modelului” pentru sistemele astfel antrenate. Cel mai simplu mod de a ne imagina asta este cu o copie a unei fotografii, care apoi este la rândul ei copiată, și tot așa, până când se pierde orice fidelitate față de imaginea originală.
Cât de rea poate deveni situația?

Povestirea lui Borges
Să ne gândim la povestirea scurtă a lui Borges din 1941, „Biblioteca Babel”. Cu cincizeci de ani înainte ca informaticianul Tim Berners-Lee să creeze arhitectura pentru world wide web, Borges își imaginase deja un echivalent analogic.
În această povestire de 36 de pagini, scriitorul conturează o lume formată dintr-un număr imens – și posibil infinit – de camere hexagonale. Pe rafturile din fiecare cameră se află cărți identice ca structură – cu același număr de pagini, același număr de rânduri scrise pe o pagină, toate scrise cu același alfabet de 25 de caractere.
Aceste cărți conțin, intuiește umanitatea, fiecare permutare posibilă a literelor pentru fiecare limbă vorbită.
Inițial, această revelație provoacă bucurie: prin definiție, trebuie să existe cărți care detaliază viitorul umanității și sensul vieții.
Locuitorii caută astfel de cărți, doar pentru a descoperi că vasta majoritate conțin doar combinații fără sens de litere. Adevărul există – dar există și fiecare minciună imaginabilă. Și toate sunt îngropate într-o cantitate de neconceput de gargară.
Chiar și după secole de căutări, doar câteva fragmente semnificative sunt descoperite. Și chiar și atunci, nu există nicio cale de a ști dacă acele texte coerente conțin informații adevărate sau false. Speranța se transformă în disperare.
O dilemă legată de internet
Va deveni internetul atât de poluat încât informațiile de calitate vor deveni o resursă prețioasă? Sau va produce un număr tot mai mare de chatboți atât de mult conținut viciat încât găsirea informației corecte în mediul online să devină ca și cum ai căuta proverbialul ac în carul cu fân?
Personajele din romanul din 2019 al lui Stephenson fac față acestei probleme abonându-se la „fluxuri editate” – surse de știri și informații selectate de oameni, considerate demne de încredere.
Dezavantajul este că doar cei bogați își permit astfel de servicii personalizate, lăsând majoritatea omenirii să consume conținut online de slabă calitate, nefiltrat.
„Internetul este adesea descris ca una dintre marile realizări ale umanității. Însă, ca orice altă resursă, este important să reflectăm serios asupra modului în care îl întreținem și gestionăm. Altfel, s-ar putea să ajungem să ne confruntăm cu viziunea distopică imaginată de Borges”, conchide The Conversation.
Sper că ți-a plăcut ediția specială a rubricii Nerd Alert de weekendul acesta. În caz că ești curios să arunci o privire și peste cea de duminica trecută, o poți găsi aici: