„Consecințele pentru siguranța publică pot fi severe”. De ce alege Anthropic să nu lanseze public noul model AI și cum ne poate proteja legislația europeană
Anthropic a anunțat dezvoltarea unui nou model de inteligență artificială, numit Claude Mythos Preview, pe care nu intenționează, însă, să îl lanseze public. Spre deosebire de alte sisteme AI recente, promovate agresiv și distribuite rapid către utilizatori, Mythos va fi accesibil doar unui grup restrâns de organizații, în principal companii mari de tehnologie și actori din zona de securitate cibernetică.
Modelul va fi folosit în cadrul unei inițiative numite Project Glasswing, o coaliție care reunește peste 40 de organizații, inclusiv giganți precum Apple, Amazon și Microsoft, dar și competitori direcți ai Anthropic, precum Google, alături de companii critice pentru infrastructura digitală.
Decizia de a limita accesul vine pe fondul unor îngrijorări serioase legate de capacitățile modelului. Anthropic zice că modelul ar putea depăși aproape toți experții umani în descoperirea și chiar exploatarea vulnerabilităților software. Unele dintre aceste breșe sunt extrem de subtile și ar rămâne, în mod normal, nedetectate, inclusiv în programe testate de milioane de ori.
E remarcabil că Anthropic vorbește direct de o schimbare de paradigmă: intrăm într-o etapă în care AI-ul devine un pericol semnificativ pentru infrastructura digitală.
„Modelele de inteligență artificială au ajuns la un nivel al capacității de programare la care îi pot depăși pe toți, cu excepția celor mai pricepuți oameni, în identificarea și exploatarea vulnerabilităților software”, spune Anthropic în anunțul postat pe site-ul companiei. „Consecințele — pentru economii, siguranța publică și securitatea națională — ar putea fi severe.”
Claude Mythos Preview poate scana aplicații, identifica vulnerabilități de tip „zero-day” (adică probleme necunoscute chiar și dezvoltatorilor) și, în unele cazuri, le poate și exploata.
Compania spune că modelul a descoperit deja mii de bug-uri în software-uri populare, inclusiv în sisteme de operare și browsere majore. Unele dintre aceste vulnerabilități erau extrem de vechi sau bine ascunse. De exemplu, Mythos ar fi identificat o problemă într-un sistem de operare open-source considerat foarte sigur, vechi de aproape trei decenii, dar și o breșă într-un software video care fusese testat automat de milioane de ori fără să fie detectată.
O soluție realistă
Ce putem concluziona e că AI-ul devine rapid cea mai puternică unealtă pentru hackeri, iar singura soluție realistă este să fie folosit, în același timp, și pentru apărare.
„Un singur individ poate lansa atacuri care înainte necesitau echipe întregi. În plus, AI-ul nu obosește, nu ia pauze și poate scala aproape instant. Iar în securitate există o regulă simplă: atacatorul trebuie să reușească o singură dată, în timp ce cel care se apără trebuie să fie perfect de fiecare dată”, spune Nikesh Arora, CEO al Palo Alto Networks, una dintre cele mai importante companii de securitate cibernetică din lume.
Chiar dacă accesul la Claude Mythos Preview este limitat, direcția în care se îndreaptă tehnologia este deja evidentă. Modele similare vor apărea, fie dezvoltate de alte companii, fie replicate, adaptate sau scăpate de sub control. Trăim într-un ecosistem global extrem de competitiv, în care miza este dominația tehnologică și e greu de crezut că toți actorii vor alege aceeași prudență.
Uniunea Europeană a salutat decizia Anthropic, companie considerată dezvoltator de modele AI „de uz general”, ceea ce înseamnă că intră direct sub incidența EU AI Act, noua legislație eurpopeană privind inteligența artificială.
Companiile vizate trebuie să implementeze măsuri de gestionare a riscurilor. Asta înseamnă că trebuie să identifice din timp modurile în care un model ar putea fi folosit abuziv (inclusiv pentru atacuri cibernetice) și să încerce să limiteze aceste scenarii, fie prin restricții tehnice, fie prin controlul accesului.
Există, de asemenea, cerințe legate explicit de securitatea cibernetică propriu-zisă. Modelele trebuie dezvoltate și testate astfel încât să fie rezistente la manipulare sau utilizări neautorizate.
Companiile sunt obligate să analizeze constant comportamentul modelelor, inclusiv în scenarii extreme, pentru a înțelege dacă pot genera riscuri sistemice. În cazul unor modele foarte avansate, cum ar fi cel descris de Anthropic, aceste evaluări ar trebui să includă exact genul de capabilități discutate aici: descoperirea și exploatarea vulnerabilităților.
Pe lângă lege, codul de bune practici la care Anthropic a aderat merge un pas mai departe și cere explicit companiilor să ia în calcul scenarii precum „facilitarea atacurilor cibernetice sofisticate la scară largă” și să implementeze măsuri pentru a le preveni.
O limită fundamentală
Pe de altă parte, însă, chiar și un cadru reglementat avansat precum EU AI Act are o limită fundamentală: nu poate opri progresul tehnologic în sine. E adevărat, legea poate să condiționeze modul în care sunt dezvoltate și distribuite modelele în UE, poate impune evaluări de risc, audituri, standarde de securitate sau obligații de raportare. Dar nu poate împiedica apariția acelorași capabilități în alte jurisdicții (SUA, China etc).
Asta creează o asimetrie structurală. Chiar dacă Europa ar impune standarde foarte stricte, modelele cu capabilități avansate pot continua să fie dezvoltate în alte părți ale lumii.
În cazul unui model de tip Claude Mythos (adică un sistem capabil să descopere și să exploateze vulnerabilități software la scară mare) pare greu de crezut că riscul nu mai poate fi menținut într-un spațiu geografic. Infrastructura digitală e, în general, global interconectată. Asta înseamnă că o vulnerabilitate identificată într-un punct poate avea efecte în lanț oriunde în lume.