Un jurnalist a folosit 5 asistenți AI să scrie emailuri, apoi le-a supus unui juriu. Topul e spectaculos. „Înainte să începi să cauți pe Google «cum să divorțezi de cineva care vrea să trăiască cu urșii polari», ascultă-mă”

Există o mulțime de asistenți AI pe piață. Dar numai unul poate scrie e-mailuri la fel de bine ca tine, scrie jurnalistul Geoffrey A. Fowler, într-un newsletter pentru Washington Post.
Acesta a organizat „un concurs de modă veche” între cinci roboți și le-a cerut să redacteze cinci tipuri de e-mailuri personale și de serviciu dificile. Apoi, le-a supus jurizării unei comisii de experți în comunicare pentru a judeca toate e-mailurile – în orb.
Pentru a vedea dacă mesajele electronice ale roboților se pot distinge de cele ale oamenilor, jurnalistul a cerut, de asemenea, judecătorilor să evalueze mesajele electronice scrise de mine.
Concluziile: după o sută cincizeci de evaluări ale e-mailurilor, un AI a depășit acest om. Dar juriul a considerat, de asemenea, că unul dintre cele mai populare AI-uri din prezent sună atât de robotic, încât ar fi mai bine să îl evitați.
De ce atâta atenție la scrierea emailurilor?
„Dar de ce să ne concentrăm pe scrierea e-mailurilor?”, se întreabă retoric jurnalistul de la WPost. „Pentru că este unul dintre primele lucruri cu adevărat utile pe care AI le poate face în viața ta, de la redactarea rapidă a răspunsurilor până la a te ajuta să găsești cuvintele potrivite pentru o conversație dificilă. De asemenea, instrumentele de scriere ale AI sunt acum disponibile în Gmail și Outlook, devenind la fel de accesibile ca și verificarea ortografică. Iar abilitățile pe care AI le demonstrează în redactarea e-mailurilor se aplică și altor tipuri de sarcini de scriere”.
Copilot, asistentul de la Microsoft
Copilot, asistentul AI disponibil în Windows, Word și Outlook de la Microsoft, este omniprezent. Dar dacă există un lucru asupra căruia juriul nostru a căzut de acord, acesta este că Copilot scrie e-mailuri care sună ca AI – și a primit un punctaj mult mai mic decât ceilalți roboți. Copilot a început mesajele cu o variantă super-generică de „sper că sunteți bine” în trei din cele cinci teste, ceea ce îi dă senzația de a fi „impersonal”, a spus unul dintre jurați.
Faptul că Copilot este „surd la ton” a fost o preocupare recurentă a juriului. În e-mailul de test care anunța concedierile, Gallo a spus că Copilot a folosit „un limbaj stilat, robotizat”. Iar într-un scurt mesaj de despărțire, Copilot a încheiat cu fraza: „Sper că lucrurile vor rămâne amiabile”. „De ce să nu fie lucrurile amiabile? Aș fi ales alt limbaj.”, a întrebat o membră a juriului.
Mai rău, Copilot a fost, în general, cel mai vorbăreț dintre AI-uri. Într-un e-mail de afaceri, a folosit de două ori mai multe cuvinte decât ChatGPT pentru a transmite același argument.
ChatGPT nu a impresionat
Și pentru că tot veni vorba de ChatGPT, acesta este cel mai faimos dintre roboți, însă e-mailurile sale nu au ieșit prea mult în evidență față de celelalte două AI-uri din mijlocul clasamentului realizat de WPost.
Mai mulți jurați au apreciat că ChatGPT a sunat „direct”, spre deosebire de jargon și perspicacitate, în testul nostru de notificare a concedierii. În cazul e-mailurilor care au necesitat mai multă persuasiune, o jurată a spus că ChatGPT a folosit un limbaj descriptiv pentru a crea un sentiment. „Nu este scrisul meu preferat”, a spus ea, «dar din perspectiva vânzărilor și a marketingului, este cel mai puternic, deoarece vinde ideea cel mai bine».
Cu toate acestea, juriul a considerat, de asemenea, că ChatGPT a ratat deseori ținta, fiind „puțin rigid” și „tranzacțional”. De exemplu, a folosit o expresie pasiv-agresivă într-un mesaj de despărțire. Acest tip de momente au apărut frecvent.
Gemini, de la Google
Gemini este asistentul încorporat în Gmail. Mai mult de jumătate dintre jurați au simțit de la un kilometru distanță că ceva nu este în regulă. „Nu simt că vine de la o persoană reală”, a spus unul dintre aceștia.
„Aș recunoaște imediat că este scris de AI și m-aș întreba de ce prietenul meu nu s-a deranjat să-mi scrie un e-mail rapid din inimă”, a spus Skillings.
Dar Gemini a avut și momente bune. Testul mesajului său de despărțire a fost simplu și scurt. „Acesta pare să fie textul care va provoca cele mai puține daune”, a precizat același jurat. Iar când vine vorba de a aduce argumente, a spus un alt membru, e-mailul Gemini este „cuprinzător și bine organizat” – și chiar mai bine, „recunoaște obiecțiile potențiale și oferă soluții”.
DeepSeek e aproape de top, dar scrie mailuri lungi
DeepSeek, AI-ul conceput în China și care a stârnit valuri de reacții la apariția sa, a obținut în general un scor puțin mai bun decât rivalii americani ChatGPT și Google. Dar majoritatea juriului a considerat că este greu să le diferențieze pe cele trei.
În e-mailurile de afaceri, DeepSeek a fost bun la expunerea raționamentului. „Îmi place claritatea argumentului”, a spus un jurat. „Dă dovadă de autocunoaștere și recunoaște obstacolele”.
Un alt jurat a apreciat limbajul folosit de DeepSeek, inclusiv aliterațiile și o glumă într-un e-mail. În mesajul de despărțire, juratul a spus că modul în care a prezentată vestea a fost „sincer și real”.
Cea mai mare problemă a DeepSeek: scrie emailuri „prea multe, prea lungi”, a spus unul dintre jurați. În medie, doar Copilot a scris e-mailuri care au fost mai lungi. În plus, un alt jurat a subliniat și utilizarea „nefirească” de către DeepSeek a prea multor cuvinte multisilabice.
Claude a căzut și el într-o capcană, dar…pare mai bun decât omul
E-mailurile lui Claude nu au fost perfecte – chiar și el a căzut o dată în capcana „Sper că acest e-mail vă găsește bine” și în alte fraze revelatoare despre care unul dintre „judecători” a spus că sunt „soooooo AI”. Dar, în medie, e-mailurile lui Claude au părut mai umane decât ale celorlalți și au fost cu aproximativ cinci puncte mai bune decât e-mailurile mele scrise de oameni în punctajul acordat de judecător.
Claude „folosește un limbaj precis și respectuos, fără a fi prea corporatist sau impersonal”, a spus un jurat. „A fost mai structurat, mai natural și mai armonizat emoțional, ceea ce îl face să pară mai demn de încredere decât ceilalți”.
Un altul a spus că Claude a arătat chiar și puțină „conștiință de sine” în e-mailul test despre concedieri: Acesta a dat detalii despre oferta de concediere a companiei și apoi a adăugat: „Recunosc că acest pachet este modest”.
„Ce a făcut Claude mai bine decât un om? În e-mailurile de afaceri, Claude a folosit argumente bazate pe cercetare și părea să anticipeze obiecții care aduceau în context și idei la care nu m-aș fi gândit de unul singur”, a punctat un jurat.
Claude a fost, de asemenea, capabil să facă câteva glume. În testul privind un e-mail amuzant pentru a convinge un soț să se mute la Polul Nord, majoritatea AI-urilor au fost doar glumețe. Dar Claude a încercat să râdă cu adevărat. Aproape de începutul e-mailului său, Claude a scris: „Înainte să începi să cauți frenetic pe Google «cum să divorțezi de cineva care vrea să trăiască cu urșii polari», ascultă-mă”. „Asta e amuzant”, a remarcat un membru al juriului.