Sari direct la conținut

Unde AI nu se descurcă încă. Primul proiect online pentru învățarea pronunției corecte a cuvintelor în limba română folosește vocile unor actori și jurnaliști cunoscuți

HotNews.ro
Unde AI nu se descurcă încă. Primul proiect online pentru învățarea pronunției corecte a cuvintelor în limba română folosește vocile unor actori și jurnaliști cunoscuți
Manual de comunicare în limba română. FOTO: Octav Ganea

Elevii și profesorii, dar și prezentatorii TV, influencerii, realizatorii de podcasturi și, de ce nu, politicienii pot verifica acum gratuit pronunția corectă a cuvintelor în limba română pe Audiodexa.ro, primul dicționar enciclopedic audio din România. „Niciun Vocal AI nu poate pune accentele corect pe toate cuvintele”, explică pentru publicul HotNews fondatoarea platformei, Carmen Ivanov, de ce a ales vocile unor actori și jurnaliști cunoscuți pentru acest dicționar audio și nu a folosit inteligența artificială.

Platforma Audiodexa.ro conține definiții din DEX, DOOM 3 și alte dicționare, dar și informații enciclopedice despre județele și orașele României, râurile și stațiunile turistice, țările lumii și capitalele lor, mările și oceanele, sau planetele din sistemul solar.

Pronunțiile nu sunt generate de inteligența artificială, ci de jurnaliști și actori care iubesc limba română și corectitudinea rostirii. Am aflat mai multe despre acest proiect educativ și gratuit de la Carmen Ivanov, trainer de dicție și fondator Audiodexa.ro, pentru HotNews.ro. 

„Audiodexa a luat ființă după ce am primit zeci de mii de mesaje și întrebări pe chatul dicție.ro despre cum se pronunță corect anumite cuvinte. Astfel, am considerat să construim un instrument util pentru vorbitorii de limbă română și să transpunem audio dicționarul limbii române și nu numai”, povestește Carmen Ivanov pentru HotNews.

Dar ideea a mers mai departe. „Ne referim și la cuvinte greu de pronunțat, care nu se găsesc neapărat în dicționar, dar sunt folosite des de comentatorii sportivi, de jurnaliști în general sau de cei care doresc să pronunțe corect nume de personalități, orașe, județe etc.” 

De asemenea, Audiodexa a apărut și dintr-o nevoie concretă observată în mediul educațional: aceea de a sprijini elevii și profesorii în îmbunătățirea pronunției, a intonației și a modului de comunicare, folosind instrumente moderne și accesibile. „Am pornit de la realitatea că mulți tineri și chiar profesioniști din mass-media întâmpină dificultăți în exprimarea clară și corectă. Astfel, am gândit Audiodexa pentru a face procesul de învățare mai eficient și mai atractiv”, mai spune Carmen.

„Niciun Vocal AI nu va putea pune accentele corect pe toate cuvintele”

Carmen Ivanov. FOTO: Arhiva personală

Povestea alegerii denumirii platformei are și ea o notă anecdotică: „Am cumpărat un domeniu – audiodex.ro –, iar apoi un coleg a rostit greșit numele, a spus audiodexa. A început să ne placă mai mult varianta «greșită». Așa că am luat și domeniul Audiodexa și am continuat de acolo.”

Carmen, care este și vocea primului sintetizator vocal în limba română, explică de ce a ales să folosească doar voci umane, fără ajutor din partea IA pentru Audiodexa.ro:

„Deocamdată niciun Vocal AI nu va putea pune accentele corect pe toate cuvintele – nu este încă antrenat pentru un astfel de nivel de finețe pentru pronunția cuvintelor în limba română și în nicio altă limbă. Audiodexa.ro reprezintă mai mult decât transpunerea pe internet în formă audio și text a unor dicționare ale limbii române. 

Veți găsi cuvinte greu de pronunțat, dar care sunt masiv uzitate de diferite categorii profesionale. Dacă voiam să folosim AI, puteam face asta în mod deosebit de ușor având în vedere că sunt vocea primului sintetizator vocal în limba română – Ivona Text to speech, de la Amazon. 

Dar și pentru că sunt vocea acestui sintetizator știu exact care sunt limitările unui AI, ce poate și ce nu poate face din punct de vedere al pronunției acum Inteligența Artificială. Sunt nuanțe în limba română pe care consider că doar o persoană reală le poate reda vocal (deocamdată).”

Au fost folosite vocile unor actori și jurnaliști cunoscuți

Asta ne duce și la cine sunt vocile din spatele Audiodexa.ro. Selecția vocilor a fost extrem de riguroasă. „Un voice over Audiodexa trebuie să cunoască foarte bine limba română și gramatica, să aibă dicție excelentă, acces la studio profesional și să știe să editeze sunetul conform cerințelor. Înregistrările trebuie să fie de calitate radio – nu ne permitem sirene, câini sau zgomote de fundal.” Apoi, toate sunetele urcate pe Audiodexa sunt masterizate și procesate la cel mai înalt nivel de către specialistul în sunet Alexandru Tuhuț.

Printre vocile care dau viață proiectului se regăsesc jurnaliști și actori cunoscuți: Alex Tuhuț (Kiss FM, Rock FM), Ion Alexandru (PRO TV, Eurosport), Gabriel Cindea (Digi 24), Alexa Stănescu (Edupedu.ro), Petru Stratulat (KanalD 2), Liviu Șoșea (Magic FM), dar și actori precum Vlad Anghel sau tineri talentați ca Rareș Prisăcariu, câștigător la „Românii au talent”. 

„În ceea ce privește editorii text, aceștia sunt în mare parte studenți de la Facultatea de Jurnalism unde predau un curs de Comentariu sportiv și dicție alături de Ion Alexandru, dar și studenți de la cursurile Dicție.ro. De altfel, există chiar un departament de sport coordonat de jurnalistul Ion Alexandru, care se ocupă de introducerea numelor sportivilor, numele stadioanelor, ale antrenorilor de fotbal sau a echipelor de fotbal”, mai spune Carmen Ivanov. 

Pentru cine este folositor Audiodexa

Pronunția nu este lăsată la voia întâmplării. „Ne ghidăm după pronunția sugerată de Academia Română prin DOOM 3 și DEX 09. Sunt mai multe «urechi» care verifică fiecare material. Dacă se strecoară vreo greșeală, utilizatorii ne pot scrie și o corectăm imediat. Totodată, la cuvintele cu pronunție problematică am consultat lingviști sau specialiști pe anumite zone (în fotbal spre exemplu am împrumutat vocea comentatorului sportiv Ion Alexandru) sau am redat pronunția indicată ori de DEX, ori de DOOM, dacă acesta vine să corecteze sau să modifice norma dată de dicționarul explicativ al limbii române”, clarifică Carmen Ivanov. 

Proiectul nu se limitează la lexic. „Încercăm să adăugăm informații enciclopedice – biografii, geografie, artă, sport. De exemplu, nu ne oprim doar la «România este o țară din Europa de Sud-Est», ci oferim detalii despre populație, capitală, regim politic sau chiar curiozități.”

Această ambiție face ca termenul „colosal” să fie folosit des în legătură cu Audiodexa „Din cele peste 80.000 de definiții din dicționar, am reușit să introducem aproape 20% până la momentul lansării. Editorii noștri introduc zi de zi definiții text, dar partea de sunet are un delay de peste 24 de ore, deoarece după ce înregistrăm vocile, acestea suferă diferite modificări, cum sunt: procesare, editare și montare cu Billboard In și Billboard Out, procese care sunt efectuate de multe ori de alte persoane decât cele care dau vocile. Astfel că există o diferență de câteva mii de definiții scrise care așteaptă să fie animate vocal. Sunt însă și voice-overi care, după procesarea care este efectuată doar de către Alex Tuhuț, pot edita și monta sunetele pentru ca apoi să le putem uploada în platformă”, descrie Carmen Ivanov procesul. 

Platforma este gândită pentru un public foarte variat. „Reprezintă o soluție pentru orice persoană care dorește să vorbească o limbă română corectă. Dar, da, am avut în minte elevii și studenții, am avut în minte jurnaliștii care mereu caută să pronunțe corect mai ales la radio sau tv, comentatori sportivi, dar am avut în minte și părinții care pot exemplifica diferite lucruri vocal prin Audiodexa.” 

Interesul a fost imediat vizibil. „În primele zile după lansare am avut câteva mii de accesări pe zi. Topul țărilor de unde vin utilizatorii: România, Republica Moldova, SUA, Germania, Austria, Canada și Spania. Pe județe, clasamentul arată astfel: București – Ilfov, Iași, Brașov, Cluj, Timiș. Iar timpul mediu petrecut pe site este de 3,6 minute – mult peste media obișnuită de 30 de secunde.”

„Platforma asta ar trebui să fie obligatorie în școli”

Deși dezvoltarea costă mult, Carmen Ivanov este categorică: Audiodexa este și va rămâne o platformă gratuită pentru toți utilizatorii. Nu cred că este corect să pui taxă pe vorbirea corectă.”

Finanțarea vine în prezent în proporție de 95% din resurse proprii, generate de Dicție.ro. Restul de 5% a fost susținut prin donații. „Pentru viitor, am înființat Asociația Audiodexa, tocmai pentru a atrage sponsorizări, granturi și parteneriate. Dar sustenabilitatea pe termen lung o vedem în colaborarea cu școli, Ministerul Educației și instituții media.”  

O persoană care știa de proiect de dinainte de lansare i-a spus că Audiodexa ar trebui să devină obligatorie în școli. Carmen Ivanov speră același lucru: „Dacă e mai ușor să asculți decât să citești, măcar așa informațiile să ajungă la elevi – despre domnitori, geografie, cuvinte interesante. Într-o Românie în care „topu’ dă pă lume” sau „dame un grrr” sunt trenduri verbale, Audiodexa încearcă să încline balanța spre corectitudine și claritate.” 

În același timp, Carmen spune că-și dorește să lucreze împreună cu Ministerul Educației pentru a valida și sprijini utilizarea acestui tip de resurse la nivel național. „De asemenea, avem în vedere parteneriate cu posturi de radio și televiziune pentru a crea programe educative dedicate, care să promoveze vorbirea corectă și comunicarea eficientă în spațiul public. Am creat inclusiv câteva spoturi audio care să promoveze Audiodexa și utilizarea platformei și care rulează pe un radio național și câteva radiouri locale deocamdată”, spune ea.  

Pe lângă dicționar și enciclopedie, platforma are deja secțiunea de proverbe și expresii pe înțelesul copiilor. Urmează însă și jocuri educative, exerciții practice de dicție, teste de pronunție cu feedback instant și o aplicație de mobil.

Despre obiectivul final, Carmen Ivanov spune: „Ne-am propus ca dicționarul limbii române în formă audio să fie integral introdus în Audiodexa până la finalul anului 2026.”  Însă tot ea mai spune și că pentru a popula toate secțiunile în mod cât mai complet probabil că-i va prinde 2035 și chiar și așa tot vor continua introducerea în secțiuni a diverselor elemente enciclopedice.

Alegeri București 2025 - Sondaje Live | HotNews.ro

INTERVIURILE HotNews.ro