Sari direct la conținut

Ce e analiza predictivă, conceptul vechi de decenii care se dovedește crucial în prezent

Cosmin Tanasă, Foto: Cheil | Centrade
Cosmin Tanasă, Foto: Cheil | Centrade

Conceptul de analiză predictivă are o longevitate considerabilă. Își dovedește utilitatea mai mult ca oricând mai ales în această perioadă de dezvoltare accelerată a computerelor.

E destul de ușor să te uiți la tehnologia din prezent și să te gândești că totul a apărut în ultimii 20–30 de ani. Doar că, așa cum e cazul cam cu orice domeniu de activitate, fiecare noutate e construită pe ceva ce exista deja. În cazul tehnologiei și al subiectului de acum – predictive analytics – e vorba de-o dezvoltare firească pe care și oamenii o au nativ.

Predictive analytics e un concept care înglobează diverse tehnici prin care datele pot fi folosite pentru a face prognoze. Și utilitatea e aproape nelimitată, pe nenumărate paliere și în numeroase domenii. Un boost considerabil de capabilități a fost adăugat odată cu dezvoltarea zonei de inteligență artificială, mai precis machine learning.

Astfel, dacă ai un set cuprinzător de date, ai putea să obții o prognoză pentru cum vor evolua lucrurile în viitor. Se poate spune că prevezi ce se întâmplă? Nu chiar, dar e aproape.

Predictive analytics sună a ceva nou, dar de fapt are o vechime de câteva decenii bune

Chiar dacă noi, oamenii, facem nativ prognoză pe baza datelor și asta ne ajută să ne adaptăm la mediu, conceptul așa cum e el înțeles în prezent nu ar fi fost posibil fără calculatoare. Bine, istoric există și exemplul lui Henry Ford care a optimizat fabricarea mașinilor, dar la acea vreme nu avea această umbrelă de interpretare a datelor. Revenind la calculatoare, cu primele iterații în domeniu – anii ‘40 – a început și dezvoltarea domeniului de data analytics. Calculatoarele au avut și încă au acest mare avantaj față de oameni: pot face mult mai multe calcule și să execute operații repetitive fără să se plictisească și fără să obosească.

Odată cu dezvoltarea industriei computerelor au crescut și seturile de date disponibile. Și așa s-a ajuns ca în prezent, de exemplu, prognozele meteo să fie mai precise ca niciodată (deși nu sunt încă 100% exacte) datorită analizei de date.

Dincolo de această utilitate socială considerabilă, analiza de date e folosită de numeroase companii și are un aport incredibil în business, deoarece deciziile care ar fi luate sunt mai precise și mai potrivite nevoilor.

În toată această discuție, statistica este un element important. La acesta se adaugă varietatea datelor, volumul acestora (cât mai multe data points) și variabilitate. În funcție de domeniu, deși asta se întâmplă în cele mai multe, e necesar să se țină cont și de timp: cât de repede pot fi colectate datele și cât de repede pot fi oferite primele concluzii în urma cărora să fie luate decizii. În anumite sisteme, asta se întâmplă automat prin controlul sistemelor bazate pe AI. Nu în ultimul rând, contribuie enorm veridicitatea datelor. Cumva firesc, nu poți lua decizii pe date false.

Deși analizele predictive pot fi aplicate pentru majoritatea organizațiilor, există anumite industrii care beneficiază cel mai mult în urma adoptării acestor analize.

Susa foto: Pexels/Lukas

În acest sens, am vorbit cu Cosmin Tanasă, BI & Data Engineering Manager (Data Intelligence & Analytics), Cheil | Centrade, despre tehnici și cum pot fi folosite acestea în optimizări și decizii. În transport, de exemplu, fie că e vorba de cel public, fie că e cel care vizează transportarea mărfurilor dintr-o parte în alta prin diverse mijloace. Iar aplicații de utilitate publică, cum ar fi cele de hărți – Google Maps, Apple Maps sau Waze – folosesc astfel de tehnici pentru a le oferi utilizatorilor diferite rute pentru a ajunge la locul dorit, le sugerează care este cea mai rapidă și estimează cât timp durează călătoria.

“Sistemul bancar este un alt exemplu de domeniu în care e nevoie de așa ceva. Întrucât oamenii apelează la bănci pentru a face împrumuturi sau pentru a economisi, băncile folosesc analizele predictive pentru îmbunătățirea suportului pentru clienți, creșterea eficienței și identificarea activităților frauduloase, a clienților care aplică pentru un împrumut, dar nu sunt de încredere, întrucât modelele predictive pot observa anumite caracteristici care nu sunt în tiparul normalului”, a explicat Cosmin. Aceste analize pot fi folosite de asemenea și pentru a întreține loialitatea clienților. Și sunt folosite din plin când vine vorba de prevenirea fraudelor bancare, identificând obiceiuri de consum și semnalizând când ceva iese din tiparul obișnuit.

Mai mult, în sistemele medicale, analizele predictive pot ajuta la stabilirea corectă a diagnosticului sau a previzionării rezultatelor tratamentelor unui pacient pe baza istoricului acestuia și a simptomelor pe care le are. “Iar în vânzări este esențial ca magazinele să aibă stoc în permanență de produse care sunt cumpărate cel mai frecvent. Altfel, clienții le vor alege de la concurență. Totodată, tot în acest domeniu, prin utilizarea analizei de date și accesul la volume mari de date angajații magazinelor pot avea o mai bună înțelegere a comportamentului consumatorilor și a motivației din spatele fiecărui produs cumpărat”, a adăugat acesta. Sunt astfel luate și decizii de creștere a traficului în magazinul fizic sau online, de fidelizare sau de construit și consolidat un customer journey bun.

Ziceam de Henry Ford înainte și merită menționată industria producătoare aici, fabrici în care analizele predictive sunt folosite pentru a optimiza fluxul de lucru, de materiale, dar și determinarea unor eventuale probleme și furnizarea de soluții pentru ele în timp real, automatizat.

Pași prin care pot fi integrate analizele predictive într-un business și limitările

Sunt câteva adevăruri general valabile în cazul predictive analytics. Unul ar fi că astfel de analize sunt pe cât de bune sunt datele și procesele de prelucrare ale lor. Apoi, e esențial ca obiectivul să fie clar și, implicit, procesul care să ducă la el să țină cont de asta. De altfel, înțelegerea obiectivului (managementul riscului, identificarea acțiunilor frauduloase, creșterea loialității clienților etc.) e primul pas pentru un business care își dorește să implementeze așa ceva. Datele și modelele trebuie ulterior gândite în funcție de scopul care trebuie îndeplinit.

Urmează selectarea și pregătirea datelor pentru procesul de modelare și este unul dintre cele mai cronofage procese, deoarece datele trebuie extrase, verificate, ajustate. Modelul va folosi aceste date pentru a „învăța” din evenimentele trecute, iar acestui proces i se alocă în general cam 50–60% din timp.

Apoi se trece la împărțirea setului de date în două eșantioane, unul care conține aproximativ 75–85% din volumul de date, pe baza căruia algoritmul va fi „antrenat”, iar celălalt eșantion va fi cel pe care va fi testată acuratețea algoritmului.

Sursa foto: Adam Nowakowski/ Unsplash

În fine, este etapa implementării mai multor algoritmi de machine learning și testarea fiecăruia pe baza setului de date pe care învață modelul. Sunt apoi comparați indicatorii de performanță pentru fiecare model și alegerea, în final, a celui care a obținut cele mai bune valori.

Pe cât ar fi de dorit să fie un proces fără probleme, există și limitări ale analizelor predictive. “De exemplu, acuratețea și precizia modelelor predictive este dată de completitudinea și acuratețea datelor utilizate când algoritmii au învățat din setul de date. Așadar, un set de date incomplet (cu valori lipsă, cu valori absurde, outliers) poate conduce către un model predictiv defectuos. Sau limitări cauzate de cunoștințele oamenilor din echipa care se ocupă de proiect. În funcție de complexitatea modelului necesar pentru a atinge obiectivul, cum ar fi crearea unui algoritm pentru detectarea acțiunilor frauduloase, este necesar ca echipa să fie construită pe baza experienței”, a explicat Cosmin.

Pentru apelarea la această tehnică, e important de reținut și că e vorba de un duo: Big Data – predictive analytics, deoarece prima este baza fiecărui model de analiză predictivă. Și din acest motiv este foarte important ca procesul de colectare, curățare și pregătire al datelor să fie atent și corect implementat, deoarece procesul implică modele matematice aplicate asupra datelor prezente, dar și a celor istorice, în vederea previzionării comportamentelor din viitor.

Pot fi utilizate doua tipuri de date, atât separat, cât și simultan. Sunt, pe de o parte, datele istorice care sunt stocate de companie, cum ar fi informațiile despre programele de loialitate ale companiei care pot fi utilizate pentru a analiza comportamentul de cumpărare al clienților de până acum și, ulterior, pentru a previziona care sunt campaniile promoționale optime pentru a a-i atrage în continuare.

“În funcție de industria din care face parte organizația, orice tip de date poate fi colectat și analizat pentru a obține informații relevante despre cum funcționează compania (detectarea pacienților bolnavi în sistemul de sănătate, comportamentul consumatorului în vânzări, conținutul pe social media preferat de fiecare utilizator, detectarea fraudelor în securitate etc.). Tipurile de date pot fi atât de tip structurat (tranzacții istorice, erori din sistemul de producție, informații din inventare), cât și de tip nestructurat (interacțiuni pe canalele de social media precum tweeturi, postări, reviewuri online, mailuri, fișiere audio și video).”

În cazul datelor în timp real, cel mai bun exemplu e cu aplicațiile de hărți. Acolo nu ai putea obține o estimare realistă a timpului necesar fără monitorizare și analizare continuă. În general, zona de servicii are nevoie de analiza în timp real. Pe aceeași infrastructură de analiză predictivă funcționează și platformele de video streaming sau rețelele sociale.

Ce oferă în primul rând analiza predictivă e un avantaj competitiv datorită deciziilor luate în urma transformării unor seturi de date care nu exprimă foarte mult în forma brută, dar care, transpuse în modele predictive, pot aduce o înțelegere precisă a publicului țintă, a nevoilor și chiar a deciziilor care pot fi luate. Tehnologia există deja, e doar o decizie de când și cum nu dacă.

Articol susținut de Cheil | Centrade

ARHIVĂ COMENTARII
INTERVIURILE HotNews.ro