08 septembrie 2025
8
41 min
0.00

Segmentare predictivă 102: tehnologie și metrici
Disciplina marketingului a parcurs un drum lung de la începuturile sale modeste cu milenii în urmă. Și astfel s-au îmbunătățit și instrumentele noastre. De la tablete de lut și agende de hârtie la fișiere de calcul în software și sisteme avansate de inteligență artificială. Ne străduim întotdeauna să obținem rezultate mai bune și căutăm noi modalități de a le atinge. În același timp, nu dorim să facem muncă plictisitoare, și este de înțeles — cu atât de multe sarcini pe cap, pur și simplu nu ne putem permite să facem totul manual.
Acesta este motivul pentru care domeniul automatizării în marketing înregistrează o creștere explozivă. Creăm conținut și texte cu ajutorul AI, generăm recomandări de produse personalizate și automatizăm sarcini și fluxuri de lucru de rutină. Toate acestea pentru a obține rezultate mai bune petrecând mai puțin timp.
Segmentarea clienților este o parte a ecuației care a fost dificil de automatizat. Cel puțin până de curând. Cu toate acestea, odată cu apariția segmentării predictive (pe care am acoperit-o anterior), putem grupa clienții pe pilot automat — obținând în același timp rezultate superioare.
În acest articol, vom explora tehnologia sa de bază pentru a ști tot ce este necesar pentru a obține rezultate mai bune. Și vom încerca să o facem cât mai accesibilă posibil, astfel încât cei fără o diplomă în statistici avansate să nu-și supraîncarce mintea. Aveți alte lucruri care să vă ocupe capacitatea mentală, nu-i așa?
Noțiuni de bază despre segmentarea predictivă vs. metodele descriptive
Segmentarea este o tehnică importantă în marketing. Scopul său este de a separa o bază de clienți în grupuri distincte, pe baza caracteristicilor comune. În mod tradițional, aceasta a fost realizată manual pe baza obiectivelor de afaceri. De exemplu, un anumit produs poate fi promovat exclusiv către femei. Sau o promoție poate fi arătată doar utilizatorilor de pe dispozitive mobile.
Aceste metode pot fi, de asemenea, denumite descriptive, deoarece se concentrează pe gruparea datelor existente ale clienților (adică "descriindu-le").
Am acoperit unele dintre cele mai comune abordări în articolul nostru anterior. Dar aici este o recapitulare rapidă a acestor metode:
Segmentarea demografică
Această abordare fundamentală împarte clienții pe baza trăsăturilor comune ale acestora, cum ar fi vârsta, genul, venitul și nivelul de educație. De exemplu, un brand de lux ar putea ținti profesioniști cu venituri mari în vârsta de 40 de ani, în timp ce un retailer de modă rapidă se concentrează pe clienții mai tineri, cu venituri moderate.
Companiile pot crea combinații foarte specifice ale acestor factori, cum ar fi "femei căsătorite cu vârsta între 25-34 de ani, cu diplome de absolvire," pentru a-și direcționa precis eforturile de marketing și dezvoltarea produselor.
Segmentarea geografică
Țintirea bazată pe locație ia în considerare nu doar locația fizică, ci întregul context al locului în care clienții trăiesc și muncesc. Acest lucru include setările urbane versus rurale, condițiile climatice, densitatea populației și preferințele culturale unice pentru anumite regiuni.
Abordări moderne precum geofencing au făcut mai ușor pentru afaceri să ajungă la clienți în locații specifice în timp real.
Un lanț de retail ar putea ajusta mixul de produse în funcție de tiparele meteorologice locale, sau un restaurant ar putea modifica meniul pentru a acomoda preferințele gustative regionale. Această metodă este deosebit de valoroasă pentru afacerile care se extind pe piețe noi sau își optimizează rețelele de distribuție.
Segmentarea psihografică
Această analiză mai profundă examinează aspectele psihologice ale comportamentului consumatorului, inclusiv alegerile de stil de viață, valorile personale, interesele și atitudinile. Ea răspunde la întrebări despre de ce clienții fac anumite alegeri prin gruparea lor în categorii precum „entuziaști ai sănătății”, „adoptanți timpurii de tehnologie” sau „consumatori conștienți de mediu”. Companiile folosesc aceste informații pentru a crea mesaje de marketing care să rezoneze cu valorile și aspirațiile fundamentale ale publicului țintă, creând conexiuni emoționale mai puternice cu brandul lor.
Segmentarea comportamentală
Analizând modul în care clienții interacționează cu produsele sau serviciile, companiile îi pot grupa în funcție de acțiunile lor, mai degrabă decât de caracteristicile lor. Aceasta include frecvența achizițiilor, loialitatea față de brand, rata de utilizare și răspunsul la inițiativele de marketing. De exemplu, o companie de software ar putea separa utilizatorii avansați de cei ocazionali, sau un magazin de retail ar putea identifica pe cei care caută oferte față de cumpărătorii de produse premium. Această segmentare ajută la dezvoltarea de strategii de retenție targetate și campanii personalizate.
Segmentarea bazată pe valoare
Această metodă se concentrează pe relația economică dintre clienți și afacere, luând în considerare factori precum valoarea pe durata de viață a clientului, frecvența achizițiilor și valoarea medie a comenzii. Companiile folosesc această abordare pentru a identifica segmentele de clienți cele mai profitabile și pentru a înțelege ce îi face valoroși. Aceste informații ghidează deciziile strategice privind alocarea resurselor, ajutând companiile să investească mai mult în atragerea și păstrarea clienților de înaltă valoare.
Segmentarea RFM
Această abordare puternică combină trei metrici cheie pentru a evalua și segmenta clienții:
- Recența—cât de recent au făcut o achiziție.
- Frecvența—cât de des cumpără.
- Valoarea monetară—cât cheltuiesc.
De exemplu, un client care a cumpărat ceva săptămâna trecută, cumpără lunar și cheltuie sume semnificative ar fi considerat foarte valoros. RFM ajută companiile să identifice cei mai buni clienți, să observe pe cei care sunt în pericol de a rupe relația și să creeze campanii de marketing targetate pentru fiecare segment. Este deosebit de eficient pentru companiile de retail și ecommerce care doresc să își optimizeze strategii de implicare și retenție a clienților.
Ce metodă de segmentare este potrivită pentru afacerea mea?
Cum funcționează segmentarea predictivă
În timp ce segmentarea descriptivă se bazează pe reguli definite manual și criterii clare („clienții care au cheltuit peste 100 de dolari luna trecută” sau „femei cu vârsta între 25-34 de ani”), segmentarea predictivă folosește o abordare complet diferită. În loc să folosească reguli fixe, analizează tiparele din datele istorice ale clienților pentru a anticipa comportamente viitoare. De exemplu, în loc să privească doar la achizițiile anterioare, poate identifica tendințe subtile care indică faptul că un client este probabil să cumpere din nou în curând. Puterea acestei abordări constă în capacitatea sa de a procesa cantități mari de puncte de date interconectate. Când un marketer creează segmente, de obicei, se concentrează pe 3-4 variabile cheie cel mult—este pur și simplu prea complex să se ia în considerare mai multe.
Algoritmii de învățare automată, totuși, pot analiza simultan sute de variabile: nu doar cele evidente, cum ar fi istoricul achizițiilor și demografia, ci și schimbările minore în comportamentul de navigare, răspunsul la campaniile anterioare, tendințele sezoniere și chiar timpul dintre vizitele pe site.
Aceste algoritmi nu analizează doar variabilele individuale în izolare. Ei identifică relații complexe între diferiți factori. De exemplu, un model predictiv poate descoperi că clienții care navighează pe site-ul tău în serile din timpul săptămânii, deschid în mod regulat emailurile tale și au făcut cel puțin două achiziții în categorii diferite sunt extrem de probabil să răspundă următoarei tale promoții. Aceste tipare ar fi aproape imposibil de observat prin analiza manuală și sunt unice pentru fiecare afacere.
Trecut vs. viitor: O diferență fundamentală
Cea mai importantă distincție între segmentarea descriptivă și cea predictivă constă în relația lor cu timpul. Segmentarea descriptivă este inerent orientată înspre trecut — poate doar să îți spună despre ce au făcut deja clienții sau cine sunt în prezent.
Când marketerii creează reguli precum "clienți care au achiziționat în ultimele 30 de zile" sau "vizitatori care au abandonat coșul", ei folosesc istoria pentru a ghici comportamentele viitoare.
Segmentarea predictivă, pe de altă parte, răspunde direct la întrebarea care contează cu adevărat pentru afaceri: "Ce va face acest client în continuare?"
În loc să presupună că comportamentul din trecut va continua, aceasta prevede activ acțiunile viitoare. În loc să creeze un segment de "clienți care au cumpărat frecvent în trecut", identifică "clienți probabil să facă o achiziție în următoarele două săptămâni" — chiar dacă unii dintre acești clienți nu se încadrează în profilul tradițional al unui cumpărător frecvent.
Această trecere de la analiza descriptivă la cea predictivă schimbă fundamental modul în care afacerile pot aborda marketingul lor. În loc să reacționeze la comportamentele din trecut, ele pot interacționa proactiv cu clienții, bazându-se pe acțiunile lor viitoare anticipate.
Cheia segmentării predictive
Pentru a înțelege cum funcționează segmentarea predictivă, haideți să privim sub capotă. Deși nu trebuie să fii un om de știință în date pentru a folosi această tehnologie, cunoașterea bazelor te va ajuta să iei decizii mai bune despre când și cum să o folosești în marketingul tău.
Pregătit? Să începem!
Pipeline-ul de date
Segmentarea predictivă este alimentată de date. Cu cât ai mai multe date, cu atât mai bine. Iar calitatea și completitudinea lor afectează direct acuratețea predicțiilor.
Ce date ai nevoie
Modelele predictive oferă cele mai bune rezultate atunci când pot lua în considerare întreaga imagine a clientului. Deși fiecare afacere este unică, există mai multe tipuri cheie de date care conduc la predicții eficiente:
Date comportamentale
- Interacțiuni cu site-ul și aplicația: Pagini vizualizate, timpul petrecut, funcționalități utilizate
- Engagement cu campanii: Deschideri de email, clicuri, răspunsuri la oferte diferite
- Preferințe de conținut: Ce articole citesc, videoclipuri pe care le vizionează, produse pe care le navighează
- Tipare de căutare: Ce caută pe site-ul tău
Date tranzacționale
- Istoric achiziții: Ce cumpără și când
- Valori ale comenzilor: Cât cheltuiesc în mod obișnuit
- Preferințe de produs: Categorii și articole specifice preferate
- Metode de plată: Cum preferă să plătească
- Statusul abonamentului: Dacă sunt pe un plan recurent
Atributele clientului
- Date demografice de bază: Vârsta, locația, sexul
- Informații de contact: Cum preferă să fie contactați
- Detalii cont: De cât timp sunt clienți
- Câmpuri personalizate: Orice date specifice importante pentru afacerea dvs.
- Statusul programului de loialitate: Dacă aveți unul
Partea cea mai bună? Nu aveți nevoie de toate aceste date pentru a începe—predicțiile pot funcționa cu orice informație pe care o aveți disponibilă. Pe măsură ce colectați mai multe date în timp, rezultatele devin mai precise și mai nuanțate.
Sursele și fluxul de date
Dacă utilizați cel puțin o soluție software pentru a vă automatiza marketingul, deja colectați date valoroase ale clienților. Totuși, înainte ca aceste date să fie transmise către sistemul dvs. de segmentare predictivă, trebuie să vă asigurați că sunt toate colectate și stocate corespunzător.
În general, este mai bine să aveți o locație centrală care să unifice datele din toate sursele dvs. existente de date. Platformele de date ale clienților (CDP) sunt perfecte pentru acest lucru.
CDP acționează ca un hub care colectează toate datele dvs. într-un singur loc și le folosește pentru a crea predicții (cu excepția cazului în care vă bazați pe o soluție terță parte). Acesta vă permite să:
- Conectați date din mai multe surse într-o vizualizare unică a clientului
- Actualizați profilurile clienților în timp real
- Asigurați consistența datelor între diferite sisteme
- Faceți datele accesibile pentru predicții atunci când este necesar
Pentru a îmbogăți datele CDP, ați dori să conectați alte surse de date, cum ar fi:
- Sisteme CRM: Informații despre clienți și istoricul interacțiunilor
- Platforme de analiză: Comportamentul pe site și aplicații
- Instrumente de marketing: Angajamentul în campanii și răspunsurile
- Sisteme de suport: Interacțiuni cu serviciul pentru clienți
- Baze de date personalizate: Orice alte date colectate
Țineți cont că nu colectați date o singură dată—pentru cele mai bune rezultate, aveți nevoie de un sistem pentru a menține un flux continuu de informații, inclusiv:
- Achiziții noi
- Comportamentul clientului
- Răspunsurile la campanii
Acest flux continuu permite segmentelor predictive să rămână actualizate și să reflecte comportamentul și preferințele cele mai recente ale clienților dvs. De exemplu, dacă un client începe să arate semne de implicare scăzută, acesta poate fi mutat automat într-un alt segment care ar putea necesita atenție specială.
Colectați toate datele dvs. de marketing într-un singur loc
De ce contează datele curate
Îți amintești de „What Goes Around... Comes Around?” a lui Justin Timberlake? Cu segmentarea predictivă, nu este foarte diferit. Calitatea datelor tale de intrare influențează direct calitatea predicțiilor realizate de un sistem. Problemele comune includ:
- Înregistrări duplicate ale clienților
- Informații lipsă sau incorecte
- Formatare inconsistentă
- Date depășite
Acesta este motivul pentru care majoritatea sistemelor predictive includ pași automați de curățare a datelor. Ele standardizează și verifică datele înainte de a le folosi pentru a face predicții.
Știai că?
Yespo CDP curăță automat și pregătește datele necesare pentru segmentare. Dacă ai realizat toți pașii tehnici de configurare, cum ar fi instalarea unui script de urmărire web, nu trebuie să faci nicio curățare suplimentară a datelor.
Construirea modelului
Odată ce datele sunt gata, sistemul începe să caute tipare care pot ajuta la prezicerea comportamentului viitor al clienților. Gândește-te la acest proces ca la conectarea a nenumărate puncte din datele tale de clienți pentru a dezvălui o imagine clară a ceea ce înseamnă diferitele acțiuni pentru acțiunile lor viitoare. Sistemul poate utiliza diverse tipuri de modele, în funcție de ceea ce vrei să prezici. Cel mai comun tip pentru comportamentul clienților este clasificarea—unde scopul este să sortezi clienții în grupuri binare pe baza a ceea ce este probabil să facă în continuare (de ex., cumpărători vs. non-cumpărători). Alte modele ar putea căuta grupări naturale de clienți similari (clustering) sau să prezică valori specifice precum sumele viitoare ale achizițiilor (regresie). În scopuri de marketing, modelele de clasificare sunt deosebit de valoroase deoarece răspund la întrebări practice precum „Va cumpăra acest client în următoarele 30 de zile?” sau „Este probabil ca acest client să renunțe?” Acestea fac acest lucru învățând din exemplele anterioare de clienți care au luat sau nu aceste acțiuni.
Cum învață sistemul
Sistemul analizează datele istorice pentru a înțelege ce s-a întâmplat în trecut. Să presupunem că vrei să prezinți care clienți vor face o achiziție în luna următoare. Sistemul examinează două grupuri de clienți din trecut:
- Cei care au făcut o achiziție în decurs de 30 de zile
- Cei care nu au făcut o achiziție în acel interval de timp
Pentru fiecare grup, examinează sute de semnale diferite:
- Cât de recent au vizitat site-ul tău
- Ce pagini au vizualizat
- Dacă ți-au deschis emailurile
- Tiparele lor anterioare de achiziție
- Cum interacționează cu brandul tău
- Și multe alte puncte de date
În timp, sistemul începe să recunoască care combinații ale acestor semnale prezic cel mai sigur achizițiile viitoare. Unele tipare pot fi evidente, precum vizitatorii frecvenți ai site-ului fiind mai predispuși să cumpere. Altele pot fi conexiuni subtile care ar fi imposibil de observat manual—ca de exemplu clienții care navighează articolele tale de ajutor fiind mai predispuși să facă achiziții mai mari. Același proces se aplică la orice acțiune a clientului pe care vrei să o prezici, fie că este vorba de renunțare, upgrade-uri sau angajament cu produse specifice. Sistemul învață continuu din date noi, rafinându-și înțelegerea despre ceea ce înseamnă diferitele comportamente ale clienților pentru acțiunile viitoare.
Transformarea tiparelor în predicții
Aici intervine clasificarea. Ea plasează clienții în grupuri diferite în funcție de probabilitatea lor de a lua o acțiune specifică. De exemplu, sistemul ar putea clasifica clienții astfel:
- "Foarte probabil să cumpere" (probabilitate de 80%+)
- "Probabil să cumpere" (probabilitate între 50-80%)
- "Puțin probabil să cumpere" (probabilitate între 20-50%)
- "Foarte puțin probabil să cumpere" (probabilitate sub 20%)
Aceste probabilități se bazează pe cât de mult comportamentul actual al unui client se potrivește cu tiparele care au dus la achiziții în trecut. De exemplu:
- Un client care vizitează site-ul dvs. de trei ori într-o săptămână, deschide toate emailurile și se uită la paginile de prețuri ar putea avea o probabilitate de 85% de a cumpăra.
- Cineva care nu a deschis emailurile dvs. de două luni și a vizitat doar o dată ar putea avea o probabilitate de 20%.
- Un client care a vizualizat recent produse similare de mai multe ori, dar nu a cumpărat, ar putea avea o probabilitate de 60%.
Sistemul actualizează continuu aceste predicții. Un client care era "puțin probabil să cumpere" săptămâna trecută ar putea trece în categoria "ar putea cumpăra" după ce a interacționat cu cea mai recentă campanie de emailuri. Această natură dinamică înseamnă că segmentele dvs. sunt mereu actualizate, reflectând cel mai recent comportament al clientului.
Cu modele predictive, puteți rula campanii eficiente și profitabile, petrecând mai puțin timp ajustând și actualizând segmentele manual. Totuși, nu fiecare model produce rezultate egale, de aceea avem nevoie de o modalitate de a evalua performanța și rezultatele acestora. Aici intervin metricii de evaluare.
Evaluarea modelului
Pentru a înțelege mai bine cum să evaluați modelele predictive, imaginați-vă acest scenariu: Aveți o grămadă mare de fân în fața dvs. Vedeți unde duce? Da, este vorba despre ace. Nu un singur ac, ci multe ace în acea grămadă de fân pe care trebuie să le găsiți.
Cu toate acestea, acele nu sunt toate la fel. Unele sunt mai lungi, altele sunt mai groase, iar unele sunt chiar curbate! Nu este cea mai ușoară sarcină, nu-i așa?
Matricea de Confuzie
Având în vedere obiectivul, proiectați o sită specială, care filtrează fânul și găsește acele în el. Acesta este modelul dvs. predictiv, ca să spunem așa. Totuși, având în vedere că acele sunt diferite și că fânul nu este uniform, uneori va lăsa acele în fân, iar alteori fânul va trece prin sită ca și cum ar fi un ac.
În modelarea predictivă, avem un instrument numit matricea de confuzie, care descrie această situație. Este o grilă de 2X2 care acoperă aceste scenarii.
Iată ce înseamnă:
Adevărat pozitiv (TP): Modelul prezice corect clasa pozitivă. Este ca atunci când filtrul tău extrage corect un ac.
Fals pozitiv (FP): Modelul a prezis un rezultat care nu era adevărat. Este atunci când filtrul tău extrage un pai în loc de un ac real.
Fals negativ (FN): Modelul nu a prezis un rezultat adevărat. Imaginează-ți o situație în care filtrul tău lasă un ac într-un car de fân, în loc să-l filtreze corect.
Adevărat negativ (TN): Modelul prezice corect o clasă negativă. Filtrul tău lasă un pai acolo unde îi este locul—în carul de fân.
Măsurători utilizate pentru evaluarea modelelor predictive
Când lucrăm cu modele (exact ca filtrul nostru pentru ace), este important să avem o măsură prin care să putem evalua eficiența soluției noastre. Pentru asta, avem diferite măsurători. Aceste măsurători sunt diferite și sunt utilizate pentru diferite scenarii. Să analizăm mai atent cele mai comune dintre ele și când ar trebui folosite.
Acuratețea
Când vine vorba de evaluarea modelului, acuratețea este cea mai simplă și directă măsură din trusa noastră de instrumente. Se calculează ca raportul dintre predicțiile corecte și numărul total de predicții.
Este o formulă simplă și ușor de înțeles, bună pentru evaluarea inițială și seturi de date echilibrate (adică ai aproximativ același număr de ace și paie în carul de fân).
Cu toate acestea, acuratețea nu este suficientă pentru scenarii mai complexe și seturi de date dezechilibrate. Să luăm un exemplu: ai 5 ace și 95 de paie. Modelul poate semnala totul ca paie, iar acuratețea va fi de 95%. Deși acest lucru pare un rezultat bun, în realitate, nu am obținut niciun ac din sită.
Datorită acestui fapt, acuratețea nu este cea mai de încredere măsură. Totuși, are utilizările sale pentru seturi de date echilibrate și situații în care erorile nu sunt critice.
Avantajele utilizării acurateței
- Simplu, ușor de înțeles și rapid de calculat
- Funcționează bine pentru seturi de date echilibrate
- Larg aplicabil la diferite tipuri de modele de clasificare
Dezavantajele utilizării acurateței
- Induce în eroare pentru seturi de date dezechilibrate, unde poate ascunde performanțe slabe pe clasele minoritare
- Nu distinge între diferite tipuri de erori (false pozitive vs. false negative)
- Nu este adecvat când costurile diferitelor erori variază
Când să utilizezi acuratețea
Seturi de date echilibrate: Acuratețea este cea mai eficientă când atât cazurile pozitive, cât și cele negative apar în proporții similare.
Erori cu cost redus: Când falsurile pozitive și falsurile negative sunt la fel de importante sau au un impact redus (de exemplu, clasificarea emailurilor spam).
Evaluarea inițială a modelului: Este adesea folosită ca măsură de bază pentru evaluarea rapidă a modelului înainte de a trece la măsurători mai detaliate precum precizia, rechemarea sau scorul F1.
Precizia
Precizia este una dintre cele două metrici cele mai importante utilizate în procesul de evaluare a modelului (cealaltă este recall-ul). Aceasta măsoară acuratețea predicțiilor pozitive și este calculată ca un raport între toate predicțiile pozitive corecte și toate cazurile etichetate ca pozitive.
În majoritatea cazurilor, este o metrică mai precisă decât acuratețea (joc de cuvinte intenționat) și este relevantă mai ales în cazurile în care pozitivele false sunt mai dăunătoare decât negativele false.
Să revenim la exemplul nostru cu fânul. Dacă modelul nostru a identificat 100 de obiecte ca fiind ace, și în realitate, 90 erau acele reale (pozitive adevărate), iar 10 erau fire de paie (pozitive false), putem spune că are o precizie de 90%.
Cu toate acestea, ceea ce precizia nu ne spune este câte ace au fost lăsate în urmă în fân. Imaginează-ți că există 200 de ace în total, dar modelul a identificat doar 90 dintre ele. Aceasta înseamnă că modelul a ratat 110 ace (negative false), ceea ce este o informație critică dacă ne interesează să găsim cât mai multe ace posibil. Doar precizia nu capturează acest aspect.
Pro-uri ale utilizării preciziei
- Se concentrează pe minimizarea pozitivele false, ceea ce este crucial atunci când acestea sunt costisitoare (de exemplu, filtrele de spam, detectarea fraudei)
- Furnizează perspective acționabile prin asigurarea că predicțiile pozitive sunt de încredere
Contra ale utilizării preciziei
- Nu ține cont de negativele false, care pot fi problematice atunci când este important să prinzi toate pozitivele (de exemplu, diagnosticul medical)
- Poate fi înșelătoare în seturi de date puternic dezechilibrate
Când să folosești precizia
Precizia este ideală în cazurile în care pozitivele false sunt mai problematice decât negativele false. Unele exemple specifice includ:
Identificarea tranzacțiilor frauduloase în sistemele financiare:
- Pozitivele false (etichetând tranzacțiile legitime ca fiind frauduloase) pot provoca nemulțumirea clientului, astfel că o precizie ridicată asigură că doar cazurile cu adevărat frauduloase sunt etichetate.
Detecția email-urilor spam:
- O precizie ridicată garantează că email-urile legitime nu sunt marcate greșit ca spam, menținând încrederea utilizatorului.
Teste medicale pentru boli rare:
- În anumite scenarii (de exemplu, un test de urmărire extrem de invaziv sau costisitor), pozitivele false (indivizi sănătoși etichetați incorect ca fiind bolnavi) pot duce la stres și cheltuieli inutile, făcând ca precizia să fie o prioritate.
Recuperarea informațiilor și motoarele de căutare:
- Când se clasifică rezultatele căutării, precizia asigură că cele mai relevante rezultate apar în partea de sus. Pozitivele false (rezultate irelevante) degradează experiența utilizatorului.
Recall
Recall-ul (cunoscut și ca sensibilitate sau rata pozitivă adevărată) este o altă metrică crucială pentru evaluarea modelelor. Este utilizat pentru a măsura capacitatea de a captura toate clasele pozitive și este calculat ca un raport între predicțiile pozitive corecte și toate pozitivele reale din setul de date.
Spre deosebire de precizie, care se concentrează pe corectitudinea predicțiilor pozitive, rechemarea pune accent pe identificarea a cât mai multe adevărate pozitive posibil, chiar dacă asta înseamnă să tolereze unele fals pozitive. Acest lucru face ca rechemarea să fie deosebit de relevantă în cazuri în care lipsirea adevăratelor pozitive (fals negative) este mai dăunătoare decât prezicerea fals pozitive.
Haideți să ne reamintim (încă o glumă) exemplul nostru anterior: am identificat 100 de obiecte ca ace, dintre care 90 erau de fapt ace (adevărate pozitive), și 10 erau paie (fals pozitive). Precizia acestui model a fost de 90%. Dar dintr-un total de 200 de ace, am ratat 110 dintre ele, așa că valoarea rechemării noastre este de 45%. Acest model nu este bun la identificarea tuturor claselor pozitive.
Totuși, dacă am fi identificat 380 de obiecte ca ace, și 190 dintre ele erau de fapt ace, modelul nostru ar avea o valoare a rechemării solidă de 95%. Dar precizia este doar de 50%. Acum, ar trebui să puteți vedea un compromis între cele două metrici.
De aceea rechemarea este adesea asociată cu precizia, mai ales în aplicații în care atât fals pozitivele, cât și fals negativele au consecințe semnificative.
La Yespo folosim rechemarea ca metrică de bază pentru evaluarea modelului nostru.
Când vine vorba de segmentarea clienților, costul de a identifica greșit pe cineva ca fiind client este neglijabil.
În același timp, ratând potențiali cumpărători în campaniile tale poate duce la o scădere a veniturilor tale, ceea ce este extrem de nedorit.
Avantaje ale folosirii rechemării
Pune accentul pe capturarea pozitivelor:
- Prioritizează capturarea cât mai multor adevărate pozitive posibil, ceea ce este esențial atunci când fals negativele sunt periculoase (de exemplu, detectarea bolilor)
- Util pentru seturi de date dezechilibrate unde clasa pozitivă este rară
Dezavantaje ale folosirii rechemării
- Ignoră fals pozitivele, ceea ce poate duce la multe alarme false
- Nu este potrivit atunci când precizia este primordială și fals pozitivele sunt problematice
Când se folosește rechemarea
Rechemarea este ideală în scenarii unde ratarea pozitivelor este mai critică decât reducerea fals pozitivelor, incluzând:
Diagnosticarea medicală: În detectarea cancerului sau a altor boli care pun viața în pericol, un fals negativ (lipsa identificării unui pacient bolnav) poate avea consecințe grave. Rechemarea asigură că modelul capturează cât mai multe cazuri adevărate posibil, chiar dacă marchează incorect unii pacienți sănătoși.
Segmentarea de marketing: Afaceri care doresc să își maximizeze veniturile din activitățile de marketing necesită o valoare ridicată a rechemării pentru a captura cât mai mulți potențiali cumpărători posibil. În această aplicație, fals pozitivele (trimiterea unei campanii către potențiali clienți indiferenți) nu au un rezultat negativ semnificativ.
Predicția dezastrelor: Prezicerea unor evenimente rare, dar semnificative, precum cutremurele sau prăbușirile financiare, necesită o rechemare ridicată pentru a asigura că avertismentele critice nu sunt ratate.
Rechemare vs. Precizie
Așa cum am văzut, creșterea preciziei unui model duce la scăderea rechemării, și invers.
Precizie: Se concentrează pe asigurarea faptului că predicțiile pozitive sunt corecte, tolerând mai multe falsuri negative.
Acoperire: Se concentrează pe capturarea cât mai multor valori adevărate pozitive, tolerând mai multe falsuri pozitive.
Niciuna dintre metrici nu oferă singură o imagine completă. În multe cazuri, echilibrarea acoperirii și preciziei este esențială. Acest lucru poate fi realizat folosind scorul F1.
Scorul F1
Scorul F1 este o medie armonică a preciziei și acoperirii, oferind un singur indicator care le echilibrează pe ambele. Este deosebit de util în scenarii în care atât precizia ridicată, cât și acoperirea sunt la fel de importante. Scorul F1 variază între 0 și 1, cu valori mai mari indicând o performanță mai bună a modelului.
Revenind la exemplele noastre cu căpița de fân, pentru primul exemplu (90% precizie și 45% acoperire), scorul F1 va fi 0.60. Pentru al doilea exemplu (50% precizie și 95% acoperire), scorul F1 va fi 0.65. Deși scorurile F1 sunt comparabile, ambele modele au performanțe și rezultate foarte diferite.
Când să utilizați scorul F1
Scorul F1 este cel mai valoros în cazurile în care:
Atât precizia cât și acoperirea sunt critice:
- Echilibrează compromisul dintre falsurile pozitive și falsurile negative. Exemplu: sisteme de recomandare a filmelor, unde trebuie recomandate filme relevante (precizie ridicată) fără a pierde cele care ar putea interesa vizionatorul (acoperire ridicată).
Seturi de date dezechilibrate:
- În seturile de date cu distribuții neuniforme ale claselor, acuratețea poate fi înșelătoare, în timp ce scorul F1 oferă o evaluare mai corectă a performanței.
Avantaje ale utilizării scorului F1
- Echilibrează precizia și acoperirea, oferind o singură metrică pentru a capta performanța modelului
- Util atunci când atât falsurile pozitive, cât și falsurile negative trebuie luate în considerare
- Gestionează mai bine seturile de date dezechilibrate decât acuratețea
Dezavantaje ale utilizării scorului F1
- Nu permite diferențierea de greutăți pentru precizie și acoperire în funcție de contextul problemei
- Poate ascunde informații valoroase din metricile individuale de precizie și acoperire
Scorul F1 este o metrică bună pentru evaluarea modelelor în care precizia și acoperirea sunt ambele importante și există compromisuri. Oferă o evaluare echilibrată, în special pentru seturile de date dezechilibrate, dar ar trebui interpretată alături de precizie și acoperire pentru a lua în considerare prioritățile cazului de utilizare specific.
Segmentarea predictivă cu Yespo CDP
Aici la Yespo, folosim un model avansat de învățare automată pentru a segmenta clienții în funcție de probabilitatea de achiziție, cea mai importantă măsură pentru comerțul electronic.
Pentru a crea aceste predicții, modelul nostru analizează o gamă largă de date, inclusiv istoricul achizițiilor, valoarea și frecvența achizițiilor anterioare, data ultimei acțiuni a clientului, tipare de comportament, date demografice și alți factori.
Această abordare capturează și analizează mai multe date decât poate gestiona în mod rezonabil un agent de marketing.
De acolo, sistemul nostru procedează la crearea unui segment de cumpărători probabili, pe care îl poți folosi în campaniile tale.
Pentru a crea un segment predictiv, mergi la secțiunea Contacte → Segmente → Adaugă segment → Dinamic și selectează opțiunea Probabilitate de achiziție.
Poți alege una dintre cele patru presetări sau poți selecta o valoare manuală Recall—de la 20% la 80%.
După cum știai deja, valoarea de recall ajustează numărul de cumpărători probabili din segmentul creat.
Valorile mai mici (20-50%) vor crea un segment mai restrâns cu un raport mai bun între cumpărători și ne-cumpărători (deoarece precizia va fi mai mare). Acest lucru este excelent pentru campanii foarte țintite sau când scopul tău este să ai cel mai înalt ROMI posibil.
Valorile mai mari vor crea un segment mai larg care are o proporție mai mare de ne-cumpărători (precizie mai redusă) dar acoperă majoritatea cumpărătorilor probabili. Folosește-l când trebuie să maximizezi veniturile și să acoperi o parte semnificativă a listei tale de clienți.
Când vine vorba de presetările noastre, iată ce fac:
- Cumpărători Siguri: Utilizatori cu o probabilitate foarte mare de achiziție. Perfecți pentru produse premium și oferte exclusive, acest segment poate deveni principalul tău generator de venituri.
- Cumpărători Potențiali: Utilizatori cu o probabilitate medie spre mare de achiziție. Acești clienți răspund bine la vânzări sezoniere, lansări de produse și recomandări personalizate.
- Cumpărători Puțin Probabili: Clienți anteriori care nu au făcut o achiziție de mult timp. Campaniile de re-angajare, oferte de recâștigător și mesajele personalizate îi pot ajuta să revină la afacerea ta.
- Cumpărători Nehotărâți: Utilizatori cu o probabilitate mică spre medie de a face o achiziție. S-ar putea să fie interesați, dar nu sunt încă convinși. Ofertele bazate pe stimulente, conținutul educațional sau cererile de feedback îi pot ajuta să fie ghidați.
Utilizarea acestui instrument are câteva avantaje majore:
Viteză și ușurință de creare: Segmentele predictive sunt foarte simple de configurat, economisind timp prețios pe care l-ai fi petrecut altfel creând grupuri manuale complexe.
Performanță mai bună: Algoritmii de învățare automată analizează cantități mai mari de date. Acest lucru permite crearea de segmente mai țintite și mai precise care tind să depășească performanța celor create manual.
Economii de costuri în campanii: Segmentele predictive excelează când trimiți mesaje prin canale precum SMS, unde costul pe mesaj este semnificativ. Folosind această tehnologie, poți face ca fiecare mesaj să performeze și să livreze rezultate eficiente din punct de vedere al costurilor.
Fluxuri de lucru noi:
Pe lângă evenimentele de conversie dorite (de exemplu, achizițiile), segmentele predictive pot aborda și alte evenimente, cum ar fi pierderea clienților. Aceste evenimente nu sunt ușor de configurat prin segmentare manuală și permit campanii creative de retenție.
Testare A/B mai ușoară: Segmentele predictive tind să producă rezultate mai bune, făcându-le perfecte pentru testele A/B ale diferitelor creativități, oferte și alte variabile.
Haideți să aruncăm o privire la câteva exemple reale de aplicare ale acestei tehnologii.
Vreau să testez segmente predictive!
Studiu de caz O.TAJE
O.TAJE, un brand ucrainean de modă pentru femei, a îmbunătățit dramatic campaniile sale Viber prin implementarea de segmentare predictivă prin CDP Yespo. Între iunie-august 2024, au testat segmente predictive comparativ cu abordarea lor tradițională de segmentare manuală.
Într-o campanie notabilă, segmentul lor predictiv a atins:
- 57,83% rată de deschidere (față de 45,24% pentru manual)
- 5,73% rată de conversie (față de 5,14% pentru manual)
- 1010,89% ROMI (față de 389,19% pentru manual)
În general, campaniile care au utilizat segmente predictive au îmbunătățit următorii indicatori:
- 26% rată de clic mai mare
- 300% rată de conversie mai mare
- 310% creștere a ROMI total
Având în vedere rezultatele, O.TAJE planifică să utilizeze segmente predictive pentru alte canale de marketing, în special SMS.
Concluzie
Asta e tot—acum știți tot ce este necesar pentru a utiliza eficient segmentarea predictivă. Cum diferă aceasta de metodele descriptive, ce date sunt folosite, cum sunt construite modelele și cum sunt evaluate.
Înarmați cu aceste cunoștințe, puteți lansa propriile campanii eficiente folosind puterea învățării automate.
Dacă doriți să aflați mai multe despre cum poate funcționa segmentarea predictivă pentru afacerea dumneavoastră—și cum Yespo vă poate ajuta în acest sens—completați formularul de mai jos. Experții noștri vă vor contacta imediat.