Segmentacja predykcyjna 102

Segmentacja predykcyjna 102: technologia i metryki

Dyscyplina marketingu przeszła długą drogę od swoich skromnych początków tysiące lat temu. Podobnie rozwijały się nasze narzędzia. Od glinianych tabliczek i papierowych notatników po arkusze kalkulacyjne i najnowocześniejsze systemy sztucznej inteligencji. Zawsze dążymy do uzyskania lepszych rezultatów i szukamy nowych sposobów ich osiągania. Jednocześnie, nie chcemy wykonywać monotonnej pracy, co jest zrozumiałe – mając tyle na głowie, po prostu nie możemy pozwolić sobie na robienie wszystkiego ręcznie.

Dlatego dziedzina automatyzacji marketingu odnotowuje dynamiczny wzrost. Tworzymy treści i teksty przy wsparciu AI, generujemy spersonalizowane rekomendacje produktowe i automatyzujemy rutynowe zadania oraz procesy robocze. Wszystko to, aby osiągać lepsze wyniki przy mniejszym nakładzie czasu.

Segmentacja klientów była częścią równania, którą trudno było zautomatyzować. Przynajmniej do niedawna. Jednak wraz z pojawieniem się segmentacji predykcyjnej (którą omówiliśmy wcześniej), możemy grupować klientów w trybie automatycznym, osiągając przy tym lepsze wyniki.

W tym artykule zbadamy podstawowe technologie, abyście wiedzieli, co jest potrzebne do uzyskania lepszych wyników. Postaramy się, aby było to jak najbardziej przystępne, by ci bez zaawansowanego wykształcenia statystycznego nie przeciążali swoich szarych komórek. Masz przecież inne rzeczy, które zajmują twój umysł, prawda?

Podstawy segmentacji predykcyjnej vs. metody deskryptywne

Segmentacja to ważna technika w marketingu. Jej celem jest podzielenie bazy klientów na odrębne grupy w oparciu o wspólne cechy. Tradycyjnie, była wykonywana ręcznie na podstawie celów biznesowych. Na przykład, pewien produkt może być reklamowany wyłącznie kobietom. Albo promocja może być wyświetlana tylko użytkownikom na urządzeniach mobilnych.

Metody te mogą być również określane jako deskryptywne, ponieważ koncentrują się na grupowaniu istniejących danych klientów (czyli „opisywaniu” ich).

Omawialiśmy część najczęstszych podejść w naszym poprzednim artykule. Oto krótkie podsumowanie tych metod:

Segmentacja demograficzna 

To podstawowe podejście dzieli klientów w oparciu o wspólne cechy, takie jak wiek, płeć, dochody i poziom wykształcenia. Na przykład luksusowa marka może celować w wysokodochodowych profesjonalistów w wieku 40 lat, podczas gdy sprzedawca fast-fashion skupia się na młodszych klientach o średnich dochodach. 

Firmy mogą tworzyć bardzo specyficzne kombinacje tych czynników, takie jak „zamężne kobiety w wieku 25-34 z wyższym wykształceniem”, aby dokładnie celować swoje działania marketingowe i rozwój produktów.

Segmentacja geograficzna 

Targetowanie oparte na lokalizacji uwzględnia nie tylko fizyczne położenie, ale cały kontekst miejsca życia i pracy klientów. Obejmuje to różnice między ustawieniami miejskimi a wiejskimi, warunki klimatyczne, gęstość zaludnienia oraz preferencje kulturowe charakterystyczne dla określonych regionów. 

Nowoczesne podejścia, takie jak geofencing, ułatwiły firmom dotarcie do klientów w określonych lokalizacjach w czasie rzeczywistym. 

Sieć detaliczna może dostosować swoją ofertę produktów do lokalnych wzorców pogodowych, a restauracja może zmodyfikować swoje menu, aby zaspokoić regionalne preferencje smakowe. Ta metoda jest szczególnie wartościowa dla firm rozwijających się na nowe rynki lub optymalizujących sieci dystrybucji.

Segmentacja psychograficzna 

Ta dogłębna analiza bada psychologiczne aspekty zachowań konsumentów, w tym wybory stylu życia, wartości osobiste, zainteresowania i postawy. Odpowiada na pytania, dlaczego klienci dokonują określonych wyborów, grupując ich w kategorie takie jak "entuzjaści zdrowia", "wczesni użytkownicy technologii" czy "świadomi ekologicznie konsumenci". 

Firmy wykorzystują te informacje do tworzenia przekazów marketingowych, które rezonują z wartościami i aspiracjami ich docelowej grupy odbiorców, budując silniejsze emocjonalne więzi z marką.

Segmentacja behawioralna 

Analizując, jak klienci wchodzą w interakcję z produktami lub usługami, firmy mogą grupować ich na podstawie ich działań, a nie cech charakterystycznych. Obejmuje to częstotliwość zakupów, lojalność wobec marki, poziom użytkowania i reakcje na inicjatywy marketingowe. 

Na przykład firma programistyczna może oddzielić intensywnych użytkowników od okazjonalnych, a sklep detaliczny może zidentyfikować łowców okazji w kontraście do kupujących premium. Taka segmentacja pomaga w opracowywaniu ukierunkowanych strategii retencji i spersonalizowanych kampanii.

Segmentacja wartościowa 

Ta metoda koncentruje się na ekonomicznej relacji między klientami a firmą, biorąc pod uwagę czynniki takie jak wartość życiowa klienta, częstotliwość zakupów i średnia wartość zamówienia. Firmy używają tego podejścia, aby zidentyfikować najbardziej dochodowe segmenty klientów i zrozumieć, co czyni je wartościowymi. 

Te informacje kierują strategicznymi decyzjami o alokacji zasobów, pomagając firmom w większym stopniu inwestować w pozyskiwanie i utrzymanie klientów o wysokiej wartości.

Segmentacja RFM

To potężne podejście łączy trzy kluczowe metryki do oceny i segmentacji klientów: 

  • Recency—jak niedawno dokonali zakupu.
  • Frequency—jak często kupują.
  • Monetary value—ile wydają.

Na przykład klient, który kupił coś w zeszłym tygodniu, robi zakupy co miesiąc i wydaje znaczne kwoty, byłby uznawany za bardzo wartościowego. RFM pomaga firmom zidentyfikować ich najlepszych klientów, dostrzec tych zagrożonych odejściem i tworzyć ukierunkowane kampanie marketingowe dla każdego segmentu. 

Jest to szczególnie skuteczne dla firm detalicznych i e-commerce, które chcą optymalizować swoje strategie zaangażowania i retencji klientów.

Która metoda segmentacji jest odpowiednia dla mojego biznesu?

Przegląd opisowych metod segmentacji

Jak działa segmentacja predykcyjna

Podczas gdy segmentacja opisowa opiera się na ręcznie zdefiniowanych zasadach i jednoznacznych kryteriach ("klienci, którzy wydali ponad 100 dolarów w zeszłym miesiącu" lub "kobiety w wieku 25-34 lat"), segmentacja predykcyjna używa zupełnie innego podejścia. 

Zamiast stosowania stałych zasad analizuje wzorce w historycznych danych klientów, aby przewidywać przyszłe zachowania. Na przykład, zamiast tylko patrzeć na przeszłe zakupy, potrafi zidentyfikować subtelne trendy wskazujące, że klient prawdopodobnie wkrótce dokona kolejnego zakupu.

Siła tego podejścia tkwi w zdolności do przetwarzania ogromnych ilości powiązanych punktów danych. Gdy marketer tworzy segmenty, zazwyczaj koncentruje się na 3-4 kluczowych zmiennych—rozpatrzenie większej liczby zmiennych jest po prostu zbyt skomplikowane. 

Algorytmy uczenia maszynowego mogą jednocześnie analizować setki zmiennych: nie tylko takich oczywistych jak historia zakupów i dane demograficzne, ale także drobne zmiany w zachowaniu przeglądania, reakcje na wcześniejsze kampanie, trendy sezonowe, a nawet czas pomiędzy wizytami na stronie internetowej. Te algorytmy nie analizują pojedynczych zmiennych w izolacji. Identyfikują skomplikowane relacje między różnymi czynnikami. Na przykład, model predykcyjny może odkryć, że klienci przeglądający Twoją stronę wieczorami w dni robocze, regularnie otwierający Twoje e-maile i dokonujący przynajmniej dwóch zakupów w różnych kategoriach, będą bardzo prawdopodobnie reagować na Twoją następną promocję. Wzorce te byłyby niemal niemożliwe do dostrzeżenia poprzez ręczną analizę i są unikalne dla każdego biznesu.

Przeszłość vs. przyszłość: Zasadnicza różnica

Najważniejsza różnica między segmentacją opisową a predykcyjną polega na ich związku z czasem. Segmentacja opisowa z natury jest retrospektywna — może powiedzieć Ci tylko o tym, co klienci już zrobili lub kim obecnie są. Kiedy marketerzy tworzą zasady takie jak "klienci, którzy dokonali zakupu w ciągu ostatnich 30 dni" lub "odwiedzający, którzy porzucili koszyk", w zasadzie używają historii do przewidywania przyszłego zachowania. Segmentacja predykcyjna natomiast bezpośrednio odpowiada na pytanie, które naprawdę ma znaczenie dla biznesów: "Co ten klient zrobi dalej?" Zamiast zakładać, że przeszłe zachowanie będzie kontynuowane, aktywnie przewiduje przyszłe działania. Zamiast tworzyć segment "klientów, którzy często kupowali w przeszłości", identyfikuje "klientów prawdopodobnych do dokonania zakupu w ciągu najbliższych dwóch tygodni" — nawet jeśli niektórzy z tych klientów nie pasują do tradycyjnego profilu częstego kupującego. Ta zmiana z analizy opisowej na predykcyjną zasadniczo zmienia sposób, w jaki firmy mogą podejść do swojego marketingu. Zamiast reagować na przeszłe zachowania, mogą proaktywnie angażować się z klientami na podstawie ich prawdopodobnych przyszłych działań.

Segmentacja predykcyjna vs. metody opisowe

Podstawy segmentacji predykcyjnej

Aby zrozumieć, jak działa segmentacja predykcyjna, zajrzyjmy pod maskę. Choć nie trzeba być naukowcem od danych, aby korzystać z tej technologii, znajomość podstaw pomoże Ci podejmować lepsze decyzje na temat tego, kiedy i jak ją wykorzystać w swoim marketingu. Gotowy? Zaczynajmy!

Przepływ danych

Segmentacja predykcyjna jest napędzana danymi. Im więcej danych posiadasz, tym lepiej. I to jakość oraz kompletność bezpośrednio wpływają na dokładność prognoz.

Jakie dane są potrzebne

Modele predykcyjne przynoszą najlepsze rezultaty, gdy mogą uwzględnić pełen obraz klienta. Choć każda firma jest unikalna, istnieje kilka kluczowych rodzajów danych, które napędzają skuteczne prognozy: Dane behawioralne

  • Interakcje na stronie i w aplikacji: Oglądane strony, czas spędzony, używane funkcje
  • Zaangażowanie w kampanie: Otwarcia e-maili, kliknięcia, reakcje na różne oferty
  • Preferencje dotyczące treści: Jakie artykuły czytają, filmy oglądają, produkty przeglądają
  • Wzorce wyszukiwania: Czego szukają na Twojej stronie

Dane transakcyjne

  • Historia zakupów: Co kupują i kiedy
  • Wartości zamówień: Ile zwykle wydają
  • Preferencje dotyczące produktów: Kategorie i konkretne przedmioty, które preferują
  • Metody płatności: Jak preferują płacić
  • Status subskrypcji: Czy są na planie cyklicznym

Atrybuty klientów

  • Podstawowe dane demograficzne: Wiek, lokalizacja, płeć
  • Dane kontaktowe: Jak preferują, aby się z nimi kontaktowano
  • Szczegóły konta: Jak długo są już klientami
  • Pola niestandardowe: Każde konkretne punkty danych ważne dla Twojego biznesu
  • Status w programie lojalnościowym: Jeśli taki posiadasz

Rodzaje danych używanych w modelowaniu predykcyjnym

Najlepsza część? Nie potrzebujesz wszystkich tych danych, aby zacząć—prognozy mogą działać z dostępnymi informacjami. Gdy zbierasz więcej danych, wyniki stają się dokładniejsze i bardziej zróżnicowane.

Źródła danych i przepływ

Jeśli korzystasz przynajmniej z jednego rozwiązania do automatyzacji marketingu, już zbierasz cenne dane o klientach. Jednak zanim te dane zostaną przekazane do systemu segmentacji predykcyjnej, musisz upewnić się, że są prawidłowo zebrane i przechowywane.

Zazwyczaj lepiej jest posiadać jedno centralne miejsce, które łączy dane ze wszystkich istniejących źródeł danych. Platformy Danych Klientów (CDP) są do tego idealne. 

CDP działa jako centrum, które zbiera wszystkie Twoje dane w jednym miejscu i wykorzystuje je do tworzenia prognoz (o ile nie polegasz na rozwiązaniu zewnętrznym). Pozwala ci na:

  • Łączenie danych z wielu źródeł w jeden widok klienta
  • Aktualizowanie profili klientów w czasie rzeczywistym
  • Zachowanie spójności danych w różnych systemach
  • Udostępnienie danych do prognozowania w razie potrzeby

Aby wzbogacić dane CDP, warto podłączyć inne źródła danych, takie jak:

  • Systemy CRM: Informacje o klientach i historia interakcji
  • Platformy analityczne: Zachowanie na stronie i w aplikacji
  • Narzędzia marketingowe: Zaangażowanie i odpowiedzi na kampanie
  • Systemy wsparcia: Interakcje z obsługą klienta
  • Niestandardowe bazy danych: Inne dane, które zbierasz

Pamiętaj, że nie zbierasz danych tylko raz—aby uzyskać najlepsze wyniki, potrzebujesz systemu do utrzymania ciągłego przepływu informacji, w tym:

  • Nowe zakupy 
  • Zachowanie klientów 
  • Odpowiedzi na kampanie

Jak CDP agreguje dane z różnych źródeł w jednym miejscu

Ten ciągły przepływ pozwala twoim segmentom predykcyjnym pozostać aktualnymi i odzwierciedlać najnowsze zachowania i preferencje klientów. Na przykład, jeśli klient zaczyna wykazywać oznaki zmniejszonego zaangażowania, może zostać automatycznie przeniesiony do innego segmentu, który wymaga szczególnej uwagi.

Zbierz wszystkie dane marketingowe w jednym miejscu

Dlaczego warto dbać o czystość danych 

Pamiętasz „What Goes Around... Comes Around” Justina Timberlake’a? W przypadku segmentacji predykcyjnej działa to podobnie. Jakość danych wejściowych bezpośrednio wpływa na jakość prognoz generowanych przez system.

Typowe problemy to:

  • Duplikatowe rekordy klientów
  • Brakujące lub nieprawidłowe informacje
  • Niespójne formatowanie
  • Przestarzałe dane

Dlatego większość systemów predykcyjnych zawiera automatyczne kroki oczyszczania danych. Standaryzują i weryfikują dane przed ich użyciem do prognozowania. 

Czy wiesz, że?

Yespo CDP automatycznie czyści i przygotowuje dane potrzebne do segmentacji. Jeśli wykonałeś wszystkie techniczne kroki konfiguracji, takie jak instalacja skryptu śledzenia sieci, nie musisz wykonywać dodatkowych kroków czyszczenia danych.

Budowanie modelu

Gdy dane są już gotowe, system zaczyna szukać wzorców, które mogą pomóc przewidzieć przyszłe zachowania klientów. To jak łączenie niezliczonych punktów w danych klientów, aby ukazać wyraźny obraz tego, co różne działania oznaczają dla ich przyszłych zachowań.

System może używać różnych typów modeli w zależności od tego, co chcesz przewidzieć. Najczęstszym typem dotyczącym zachowań klientów jest klasyfikacja—gdzie celem jest podzielenie klientów na grupy binarne w oparciu o prawdopodobne przyszłe działania (np. kupujący vs. niekupujący). Inne modele mogą szukać naturalnych grup podobnych klientów (klasteryzacja) lub próbować przewidzieć konkretne wartości, takie jak przyszłe kwoty zakupów (regresja).

Do celów marketingowych modele klasyfikacji są szczególnie wartościowe, ponieważ odpowiadają na praktyczne pytania, takie jak „Czy ten klient kupi w ciągu najbliższych 30 dni?” lub „Czy ten klient prawdopodobnie odejdzie?”. Osiągają to, ucząc się na podstawie wcześniejszych przykładów klientów, którzy podjęli lub nie podjęli takich działań.

Jak system się uczy

System analizuje dane historyczne, aby zrozumieć, co wydarzyło się w przeszłości. Załóżmy, że chcesz przewidzieć, którzy klienci dokona zakupów w najbliższym miesiącu. System analizuje dwie grupy klientów z przeszłości:

  • Tych, którzy dokonali zakupu w ciągu 30 dni
  • Tych, którzy nie dokonali zakupu w tym czasie

Dla każdej z grup bada setki różnych sygnałów:

  • Jak niedawno odwiedzili Twoją stronę internetową
  • Jakie strony przeglądali
  • Czy otwierali Twoje e-maile
  • Ich wzorce zakupowe z przeszłości
  • Jak wchodzili w interakcję z Twoją marką
  • I wiele innych punktów danych

Z czasem system zaczyna rozpoznawać, które kombinacje tych sygnałów najskuteczniej przewidują przyszłe zakupy. Niektóre wzorce mogą być oczywiste, jak to, że częste wizyty na stronie internetowej zwiększają szansę na zakupy. Inne mogą być subtelnymi powiązaniami, które byłyby trudne do zauważenia ręcznie—na przykład klienci przeglądający artykuły pomocnicze mogą mieć skłonność do dokonywania większych zakupów.

Taki sam proces dotyczy każdej akcji klienta, którą chcesz przewidzieć, niezależnie czy to jest rezygnacja, podwyżki czy zaangażowanie w konkretne produkty. System nieustannie uczy się z nowych danych, doskonaląc swoje zrozumienie, co różne zachowania klientów oznaczają dla przyszłych działań.

Proces uczenia się wizualizowany

 

Przekształcanie wzorców w prognozy

To tutaj pojawia się klasyfikacja. Umieszcza klientów w różnych grupach w oparciu o prawdopodobieństwo podjęcia przez nich określonego działania. Na przykład system może sklasyfikować klientów jako:

  • "Bardzo prawdopodobny zakup" (prawdopodobieństwo powyżej 80%)
  • "Prawdopodobny zakup" (prawdopodobieństwo 50-80%)
  • "Mało prawdopodobny zakup" (prawdopodobieństwo 20-50%)
  • "Bardzo mało prawdopodobny zakup" (prawdopodobieństwo poniżej 20%)

Te prawdopodobieństwa bazują na tym, jak bardzo obecne zachowanie klienta odpowiada wzorcom, które w przeszłości prowadziły do zakupów. Na przykład:

  • Klient, który odwiedza Twoją stronę trzy razy w tygodniu, otwiera wszystkie Twoje e-maile i przegląda strony z cenami, może wykazywać 85% prawdopodobieństwo zakupu.
  • Osoba, która nie otworzyła Twoich e-maili od dwóch miesięcy i odwiedziła stronę tylko raz, może wykazywać 20% prawdopodobieństwo.
  • Klient, który ostatnio kilkakrotnie oglądał podobne produkty, ale nie dokonał zakupu, może wykazywać 60% prawdopodobieństwo.

System stale aktualizuje te prognozy. Klient, który był "mało prawdopodobnym nabywcą" w zeszłym tygodniu, może przejść do kategorii "może dokonać zakupu" po zaangażowaniu w najnowszą kampanię e-mailową. Ta dynamiczna natura oznacza, że Twoje segmenty są zawsze aktualne, odzwierciedlając najnowsze zachowanie klientów.

Dzięki modelom predykcyjnym możesz prowadzić skuteczne i dochodowe kampanie, jednocześnie spędzając mniej czasu na ręcznym dopracowywaniu i aktualizowaniu segmentów. Jednak nie każdy model przynosi równe wyniki, dlatego potrzebujemy sposobu na ocenę ich wydajności i wyników. Tutaj wkraczają metryki oceny. 

Ewaluacja modelu

Aby lepiej zrozumieć, jak oceniać modele predykcyjne, wyobraź sobie taką sytuację: Masz przed sobą ogromny stóg siana. Czy widzisz, dokąd to zmierza? Tak, chodzi o igły. Nie jedną, ale wiele igieł w tym stogu, które musisz znaleźć.

Jednak igły nie są wszystkie takie same. Niektóre z nich są dłuższe, inne grubsze, a jeszcze inne krzywe! Nie najłatwiejsze zadanie, prawda?

Dane, jak igły, rzadko są tak jednolite, jak sobie wyobrażamy

Macierz pomyłek

Mając na uwadze cel, opracowujesz specjalne sito, które filtruje siano i znajduje w nim igły. To w pewnym sensie Twój model predykcyjny. Jednak, biorąc pod uwagę, że igły są różne, a siano także nie jest jednolite, czasami zostaną igły w sianie, a czasami siano przejdzie, jakby było igłą.

W modelowaniu predykcyjnym mamy narzędzie zwane macierzą pomyłek, które opisuje tę sytuację. Jest to siatka 2x2, która obejmuje te scenariusze. 

Macierz pomyłek

Oto co to oznacza:

Prawdziwie pozytywne (TP): Model prawidłowo przewiduje klasę pozytywną. To jak kiedy Twój filtr prawidłowo wyciąga igłę.

Fałszywie pozytywny (FP): Model przewidział wynik, który nie był prawdziwy. To jak kiedy Twój filtr wyciąga słomkę zamiast prawdziwej igły.

Fałszywie negatywny (FN): Model nie przewidział prawdziwego wyniku. Rozważ sytuację, kiedy Twój filtr zostawia igłę w stogu siana, zamiast prawidłowo ją przefiltrować.

Prawdziwie negatywny (TN): Model prawidłowo przewiduje klasę negatywną. Twój filtr zostawia słomkę tam, gdzie jej miejsce—w stosie siana.

Metryki używane do oceny modeli predykcyjnych

Pracując z modelami (podobnie jak nasz filtr do igieł), ważne jest posiadanie jakiejś miary, dzięki której możemy ocenić skuteczność naszego rozwiązania. W tym celu mamy różne metryki. Te metryki różnią się i są używane w różnych scenariuszach. Przyjrzyjmy się bliżej najczęściej spotykanym i temu, kiedy należy je stosować.

Dokładność

Jeśli chodzi o ocenę modeli, dokładność jest najprostszą i najbardziej bezpośrednią metryką w naszym zestawie narzędzi. Jest obliczana jako stosunek poprawnych przewidywań do całkowitej liczby przewidywań.

Wzór na obliczenie dokładności

To prosta i łatwa do zrozumienia formuła, dobra do wstępnej oceny i zrównoważonych zbiorów danych (tj. masz mniej więcej taką samą liczbę igieł i słomek w stogu siana).

Jednak dokładność zawodzi w bardziej złożonych scenariuszach i niezrównoważonych zbiorach. Rozważmy przykład: masz 5 igieł i 95 słomek. Model może oznaczyć wszystko jako słomki, a dokładność wyniesie 95%. Chociaż wydaje się to dobrym wynikiem, w rzeczywistości nie wydobyliśmy z naszego sita ani jednej igły.

Wysoka dokładność nie gwarantuje pozytywnych wyników

Ze względu na to, dokładność nie jest najbardziej niezawodną metryką. Mimo to ma swoje zastosowania w zrównoważonych zbiorach danych i sytuacjach, w których błędy nie są krytyczne.

Zalety używania dokładności

  • Prosta, łatwa do zrozumienia i szybka do obliczenia
  • Dobrze działa w przypadku zrównoważonych zbiorów danych
  • Szeroko stosowana w różnych typach modeli klasyfikacyjnych

Wady używania dokładności

  • Wprowadza w błąd w przypadku niezrównoważonych zbiorów danych, gdzie może maskować słabą wydajność w klasach mniejszościowych
  • Nie rozróżnia różnych typów błędów (fałszywie pozytywne vs fałszywie negatywne)
  • Niezalecana, gdy koszty różnych błędów różnią się

Kiedy używać dokładności

Zrównoważone zbiory danych: Dokładność jest najskuteczniejsza, gdy przypadki pozytywne i negatywne występują w podobnych proporcjach.

Błędy o niskim koszcie: Gdy fałszywie pozytywne i fałszywie negatywne mają jednakowe znaczenie lub niskie oddziaływanie (np. klasyfikacja wiadomości spamowych).

Wstępna ocena modelu: Często używana jako bazowa metryka do szybkiej oceny modelu przed przejściem do bardziej szczegółowych metryk jak precyzja, recall czy F1 score.

Precyzja

Precyzja to jedna z dwóch najważniejszych metryk używanych w procesie oceny modelu (drugą jest czułość). Mierzy dokładność pozytywnych przewidywań i jest obliczana jako stosunek wszystkich poprawnych pozytywnych przewidywań do wszystkich przypadków oznaczonych jako pozytywne.

Formuła dla obliczania precyzji

W większości przypadków jest to metryka dokładniejsza niż dokładność (słowo nawiązujące do dokładności), a szczególnie ma znaczenie w sytuacjach, gdy fałszywe pozytywy są bardziej szkodliwe niż fałszywe negatywy.

Wróćmy do naszego przykładu ze stogiem siana. Jeśli nasz model zidentyfikował 100 przedmiotów jako igły, a w rzeczywistości 90 z nich to były rzeczywiste igły (prawdziwe pozytywy), a 10 to słomki (fałszywe pozytywy), możemy stwierdzić, że jego precyzja wynosi 90%.

Wysoka precyzja jest konieczna, gdy potrzebujesz jak najmniej fałszywych pozytywów

Jednak precyzja nie mówi nam, ile igieł zostało pozostawionych w stogu siana. Wyobraź sobie, że jest łącznie 200 igieł, ale model zidentyfikował tylko 90 z nich. Oznacza to, że model przegapił 110 igieł (fałszywe negatywy), co jest istotną informacją, jeśli zależy nam na znalezieniu jak największej liczby igieł. Sama precyzja nie ujmuje tego aspektu.

Zalety korzystania z precyzji

  • Skupia się na minimalizacji fałszywych pozytywów, co jest kluczowe, gdy są one kosztowne (np. filtry spamu, wykrywanie oszustw)
  • Dostarcza wartościowych wniosków, zapewniając, że przewidywania pozytywne są wiarygodne

Wady korzystania z precyzji

  • Nie uwzględnia fałszywych negatywów, co może być problematyczne, gdy ważne jest złapanie wszystkich pozytywów (np. diagnoza medyczna)
  • Może być mylące w przypadku silnie niezrównoważonych zbiorów danych

Kiedy używać precyzji

Precyzja jest idealna w przypadkach, gdy fałszywe pozytywy są bardziej problematyczne niż fałszywe negatywy. Kilka konkretnych przykładów obejmuje:

Identyfikacja transakcji oszukańczych w systemach finansowych:

  • Fałszywe pozytywy (oznakowanie legalnych transakcji jako oszukańcze) mogą powodować niezadowolenie klientów, więc wysoka precyzja zapewnia, że tylko rzeczywiście oszukańcze przypadki są znakowane.

Wykrywanie spamu email:

  • Wysoka precyzja zapewnia, że legalne e-maile nie są błędnie oznaczane jako spam, co chroni zaufanie użytkowników.

Testy medyczne dla rzadkich chorób:

  • W niektórych scenariuszach (np. bardzo inwazyjny lub kosztowny test uzupełniający), fałszywe pozytywy (zdrowi ludzie błędnie oznaczeni jako chorzy) mogą prowadzić do niepotrzebnego stresu i kosztów, dlatego precyzja jest priorytetem.

Wyszukiwanie informacji i wyszukiwarki:

  • Podczas pozycjonowania wyników wyszukiwania precyzja zapewnia, że najbardziej odpowiednie wyniki pojawiają się na górze. Fałszywe pozytywy (nieodpowiednie wyniki) pogarszają doświadczenie użytkownika.

Czułość

Czułość (znana również jako wrażliwość lub współczynnik pozytywów rzeczywistych) to kolejna ważna metryka do oceny modeli. Używa się jej do mierzenia zdolności do uchwycenia wszystkich pozytywnych klas i jest obliczana jako stosunek poprawnych pozytywnych przewidywań do wszystkich rzeczywistych pozytywów w zbiorze danych.

Formuła do obliczania recall

W przeciwieństwie do precyzji, która koncentruje się na poprawności pozytywnych przewidywań, recall kładzie nacisk na identyfikację jak największej liczby prawdziwych pozytywów, nawet jeśli oznacza to tolerowanie pewnych fałszywych pozytywów. Recall jest szczególnie istotny w przypadkach, gdy pominięcie prawdziwych pozytywów (fałszywych negatywów) jest bardziej szkodliwe niż przewidywanie fałszywych pozytywów.

Przypomnijmy sobie (kolejny żart słowny) nasz poprzedni przykład: zidentyfikowaliśmy 100 przedmiotów jako igły, z czego 90 było rzeczywistymi igłami (prawdziwe pozytywy), a 10 było słomkami (fałszywe pozytywy). Precyzja tego modelu wyniosła 90%. Ale mając łącznie 200 igieł, przeoczyliśmy 110 z nich, więc nasza wartość recall wynosi 45%. Ten model nie jest dobry w identyfikacji wszystkich pozytywnych klas.

Jednakże, jeśli zidentyfikowaliśmy 380 przedmiotów jako igły, z czego 190 było rzeczywistymi igłami, nasz model ma wartość recall na solidnym poziomie 95%. Ale precyzja wynosi jedynie 50%. Teraz powinieneś dostrzec kompromis między tymi dwoma metrykami.

Wysoki recall gwarantuje uchwycenie większości igieł

Dlatego właśnie recall często jest sparowany z precyzją, zwłaszcza w aplikacjach, w których zarówno fałszywe pozytywy, jak i fałszywe negatywy mają znaczące konsekwencje.

W Yespo używamy recall jako podstawowej metryki do oceny naszych modeli.

Jeśli chodzi o segmentację klientów, koszt błędnego zidentyfikowania kogoś jako klienta jest znikomy. 

Jednocześnie przeoczenie potencjalnych kupujących w kampaniach może prowadzić do spadku przychodów, co jest wysoce niepożądane.

Zalety użycia recall

Priorytet w uchwyceniu pozytywów:

  • Priorytetem jest uchwycenie jak największej liczby prawdziwych pozytywów, co jest kluczowe, gdy fałszywe negatywy są niebezpieczne (np. wykrywanie chorób)
  • Przydatne w nierównomiernych zbiorach danych, gdzie klasa pozytywna jest rzadka

Wady użycia recall

  • Ignoruje fałszywe pozytywy, co może prowadzić do wielu fałszywych alarmów
  • Nieodpowiednie, gdy precyzja jest kluczowa, a fałszywe pozytywy są problematyczne

Kiedy używać recall

Recall jest idealny w scenariuszach, gdzie pominięcie pozytywów jest bardziej krytyczne niż zredukowanie fałszywych pozytywów, w tym:

Diagnostyka medyczna: W wykrywaniu raka lub innych chorób zagrażających życiu fałszywy negatyw (niezidentyfikowanie chorego pacjenta) może mieć poważne konsekwencje. Recall zapewnia, że model wychwytuje jak najwięcej prawdziwych przypadków, nawet jeśli błędnie oznacza niektórych zdrowych pacjentów.

Segmentacja marketingowa: Firmy, które chcą zmaksymalizować swoje przychody z działań marketingowych, potrzebują wysokiej wartości recall, aby uchwycić jak najwięcej potencjalnych kupujących. W tej aplikacji fałszywe pozytywy (kampania wysyłana do obojętnych leadów) nie mają znaczącego negatywnego skutku.

Prognozowanie katastrof: Przewidywanie rzadkich, ale znaczących wydarzeń, takich jak trzęsienia ziemi czy krachy finansowe, wymaga wysokiego recall, aby upewnić się, że krytyczne ostrzeżenia nie zostaną pominięte.

Recall vs. Precyzja

Jak widzieliśmy, zwiększenie precyzji modelu prowadzi do zmniejszenia recall i odwrotnie. 

Kompromis między wykrywaniem a precyzją

Precyzja: Skupia się na zapewnieniu, że pozytywne prognozy są poprawne, tolerując więcej fałszywych negatywów.

Wykrywanie: Skupia się na wychwytywaniu jak największej liczby prawdziwych pozytywów, tolerując więcej fałszywych pozytywów.

Zarówno wysokie wykrywanie, jak i precyzja mają swoje specyficzne zastosowania

Żadna z tych miar samodzielnie nie daje pełnego obrazu. W wielu przypadkach kluczowe jest zachowanie równowagi między wykrywaniem a precyzją. Można to osiągnąć za pomocą wskaźnika F1.

Wskaźnik F1

Wskaźnik F1 to średnia harmoniczna precyzji i wykrywania, dostarczająca jednej miary, która je równoważy. Jest szczególnie użyteczny w scenariuszach, gdzie zarówno wysoka precyzja, jak i wykrywanie są równie ważne. Zakres F1 wynosi od 0 do 1, z wyższymi wartościami wskazującymi na lepszą wydajność modelu.

Wzór na obliczanie wskaźnika F1

Wracając do naszych przykładów ze stogiem, dla pierwszego z nich (90% precyzji i 45% wykrywania), wskaźnik F1 wyniesie 0.60. Dla drugiego przykładu (50% precyzji i 95% wykrywania), wskaźnik F1 wyniesie 0.65. Chociaż wskaźniki F1 są porównywalne, oba modele mają zupełnie inną wydajność i wyniki.

Kiedy używać wskaźnika F1

Wskaźnik F1 jest najbardziej wartościowy w sytuacjach, gdzie:

Zarówno precyzja, jak i wykrywanie są krytyczne: 

  • Równoważy kompromis między fałszywymi pozytywami a fałszywymi negatywami. Przykład: systemy rekomendacji filmów, gdzie potrzebujesz polecić odpowiednie filmy (wysoka precyzja) bez pominięcia tych, które mogą zainteresować widza (wysokie wykrywanie). 

Zestawy danych niezrównoważonych: 

  • W zestawach danych z nierównymi rozkładami klas, dokładność może być myląca, podczas gdy wskaźnik F1 zapewnia bardziej sprawiedliwą ocenę wydajności.

Zalety używania wskaźnika F1

  • Równoważy precyzję i wykrywanie, dostarczając jednej miary do oceny wydajności modelu
  • Użyteczny, gdy zarówno fałszywe pozytywy, jak i fałszywe negatywy muszą być rozważane
  • Lepiej radzi sobie z niezrównoważonymi zbiorami danych niż dokładność

Wady używania wskaźnika F1

  • Nie pozwala na różne wagi dla precyzji i wykrywania w oparciu o kontekst problemu
  • Może ukrywać wgląd w indywidualne miary precyzji i wykrywania

Wskaźnik F1 jest dobrą miarą oceny modeli, w których ważne są zarówno precyzja, jak i wykrywanie, oraz istnieją kompromisy. Zapewnia zrównoważoną ocenę, zwłaszcza dla skrzywionych zbiorów danych, ale powinien być interpretowany razem z precyzją i wykrywaniem, aby uwzględnić priorytety konkretnego przypadku użycia.

Segmentacja predykcyjna z Yespo CDP

W Yespo używamy zaawansowanego modelu uczenia maszynowego do segmentacji klientów na podstawie prawdopodobieństwa zakupu, co jest najważniejszym miernikiem dla e-commerce.

Aby stworzyć te prognozy, nasz model analizuje szeroki zakres danych, w tym historię zakupów, wartość i częstotliwość przeszłych zakupów, datę ostatniej akcji klienta, wzorce zachowań, dane demograficzne i inne czynniki. 

To podejście pozwala uchwycić i analizować więcej danych niż jakikolwiek marketer mógłby rozsądnie obsłużyć.

Dane analizowane przez człowieka vs. algorytm uczenia maszynowego

Stąd nasz system przechodzi do tworzenia segmentu prawdopodobnych nabywców, którego możesz użyć w swoich kampaniach. 

Aby stworzyć segment predykcyjny, przejdź do sekcji KontaktySegmentyDodaj segmentDynamiczny i wybierz opcję Prawdopodobieństwo zakupu.

Możesz wybrać jeden z czterech gotowych ustawień lub wybrać ręcznie wartość Recall — od 20% do 80%.

Interfejs segmentów predykcyjnych w CDP Yespo

Jak już wiesz, wartość recall dostosowuje liczbę prawdopodobnych nabywców w utworzonym segmencie. 

Niższe wartości (20-50%) stworzą węższy segment z lepszym stosunkiem nabywców do osób niekupujących (ponieważ precyzja będzie wyższa). Jest to świetne dla kampanii bardzo ukierunkowanych lub gdy celem jest osiągnięcie najwyższego możliwego ROMI.

Wyższe wartości stworzą szerszy segment, który ma większy udział osób niekupujących (niższą precyzję), ale obejmuje większość prawdopodobnych nabywców. Użyj tego, gdy potrzebujesz zmaksymalizować swoje przychody i objąć znaczną część listy klientów.

Jeśli chodzi o nasze gotowe ustawienia, oto co robią:

  • Pewni nabywcy: Użytkownicy z bardzo wysokim prawdopodobieństwem zakupu. Idealny do produktów premium i ekskluzywnych ofert, ten segment może stać się głównym źródłem przychodów.
  • Potencjalni nabywcy: Użytkownicy ze średnim do wysokiego prawdopodobieństwem zakupu. Ci klienci dobrze reagują na wyprzedaże sezonowe, premiery produktów i spersonalizowane rekomendacje.
  • Mało prawdopodobni nabywcy: Poprzedni klienci, którzy od dłuższego czasu nie dokonali zakupu. Kampanie ponownego zaangażowania, oferty odzyskiwania i spersonalizowane wiadomości mogą pomóc przywrócić ich do Twojego biznesu.
  • Niezdecydowani nabywcy: Użytkownicy z niskim do średniego prawdopodobieństwem dokonania zakupu. Mogą być zainteresowani, ale jeszcze nie są przekonani. Oferowanie promocji z zachętami, treści edukacyjnych lub prośby o opinie mogą pomóc w ich zachęceniu.

Użycie tego narzędzia ma kilka głównych zalet:

Szybkość i łatwość tworzenia: Segmenty predykcyjne są bardzo proste w konfiguracji, oszczędzając cenny czas, który można by spędzić na tworzeniu złożonych grup ręcznych.

Lepsza wydajność: Algorytmy uczące się maszynowo analizują większe ilości danych. To pozwala na tworzenie bardziej ukierunkowanych i precyzyjnych segmentów, które mają tendencję do przewyższania tych tworzonych ręcznie.

Oszczędność kosztów kampanii: Segmenty predykcyjne wyróżniają się, kiedy wysyłasz wiadomości przez kanały takie jak SMS, gdzie koszt na wiadomość jest zauważalny. Dzięki tej technologii możesz sprawić, aby każda wiadomość była skuteczna i przynosiła opłacalne wyniki.

Nowe przepływy pracy:

Oprócz pożądanych zdarzeń konwersji (np. zakup), segmenty predykcyjne mogą odnosić się do innych zdarzeń, takich jak odchodzenie klientów. Takie wydarzenia nie są łatwe do ustawienia za pomocą ręcznej segmentacji i umożliwiają tworzenie kreatywnych kampanii retencyjnych.

Łatwiejsze testy A/B: Segmenty predykcyjne zazwyczaj przynoszą lepsze rezultaty, co czyni je idealnymi do testów A/B różnych kreacji, ofert i innych zmiennych.

Przyjrzyjmy się kilku rzeczywistym przykładom tej technologii.

Chcę przetestować segmenty predykcyjne!

Studium przypadku O.TAJE

O.TAJE, ukraińska marka mody damskiej, znacznie poprawiła swoje kampanie Viber dzięki wdrożeniu segmentacji predykcyjnej za pośrednictwem CDP Yespo. Między czerwcem a sierpniem 2024 roku testowali segmenty predykcyjne w porównaniu do swojej tradycyjnej ręcznej segmentacji.

W jednej z godnych uwagi kampanii ich segment predykcyjny osiągnął:

  • 57,83% wskaźnika otwarć (vs 45,24% dla ręcznego)
  • 5,73% wskaźnika konwersji (vs 5,14% dla ręcznego)
  • 1010,89% ROMI (vs 389,19% dla ręcznego)

Ogólnie rzecz biorąc, kampanie, które wykorzystały segmenty predykcyjne, poprawiły następujące metryki:

  • 26% wyższe współczynniki klikalności
  • 300% wyższe współczynniki konwersji
  • 310% wzrost całkowitego ROMI

Porównanie wyników pomiędzy segmentami predykcyjnymi a zwykłymi

Biorąc pod uwagę wyniki, O.TAJE planuje używać segmentów predykcyjnych w innych kanałach marketingowych, szczególnie SMS.

Podsumowanie

To wszystko — teraz wiesz wszystko, co jest potrzebne do efektywnego wykorzystania segmentacji predykcyjnej. Jak różni się ona od metod opisowych, jakie dane są wykorzystywane, jak modele są tworzone i jak są oceniane.

Uzbrojony w tę wiedzę, możesz uruchomić własne skuteczne kampanie, wykorzystując moc uczenia maszynowego.

Jeśli chcesz dowiedzieć się więcej o tym, jak segmentacja predykcyjna może działać dla Twojej firmy — i jak Yespo może Ci pomóc — wypełnij poniższy formularz. Nasi eksperci skontaktują się z Tobą w krótkim czasie.

Specjalne żądanie w linii

0.0 z 5 na podstawie 0 recenzje

Ivan Diulai

Copywriter

W górę

Ivan Diulai

Copywriter

Komentarze 0