Прогнозна сегментация 102

Прогнозна сегментация 102: технология и метрики

Дисциплината на маркетинга е изминала дълъг път от своите скромни начала преди хилядолетия. И така се подобряват и нашите инструменти. От глинени таблички и хартиени тетрадки до софтуерни електронни таблици и съвременни системи с изкуствен интелект. Винаги се стремим да постигнем по-добри резултати и търсим нови начини да ги постигнем. В същото време не искаме да правим досадна работа, и това е разбираемо — с толкова много задачи, просто не можем да си позволим да вършим всичко ръчно.

Това е причината полето на маркетинговата автоматизация да вижда бурен ръст. Създаваме съдържание и копирайтинг с помощта на изкуствен интелект, генерираме персонализирани продуктови препоръки и автоматизираме рутинни задачи и работни потоци. Всичко това, за да постигнем по-добри резултати, докато прекарваме по-малко време.

Сегментацията на клиенти е част от уравнението, която беше трудна за автоматизиране. Поне до съвсем наскоро. Обаче, с появата на предиктивната сегментация (както обсъдихме по-рано), можем да групираме клиентите на автопилот – докато постигаме превъзходни резултати.

В тази статия ще разгледаме основната технология, за да знаете всичко, от което се нуждаете, за да получите по-добри резултати. И ще се опитаме да я направим възможно най-достъпна, така че онези без степен по напреднала статистика няма да накалят мозъчните си клетки. Имате и други неща, с които да се занимавате, нали?

Основи на предиктивната сегментация срещу описателни методи

Сегментацията е важна техника в маркетинга. Нейната цел е да раздели базата от клиенти на отделни групи въз основа на споделени характеристики. Традиционно, тя се осъществява ръчно въз основа на бизнес цели. Например, определен продукт може да се рекламира изключително на жени. Или промоция, която се показва само на потребители на мобилни устройства.

Тези методи могат също да бъдат наречени описателни, тъй като се фокусират върху групиране на съществуващи клиентски данни (т.е. “описват” ги).

Покрихме някои от най-често срещаните подходи в предишната ни статия. Но ето кратко обобщение на тези методи:

Демографска сегментация 

Този основен подход разделя клиентите въз основа на споделени характеристики на клиентите, като възраст, пол, доход и образователно ниво. Например, луксозна марка може да насочи усилията си към професионалисти с висок доход на 40-годишна възраст, докато търговец на бърза мода се съсредоточава върху по-млади клиенти със средни доходи. 

Компании могат да създадат изключително специфични комбинации от тези фактори, като "омъжени жени на възраст 25-34 с висши степени," за да насочат точно маркетинговите си усилия и разработването на продукти.

Географска сегментация 

Целевото насочване въз основа на местоположение разглежда не само физическото местоположение, но и целия контекст, в който клиентите живеят и работят. Това включва градски и селски настройки, климатични условия, плътност на населението и културни предпочитания, уникални за специфични региони. 

Съвременни подходи като геофенсинг улесниха бизнеса да достигне до клиенти на специфични локации в реално време. 

Търговска верига може да коригира асортимента на продуктите си въз основа на местни климатични условия, или ресторант да модифицира менюто си, за да отрази регионални вкусови предпочитания. Този метод е особено ценен за бизнеси разрастващи се на нови пазари или оптимизиращи своите дистрибуционни мрежи.

Психографска сегментация 

Този по-задълбочен анализ разглежда психологическите аспекти на поведението на потребителите, включително изборите в начина на живот, личните ценности, интересите и нагласите. Той отговаря на въпроси защо клиентите правят определени избори, като ги групира в категории като „ентусиасти на здравето“, „технологични ранни потребители“ или „екосъзнателни потребители“. 

Компаниите използват тази информация, за да създадат маркетингови послания, които резонират с основните ценности и стремежи на целевата им аудитория, създавайки по-силни емоционални връзки с тяхната марка.

Сегментация по поведение 

Чрез анализ на това как клиентите взаимодействат с продукти или услуги, бизнесите могат да ги групират въз основа на техните действия, а не на техните характеристики. Това включва честотата на покупките, лоялността към бранда, степента на използване и отговора на маркетингови инициативи. 

Например, софтуерна компания може да раздели мощните потребители от случаените, или магазин може да идентифицира ловци на изгодни покупки спрямо премиум купувачи. Тази сегментация помага за разработването на целеви стратегии за задържане и персонализирани кампании.

Сегментация на базата на стойност 

Този метод е фокусиран върху икономическите взаимоотношения между клиентите и бизнеса, като се разглеждат фактори като стойността на клиента през целия му живот, честотата на покупките и средната стойност на поръчката. Компаниите използват този подход, за да идентифицират своите най-печеливши сегменти клиенти и да разберат какво ги прави ценни. 

Тази информация води стратегически решения относно разпределението на ресурсите, помагайки на бизнесите да инвестират повече в привличане и задържане на клиенти с висока стойност.

RFM сегментация

Този мощен подход комбинира три ключови метрики за оценка и сегментиране на клиенти: 

  • Рецентност—колко наскоро са направили покупка.
  • Честота—колко често купуват.
  • Монетарна стойност—колко харчат.

Например, клиент, който е купил нещо миналата седмица, пазарува ежемесечно и харчи значителни суми, би се считал за високо ценен. RFM помага на бизнесите да идентифицират своите най-добри клиенти, да открият тези, които са изложени на риск от напускане, и да създадат целеви маркетингови кампании за всеки сегмент. 

Тази стратегия е особено ефективна за търговци на дребно и електронна търговия, които се стремят да оптимизират своите стратегии за ангажиране и задържане на клиенти.

Кой метод за сегментация е подходящ за моя бизнес?

Преглед на описателни методи на сегментация

Как работи предсказуемата сегментация

Докато описателната сегментация разчита на ръчно дефинирани правила и ясни критерии („клиенти, които са похарчили над $100 в миналия месец“ или „жени на възраст 25-34“), предсказуемата сегментация използва съвсем различен подход. 

Вместо да използва фиксирани правила, тя анализира модели в исторически данни за клиентите, за да прогнозира бъдещи поведения. Например, вместо просто да се гледат минали покупки, тя може да идентифицира фини тенденции, които показват, че клиент вероятно ще купи отново скоро.

Силата на този подход се крие в способността му да обработва огромни количества взаимосвързани информационни точки. Когато маркетолог създава сегменти, те обикновено се фокусират върху 3-4 ключови променливи най-много—това е просто прекалено сложно, за да се обмислят повече. 

Алгоритмите за машинно обучение обаче могат едновременно да анализират стотици променливи: не само очевидни като история на покупките и демографски данни, но и малки промени в поведението при сърфиране, реакция на предишни кампании, сезонни тенденции и дори времето между посещенията на уебсайта.

Тези алгоритми не разглеждат отделни променливи изолирано. Те идентифицират сложни връзки между различни фактори. Например, предсказващ модел може да открие, че клиенти, които разглеждат вашия сайт в делнични вечери, редовно отварят вашите имейли и са направили поне две покупки в различни категории, имат голяма вероятност да реагират на следващата ви промоция. Тези модели биха били почти невъзможни за откриване чрез ръчен анализ и са уникални за всеки бизнес.

Минало срещу бъдеще: фундаментална разлика

Най-важната разлика между описателна и предсказваща сегментация е връзката им с времето. Описателната сегментация е по природа обърната към миналото - тя може само да ви разкаже за това, което клиентите вече са направили или кои са те в момента. 

Когато маркетолозите създават правила като "клиенти, които са закупили през последните 30 дни" или "посетители, които са изоставили количката си", те в същност използват историята, за да предполагат бъдещо поведение.

Предсказващата сегментация, от друга страна, директно отговаря на въпроса, който наистина вълнува бизнеса: "Какво ще направи този клиент след това?" 

Вместо да приема, че поведението от миналото ще продължи, тя активно прогнозира бъдещи действия. Вместо да създава сегмент от "клиенти, които са купували често в миналото", тя идентифицира "клиенти, които вероятно ще направят покупка през следващите две седмици" — дори ако някои от тези клиенти не отговарят на традиционния профил на чест купувач.

Това преминаване от описателен към предсказващ анализ фундаментално променя начина, по който бизнесите могат да подходят към маркетинга си. Вместо да реагират на минали поведения, те могат проактивно да ангажират клиентите, базирано на вероятните им бъдещи действия.

Предсказваща сегментация срещу описателни методи

Същината на предсказващата сегментация

За да разберем как работи предсказващата сегментация, нека разгледаме под капака. Въпреки че не е необходимо да сте специалист по данни, за да използвате тази технология, познаването на основите ще ви помогне да вземате по-добри решения относно кога и как да я използвате в маркетинга си.

Готови ли сте? Нека започнем!

Данният тръбопровод

Предсказващата сегментация е подсилена от данни. Колкото повече данни имате, толкова по-добре. И тяхното качество и завършеност пряко влияят върху точността на прогнозите.

Какви данни са ви необходими 

Предсказващите модели дават най-добри резултати, когато могат да разгледат цялостната картина на клиента. Въпреки че всеки бизнес е уникален, има няколко ключови типа данни, които управляват ефективни прогнози:

Поведенчески данни

  • Взаимодействия с уебсайта и приложението: Преглеждани страници, време прекарано, използвани функции
  • Ангажираност с кампании: Отваряния на имейли, кликове, реакции на различни оферти
  • Предпочитания за съдържание: Какви статии четат, видеа гледат, продукти разглеждат
  • Патерни за търсене: Какво търсят на вашия сайт

Транзакционни данни

  • История на покупките: Какво купуват и кога
  • Стойности на поръчките: Колко харчат типично
  • Предпочитания за продукти: Категории и конкретни артикули, които предпочитат
  • Методи на плащане: Как предпочитат да плащат
  • Статус на абонамента: Дали са на план с автоматично подновяване

Атрибути на клиентите

  • Основни демографски данни: Възраст, местоположение, пол
  • Контактна информация: Как предпочитат да бъдат контактени
  • Детайли за акаунта: От колко време са клиенти
  • Персонализирани полета: Специфични данни, важни за вашия бизнес
  • Статус на програмата за лоялност: Ако имате такава

Типове данни, използвани в предсказуемото моделиране

Най-хубавото? Не ви трябват всички тези данни, за да започнете — предсказанията могат да работят с информацията, която имате на разположение. Събирайки повече данни с времето, резултатите стават по-точни и по-детайлни.

Източници и поток на данните

Ако използвате поне едно софтуерно решение за автоматизация на маркетинга, вече събирате ценни клиентски данни. Все пак преди тези данни да се предадат на вашата система за предсказуема сегментация, трябва да се уверите, че са правилно събрани и съхранени.

Обикновено е по-добре да имате едно централно място, което обединява данни от всички ваши съществуващи източници на данни. Платформите за клиентски данни (CDP) са идеални за това. 

CDP действа като център, който събира всички ваши данни на едно място и ги използва за създаване на предсказания (освен ако не разчитате на решение от трета страна). Това ви позволява да:

  • Свързвате данни от множество източници в единен клиентски профил
  • Поддържате клиентските профили актуализирани в реално време
  • Осигурявате консистентност на данните в различните системи
  • Правите данните достъпни за предсказания, когато е необходимо

За да обогатите данните на вашата CDP, ще искате да свържете и други източници на данни, като:

  • CRM системи: Информация за клиентите и история на взаимодействията
  • Платформи за анализи: Поведение в уебсайта и приложението
  • Маркетингови инструменти: Ангажираност и реакции към кампаниите
  • Системи за поддръжка: Взаимодействия с клиентските услуги
  • Персонализирани бази данни: Всички други данни, които събирате

Имайте предвид, че не събирате данни само веднъж — за най-добри резултати, се нуждаете от система за поддържане на непрекъснат поток от информация, включително:

  • Нови покупки 
  • Поведение на клиентите 
  • Реакции на кампании

Как CDP агрегира данни от различни източници на едно място

Този непрекъснат поток позволява вашите предсказуеми сегменти да останат актуални и да отразяват най-новото поведение и предпочитания на вашите клиенти. Например, ако клиент започне да показва признаци на намалена ангажираност, той може автоматично да бъде преместен в различен сегмент, който може да изисква специално внимание.

Съберете всички ваши маркетингови данни на едно място

Защо чистите данни са важни 

Спомняте ли си песента на Джъстин Тимбърлейк „What Goes Around... Comes Around?“ С предсказуемата сегментация не е много по-различно. Качеството на входните ви данни директно влияе върху качеството на предсказанията, направени от системата.

Чести проблеми включват:

  • Дублирани записи на клиенти
  • Липсваща или неправилна информация
  • Несъответстващ формат
  • Остарели данни

Затова повечето предсказуеми системи включват автоматични стъпки за почистване на данни. Те стандартизират и проверяват данните преди да ги използват за правене на предсказания. 

Знаете ли?

Yespo CDP автоматично почиства и подготвя данните, необходими за сегментация. Ако сте изпълнили всички технически стъпки като инсталиране на скрипт за уеб проследяване, не е нужно да извършвате допълнително почистване на данните.

Изграждане на модел

След като данните са готови, системата започва да търси модели, които могат да помогнат за предсказване на бъдещо поведение на клиентите. Мислете за това като за свързване на безброй точки в клиентските данни, за да се разкрие ясна картина за това какво означават различните действия за техните бъдещи действия.

Системата може да използва различни типове модели в зависимост от това какво искате да предскажете. Най-често срещаният тип за поведение на клиентите е класификация—където целта е да се сортират клиентите в бинарни групи въз основа на това какво вероятно ще направят следващо (напр. купувачи срещу некопувачи). Други модели могат да търсят естествени групи от подобни клиенти (клъстериране) или да се опитат да предскажат конкретни стойности като бъдещи суми на покупки (регресия).

За маркетингови цели, моделите за класификация са особено ценни, защото отговарят на практични въпроси като "Този клиент ще купи ли през следващите 30 дни?" или "Този клиент вероятно ли ще се откаже?" Те правят това, като се учат от предишни примери на клиенти, които са извършили или не са извършили тези действия.

Как системата се учи

Системата анализира историческите данни, за да разбере какво се е случило в миналото. Да кажем, че искате да предскажете кои клиенти ще направят покупка през следващия месец. Системата разглежда две групи клиенти от миналото:

  • Тези, които са направили покупка в рамките на 30 дни
  • Тези, които не са направили покупка в този срок

За всяка група тя проверява стотици различни сигнали:

  • Колко наскоро са посетили вашия уебсайт
  • Кои страници са разгледали
  • Дали са отворили вашите имейли
  • Техните минали модели на покупки
  • Как се взаимодействат с вашата марка
  • И много други данни

С течение на времето системата започва да разпознава кои комбинации от тези сигнали най-надеждно предсказват бъдещите покупки. Някои модели може да са очевидни, като например, че честите посетители на уебсайта са по-вероятни да купуват. Други може да са фини връзки, които биха били невъзможни за забелязване ръчно—като например клиенти, които разглеждат вашите помощни статии, които са по-склонни да правят по-големи покупки.

Същият процес се прилага за всяко клиентско действие, което искате да предскажете, било то отказ, ъпгрейд или участие със специфични продукти. Системата продължава да се учи от нови данни, усъвършенствайки разбирането си за това какво означават различните клиентски поведения за бъдещите действия.

Процесът на учене визуализиран

Преобразуване на модели в прогнози

Тук се включва класификацията. Тя разделя клиентите на различни групи въз основа на вероятността им да предприемат определено действие. Например системата може да класифицира клиентите като:

  • "Много вероятно да купят" (над 80% вероятност)
  • "Вероятно да купят" (50-80% вероятност)
  • "Малко вероятно да купят" (20-50% вероятност)
  • "Много малко вероятно да купят" (по-малко от 20% вероятност)

Тези вероятности се базират на това колко близко текущото поведение на клиента съответства на модели, които преди са довели до покупки. Например:

  • Клиент, който посещава вашия уебсайт три пъти седмично, отваря всички ваши имейли и разглежда страници с цени, може да показва 85% вероятност за покупка.
  • Някой, който не е отварял вашите имейли от два месеца и е посетил само веднъж, може да показва 20% вероятност.
  • Клиент, който наскоро е разгледал подобни продукти многократно, но не е купил, може да показва 60% вероятност.

Системата непрекъснато актуализира тези прогнози. Клиент, който беше "малко вероятно да купи" миналата седмица, може да се премести в категорията "може да купи" след като е взаимодействал с последната ви имейл кампания. Тази динамична природа означава, че вашите сегменти винаги са актуални, отразявайки последното поведение на клиентите.

С предсказуеми модели можете да провеждате ефективни и печеливши кампании, като същевременно прекарвате по-малко време в ръчно коригиране и актуализиране на сегментите си. Въпреки това, не всеки модел произвежда равни резултати, затова имаме нужда от метод за оценка на тяхната ефективност и изходни данни. Тук играят роля метриките за оценка. 

Оценка на моделите

За да разберете по-добре как да оценявате предсказуеми модели, си представете този сценарий: Имате голям куп сено пред себе си. Виждате ли накъде се насочва? Да, става въпрос за игли. Не една игла, а много игли в този куп сено, които трябва да намерите.

Обаче, иглите не са еднакви. Някои са по-дълги, някои са по-дебели, а други дори са извити! Не е най-лесната задача, нали?

Данните, като иглите, рядко са толкова равномерни, колкото си представяме

Матрицата на объркванията

При дадената цел, измисляте специално сито, което филтрира сеното и намира иглите в него. Това е вашият предсказуем модел, така да се каже. Въпреки това, тъй като иглите са различни, а сеното не е равномерно, понякога ще останат игли в сеното, а понякога сеното ще премине като че ли е игла.

В предсказуемото моделиране имаме инструмент, наречен матрица на объркванията, който описва тази ситуация. Това е 2x2 решетка, която покрива тези сценарии. 

Матрицата на объркванията

Ето какво означава:

Истински положителен (TP): Моделът правилно предсказва положителния клас. Това е като когато вашият филтър правилно изважда игла.

Фалшиво положително (FP): Моделът предсказа резултат, който не е истина. Това е, когато вашият филтър изважда слама вместо истинска игла.

Фалшиво отрицателно (FN): Моделът не предсказа истински резултат. Представете си ситуация, когато вашият филтър оставя иглата в купе сено, вместо да я филтрира правилно.

Истинско отрицателно (TN): Моделът правилно предсказва отрицателен клас. Вашият филтър оставя сламата там, където трябва да бъде—в купето сено.

Метрични инструменти за оценка на предсказуеми модели

Когато работите с модели (като нашият филтър за игли), е важно да имате някаква мярка, по която можем да оценим ефективността на нашето решение. За да направим това, имаме различни метрики. Тези метрики са различни и се използват за различни сценарии. Нека разгледаме отблизо най-често използваните и кога трябва да ги използвате.

Точност

Когато става въпрос за оценка на модел, точността е най-простата и най-пряката метрика в нашия инструментален комплект. Изчислява се като отношението на правилните предсказания към общия брой предсказания.

Формула за изчисляване на точността

Това е проста и лесна за разбиране формула, добра за първоначална оценка и балансирани набори от данни (т.е. имате приблизително същия брой игли и слама в купето сено).

Въпреки това, точността се проваля при по-сложни сценарии и небалансирани набори. Нека разгледаме пример: имате 5 игли и 95 сламки. Моделът може да обозначи всичко като слама и точността ще бъде 95%. Въпреки че това изглежда като добър резултат, в действителност не сме получили нито една игла от нашето сито.

Високата точност не гарантира положителни резултати

Поради това, точността не е най-надеждната метрика. Все пак има своите приложения за балансирани набори от данни и ситуации, когато грешките не са критични.

Предимства на използването на точността

  • Прост, лесен за разбиране и бърз за изчисляване
  • Работи добре за балансирани набори от данни
  • Широко приложим за различни видове модели за класификация

Недостатъци на използването на точността

  • Заблуждаващ за небалансирани набори от данни, където може да прикрие лошото представяне при малцинствените класове
  • Не различава различни видове грешки (фалшиво положителни срещу фалшиво отрицателни)
  • Не е подходящо, когато разходите за различните грешки варират

Кога да се използва точността

Балансирани набори от данни: Точността е най-ефективна, когато и положителните, и отрицателните случаи се появяват в сходни пропорции.

Ниско-ценови грешки: Когато фалшиво положителните и фалшиво отрицателните са еднакво важни или имат нисък въздействие (например, класифициране на спам имейли).

Първоначална оценка на модела:

Често се използва като базова метрика за бърза оценка на модела преди да се премине към по-подробни метрики като прецизност, издържливост или F1 резултат.

Прецизност

Прецизността е един от двата най-важни показатели, използвани за оценка на модела (другият е припомняне). Тя измерва точността на положителните предсказания и се изчислява като съотношение между всички правилни положителни предсказания и всички случаи, маркирани като положителни.

Формула за изчисляване на прецизността

В повечето случаи, това е по-точен показател от точността и е особено релевантен за случаи, където фалшивите позитиви са по-вредни от фалшивите негативи.

Да се върнем към примера с купа сено. Ако нашия модел идентифицира 100 предмети като игли, и в действителност 90 от тях са истински игли (истински позитиви), а 10 са сламки (фалшиви позитиви), можем да кажем, че той има прецизност от 90%.

Високата прецизност е задължителна, когато се нуждаете от възможно най-малко фалшиви позитиви

Все пак, това, което прецизността не ни казва, е колко игли остават в купата сено. Представете си, че има общо 200 игли, но моделът идентифицира само 90 от тях. Това означава, че моделът е пропуснал 110 игли (фалшиви негативи), което е критична информация, ако искаме да намерим възможно най-много игли. Прецизността сама по себе си не улавя този аспект.

Предимства на използване на прецизността

  • Фокусира се върху минимизирането на фалшивите позитиви, което е от решаващо значение, когато те са скъпи (например спам филтри, откриване на измами)
  • Осигурява полезни насоки, като гарантира надеждността на предсказаните позитиви

Недостатъци на използване на прецизността

  • Не отчита фалшивите негативи, което може да бъде проблем, когато улавянето на всички позитиви е важно (например медицинска диагностика)
  • Може да бъде подвеждащо при тежко дисбалансирани набори от данни

Кога да се използва прецизността

Прецизността е идеална в случаи, когато фалшивите позитиви са по-проблематични от фалшивите негативи. Някои специфични примери включват:

Идентифициране на измамни транзакции във финансови системи:

  • Фалшивите позитиви (маркирането на легитимни транзакции като измамни) могат да доведат до недоволство на клиентите, така че високата прецизност гарантира, че се маркират само наистина измамните случаи.

Откриване на спам имейли:

  • Високата прецизност гарантира, че легитимните имейли не се отбелязват по погрешка като спам, запазвайки доверието на потребителите.

Медицински тестове за редки заболявания:

  • В някои случаи (например, високонавлезни или скъпоструващи последващи тестове), фалшивите позитиви (здрави лица, неправилно идентифицирани като болни) могат да доведат до ненужен стрес и разходи, което прави прецизността приоритет.

Извличане на информация и търсачки:

  • При класирането на резултатите от търсенето, прецизността гарантира, че най-релевантните резултати се появяват на върха. Фалшивите позитиви (нерелевантни резултати) влошават потребителското изживяване.

Припомняне

Припомняне (известно още като чувствителност или истински позитивен процент) е друг ключов показател за оценка на модели. Използва се за измерване на способността за улавяне на всички положителни класове и се изчислява като съотношение на правилните положителни предсказания към всички действителни позитиви в набора от данни.Формула за изчисляване на recall

За разлика от прецизността, която се фокусира върху точността на положителните прогнози, recall акцентира върху идентифицирането на колкото се може повече истински положителни резултати, дори ако това означава да се толерират някои фалшиви положителни. Това прави recall особено важно в случаите, когато пропускането на истински положителни (фалшиви отрицателни) е по-вредно от прогнозирането на фалшиви положителни.

Нека си спомним (още една игра на думи) нашия предишен пример: идентифицирахме 100 предмета като игли, от които 90 бяха истински игли (истинско положително), а 10 бяха сламки (фалшиво положително). Прецизността на този модел беше 90%. Но с общо 200 игли, пропуснахме 110 от тях, така че стойността на нашия recall е 45%. Този модел не е добър при идентифицирането на всички положителни класове.

Въпреки това, ако идентифицирахме 380 предмета като игли и 190 от тях бяха истински игли, нашият модел има стойност на recall от солидни 95%. Но прецизността е само 50%. Досега трябва да можете да видите компромиса между двете метрики.

Високият recall осигурява, че по-голямата част от иглите са осигурени

Затова recall често се комбинира с прецизността, особено в приложения, където и фалшивите положителни, и фалшивите отрицателни имат значителни последици.

В Yespo използваме recall като основна метрика за оценка на нашите модели.

Когато става въпрос за клиентска сегментация, цената на погрешно идентифициране на някого като клиент е незначителна. 

В същото време, пропускането на потенциални купувачи в кампаниите ви може да доведе до намаляване на приходите ви, което е изключително нежелателно.

Предимства на използването на recall

Приоритетизира осигуряването на положителни резултати:

  • Приоритетизира осигуряването на колкото се може повече истински положителни резултати, което е от ключово значение, когато фалшивите отрицателни са опасни (напр. диагностика на заболявания)
  • Полезно за небалансирани набори от данни, където положителният клас е рядък

Недостатъци на използването на recall

  • Игнорира фалшивите положителни, което може да доведе до много фалшиви аларми
  • Не е подходящо, когато прецизността е от първостепенно значение и фалшивите положителни са проблематични

Кога да се използва recall

Recall е идеален в ситуации, когато пропускането на положителни резултати е по-критично от намаляването на фалшивите положителни, включително:

Медицинска диагностика: При откриване на рак или други животозастрашаващи заболявания, фалшив отрицателен (неуспех да се идентифицира болен пациент) може да има тежки последици. Recall осигурява, че моделът улавя колкото се може повече истински случаи, дори ако неправилно маркира някои здрави пациенти.

Маркетингова сегментация: Бизнеси, които желаят да максимизират приходите си от маркетингови дейности, изискват висока стойност на recall, за да осигурят колкото се може повече потенциални купувачи. В това приложение, фалшивите положителни (кампания, изпратена до безразлични лийдове) нямат съществен отрицателен резултат.

Предсказване на бедствия: Предсказването на редки, но значими събития, като земетресения или финансови кризи, изисква висок recall, за да се осигури, че критични предупреждения не са пропуснати.

Recall срещу Прецизност

Както вече видяхме, увеличаването на прецизността на модел води до намаляване на recall, и обратно. 

Търговия между точност и пълнота

Точност: Фокусира се върху гарантиране, че положителните предсказания са правилни, като допуска повече фалшиви отрицателни резултати.

Пълнота: Фокусира се върху улавянето на колкото се може повече истински положителни резултати, като допуска повече фалшиви положителни резултати.

Висока пълнота и висока точност имат специфични случаи на използване

Нито един метрик сам не предоставя пълната картина. В много случаи, балансирането на пълнота и точност е критично. Това може да бъде постигнато чрез използване на F1 оценка.

F1 Оценка

F1 оценката е хармоничното средно на точността и пълнотата, предоставяйки единен метрик, който балансира и двата. Той е особено полезен в сценарии, където и високата точност, и пълнотата са еднакво важни. F1 оценката варира от 0 до 1, като по-високи стойности показват по-добро представяне на модела.

Формула за изчисляване на F1 оценка

Връщайки се към нашите примери с купа сено, за първия (90% точност и 45% пълнота), F1 оценката ще бъде 0.60. За втория пример (50% точност и 95% пълнота), F1 оценката ще бъде 0.65. Въпреки че F1 оценките са съпоставими, и двата модела имат силно различно представяне и резултати.

Кога да използваме F1 оценка

F1 оценката е най-ценна в случаите, когато:

Точността и пълнотата са критични: 

  • Балансира търговията между фалшиви положителни и фалшиви отрицателни примери: например, системи за препоръка на филми, където трябва да препоръчате релевантни филми (висока точност), без да пропускате тези, които биха заинтересували зрителя (висока пълнота). 

Несбалансирани набори от данни: 

  • В набори от данни с неравни разпределения по класове, точността може да бъде подвеждаща, докато F1 оценката предоставя по-справедлива оценка на представянето.

Предимства от използването на F1 оценка

  • Балансира точността и пълнотата, предоставяйки единен метрик за улавяне на представянето на модела
  • Полезна когато трябва да се разгледат и фалшивите положителни, и фалшивите отрицателни резултати
  • По-добре се справя с несбалансирани набори от данни в сравнение с точността

Недостатъци от използването на F1 оценка

  • Не позволява различно претегляне на точността и пълнотата в зависимост от контекста на проблема
  • Може да затъмни прозренията от индивидуалните метрики за точност и пълнота

F1 оценката е добър метрик за оценяване на модели, където точността и пълнотата са важни и съществуват търговски компромиси. Тя предоставя балансирана оценка, особено за изкривени набори от данни, но трябва да се интерпретира заедно с точността и пълнотата за отчитане на приоритетите в специфични случаи на употреба.

Предиктивна сегментация с Yespo CDP

Тук в Yespo, използваме усъвършенстван модел на машинно обучение за сегментиране на клиенти въз основа на вероятността за покупка, най-важният показател за електронната търговия.

За да създаде тези прогнози, нашият модел анализира широка гама от данни, включително история на покупките, стойност и честота на предишни покупки, дата на последното действие на клиента, модели в поведението, демографски данни и други фактори. 

Този подход улавя и анализира повече данни, отколкото всеки маркетолог би могъл да обработи разумно.

Данни, анализирани от човек спрямо алгоритъм за машинно обучение

Оттам нашата система продължава да създава сегмент от вероятни купувачи, който можете да използвате в кампаниите си. 

За да създадете прогностичен сегмент, отидете в секцията КонтактиСегментиДобавяне на сегментДинамичен и изберете опцията Вероятност за покупка.

Можете да изберете една от четирите предварително зададени настройки или да изберете ръчна стойност на Припомняне — от 20% до 80%.

Интерфейсът на прогностичните сегменти в CDP Yespo

Както вече знаете, стойността на припомняне регулира броя на вероятните купувачи в създадения сегмент. 

По-ниски стойности (20-50%) ще създадат по-тесен сегмент с по-добро съотношение купувачи към некопувачи (тъй като точността ще е по-висока). Това е чудесно за силно насочени кампании или когато целта ви е да имате най-високия възможен ROMI (връщаемост на инвестицията в маркетинг).

По-високи стойности ще създадат по-широк сегмент с по-висок дял на некопувачи (по-ниска точност), но ще покрие по-голямата част от вероятните купувачи. Използвайте това, когато трябва да максимизирате приходите си и да обхванете значителна част от списъка си с клиенти.

Когато става въпрос за нашите предварително зададени настройки, ето какво правят:

  • Сигурни купувачи: Потребители с много висока вероятност за покупка. Идеални за премиум продукти и ексклузивни оферти, този сегмент може да стане ваш основен източник на приходи.
  • Потенциални купувачи: Потребители със средна до висока вероятност за покупка. Тези клиенти реагират добре на сезонни разпродажби, започвания на продукти и персонализирани препоръки.
  • Необичайни купувачи: Предишни клиенти, които не са направили покупка от дълго време. Кампании за повторно ангажиране, оферти за обратно привличане и персонализирани съобщения могат да ги върнат към вашия бизнес.
  • Нерешителни купувачи: Потребители с ниска до средна вероятност за извършване на покупка. Те може би са заинтересувани, но все още не са убедени. Предлагането на стимулирани промоции, образователно съдържание или искания за обратна връзка може да помогне за тяхното насочване.

Използването на този инструмент има няколко значителни предимства:

Бързина и леснота на създаване: Прогностичните сегменти са много лесни за настройка, спестявайки ви ценно време, което иначе бихте изразходвали за създаване на сложни ръчни групи.

По-добро представяне: Алгоритмите за машинно обучение анализират по-голямо количество данни. Това позволява създаването на по-насочени и прецизни сегменти, които обикновено превъзхождат тези, създадени ръчно.

Спестяване на разходи за кампании: Прогностичните сегменти се отличават, когато изпращате съобщения чрез канали като SMS, където цената на съобщение е забележима. Използвайки тази технология, можете да направите всяко съобщение ефективно и да постигате рентабилни резултати.

Нови работни потоци:

Освен желаните събития за конверсия (например, покупка), предсказващите сегменти могат да обхванат и други събития, като например отпадане на клиенти. Тези събития не са лесни за настройка с ръчна сегментация и дават възможност за креативни кампании за задържане.

По-лесно A/B тестване: Предсказващите сегменти обикновено дават по-добри резултати, което ги прави перфектни за A/B тестове на различни креативи, оферти и други променливи.

Нека разгледаме някои реални примери за тази технология.

Искам да тествам предсказващи сегменти!

Проучване на случая O.TAJE

O.TAJE, украинска модна марка за жени, драстично подобри своите Viber кампании чрез въвеждането на предсказваща сегментация чрез CDP Yespo. Между юни-август 2024, те тестваха предсказващите сегменти спрямо традиционния си подход на ръчна сегментация.

В една значителна кампания, техният предсказващ сегмент постигна:

  • 57.83% отваряне (срещу 45.24% за ръчно)
  • 5.73% конверсия (срещу 5.14% за ръчно)
  • 1010.89% ROMI (срещу 389.19% за ръчно)

Като цяло, кампании, които използваха предсказващи сегменти, подобриха следните метрики:

  • 26% по-високи кликвания
  • 300% по-високи конверсии
  • 310% увеличение на общия ROMI 

Сравнение на резултатите между предсказващи и обикновени сегменти

С оглед на резултатите, O.TAJE планира да използва предсказващи сегменти за други маркетингови канали, по-специално SMS.

Заключение

Това е всичко—сега знаете всичко необходимо, за да използвате ефективно предсказващата сегментация. Как тя се различава от описателните методи, какви данни се използват, как се изграждат моделите и как се оценяват те.

Въоръжени с тези знания, можете да стартирате свои собствени ефективни кампании, използвайки силата на машинното обучение.

Ако искате да научите повече за това как предсказващата сегментация може да работи за вашия бизнес—и как Yespo може да ви помогне с това—попълнете формата по-долу. Нашите експерти ще се свържат с вас незабавно.

Special Request Inline

0.0 от 5 на база 0 отзиви

Иван Дюлай

Копирайтър

Нагоре

Иван Дюлай

Копирайтър

Коментари 0