Metódy segmentácie trhu. Metódy segmentácie trhu Metóda segmentácie klastrov

Pracujem v odvetví e-mailového marketingu pre stránku s názvom MailChimp.com. Pomáhame klientom vytvárať bulletiny pre ich reklamné publikum. Zakaždým, keď niekto nazve našu prácu „vypchávaním pošty“, cítim nepríjemný chlad pri srdci.

prečo? Áno, pretože e-mailové adresy už nie sú čierne skrinky, ktoré bombardujete správami ako granáty. Nie, v e-mailovom marketingu (rovnako ako v iných formách online kontaktu vrátane tweetov, príspevkov na Facebooku a kampaní na Pintereste) firmy získavajú prehľad o tom, ako sa publikum zapája na individuálnej úrovni prostredníctvom sledovania kliknutí, online objednávok, distribúcie statusov na sociálnych sieťach, atď. Tieto údaje nie sú len interferenciou. Charakterizujú vaše publikum. Ale pre nezasvätených sú tieto operácie podobné múdrosti gréckeho jazyka. Alebo esperanto.

Ako zbierate transakčné údaje od svojich zákazníkov (používateľov, predplatiteľov atď.) a používate ich údaje na lepšie pochopenie vášho publika? Keď jednáte s mnohými ľuďmi, je ťažké študovať každého klienta individuálne, najmä ak vás všetci kontaktujú inak. Aj keby ste teoreticky mohli osloviť každého osobne, v praxi to pravdepodobne nebude možné.

Musíte si vziať svoju zákaznícku základňu a nájsť strednú cestu medzi náhodným bombardovaním a personalizovaným marketingom pre každého jednotlivého zákazníka. Jedným zo spôsobov, ako dosiahnuť túto rovnováhu, je použiť klastrovanie na segmentáciu vášho zákazníckeho trhu, aby ste mohli osloviť rôzne segmenty vašej zákazníckej základne s rôznym cieleným obsahom, ponukami atď.

Zhluková analýza je zhromažďovanie rôznych objektov a ich rozdelenie do skupín podobných. Spoluprácou s týmito skupinami – identifikáciou toho, čo majú ich členovia spoločné a čo ich odlišuje – sa môžete dozvedieť veľa o spleti údajov, ktoré máte. Tieto znalosti vám pomôžu robiť lepšie rozhodnutia a na podrobnejšej úrovni ako predtým.

V tejto súvislosti sa klastrovanie nazýva prieskumné dolovanie údajov, pretože tieto techniky pomáhajú „vytiahnuť“ informácie o vzťahoch v obrovských súboroch údajov, ktoré nemožno zachytiť vizuálne. A objavovanie súvislostí v sociálnych skupinách je užitočné v každom odvetví – pri odporúčaní filmov na základe zvykov cieľového publika, pri identifikácii centier kriminality v meste alebo pri zdôvodňovaní finančných investícií.

Jedným z mojich obľúbených spôsobov použitia klastrovania je zhlukovanie obrázkov: spájanie súborov obrázkov, ktoré v počítači „vyzerajú rovnako“. Napríklad v službách hostenia obrázkov, ako je Flickr, používatelia produkujú veľa obsahu a jednoduchá navigácia sa stáva nemožným kvôli veľkému počtu fotografií. Ale pomocou techník zhlukovania môžete zoskupiť podobné obrázky, čo používateľovi umožní prechádzať medzi týmito skupinami pred podrobným triedením.

Strojové učenie pod dohľadom alebo bez dozoru?

Pri dolovaní údajov podľa definície dopredu neviete, aký druh údajov hľadáte. Ste výskumník. Dokážete jasne vysvetliť, kedy dvaja zákazníci vyzerajú podobne a kedy inak, ale neviete, ako najlepšie segmentovať zákaznícku základňu. To je dôvod, prečo „požiadať“ počítač, aby za vás segmentoval vašu zákaznícku základňu, sa nazýva strojové učenie bez dozoru, pretože to nemáte pod kontrolou – nehovoríte počítaču, ako má robiť svoju prácu.

Na rozdiel od tohto procesu existuje strojové učenie pod dohľadom, ktoré sa zvykne objaviť, keď sa umelá inteligencia dostane na titulnú stránku. Ak viem, že chcem rozdeliť zákazníkov do dvoch skupín – povedzme „pravdepodobne kúpia“ a „nepravdepodobne si kúpia“ – a nakŕmiť počítač historickými príkladmi takýchto zákazníkov, pričom všetky inovácie aplikujem na jednu z týchto skupín, potom toto je kontrola.

Keby som namiesto toho povedal: „Tu je to, čo viem o svojich klientoch, a tu je návod, ako zistiť, či sú iní alebo rovnakí. Povedz mi niečo zaujímavé,“ toto je nedostatok kontroly.

Táto kapitola skúma najjednoduchšiu metódu zhlukovania nazývanú k-means, ktorá sa datuje do 50. rokov a odvtedy sa stala základom pri zisťovaní znalostí databáz (DKD) vo všetkých odvetviach a vládnych agentúrach.

Metóda k-means nie je matematicky najpresnejšia zo všetkých metód. Vznikla predovšetkým z dôvodov praktickosti a zdravého rozumu – ako afroamerická kuchyňa. Nemá taký šik rodokmeň ako francúzsky, no často vychádza v ústrety našim gastronomickým rozmarom. Zhluková analýza s k-means, ako čoskoro uvidíte, je čiastočne matematika a čiastočne história (o minulých udalostiach spoločnosti, ak sa toto porovnanie vzťahuje na metódy manažérskeho vzdelávania). Jeho nespornou výhodou je intuitívna jednoduchosť.

Pozrime sa, ako táto metóda funguje na jednoduchom príklade.

Dievčatá tancujú s dievčatami, chlapci sa škrabú na hlave

Cieľom zhlukovania k-means je vybrať niekoľko bodov v priestore a premeniť ich na k skupín (kde k je ľubovoľné číslo, ktoré si vyberiete). Každá skupina je definovaná bodom v strede, ako je vlajka zapichnutá do mesiaca a signalizujúca: „Hej, tu je stred mojej skupiny! Pridajte sa, ak ste bližšie k tejto vlajke ako ostatné!“ Toto skupinové centrum (oficiálne nazývané klastrové ťažisko) je samotným priemerom názvu metódy k-means.

Vezmime si ako príklad školské tance. Ak sa vám podarilo vymazať hrôzu tejto „zábavky“ zo svojej pamäti, je mi veľmi ľúto, že sa vám vraciam tak bolestné spomienky.

Hrdinovia nášho príkladu – študenti zo strednej školy Makakne, ktorí prišli na tanečný večer pod romantickým názvom „Ples na dne mora“ – sú roztrúsení po aule, ako je znázornené na obr. 1. Parketovú podlahu som dokonca namaľoval vo Photoshope, aby som si uľahčil predstavu o situácii.

Ryža. 1.Študenti gymnázia Makakne sedia v aule

Tu sú príklady skladieb, na ktoré budú títo mladí lídri slobodného sveta nemotorne tancovať (ak zrazu chcete hudobný sprievod, napríklad na Spotify):

  • Styx: Poď odplávať
  • Všetko okrem dievčaťa: Chýba
  • Ace of Base: Všetko, čo chce
  • Soft Cell: Tainted Love
  • Montell Jordan: Takto to robíme
  • Eiffel 65: modrá

Teraz zoskupovanie k-means závisí od počtu zhlukov, do ktorých chcete prítomných rozdeliť. Začnime tromi klastrami (na výber k sa pozrieme neskôr v tejto kapitole). Algoritmus nejakým prijateľným spôsobom umiestni tri vlajky na podlahu montážnej haly, ako je znázornené na obr. 2, kde vidíte 3 počiatočné vlajky rozdelené podľa pohlavia a označené čiernymi krúžkami.

Ryža. 2. Umiestnenie počiatočných centier klastra

Pri zoskupovaní k-means sú tanečníci priradení k ich najbližšiemu stredu zoskupenia, takže je možné nakresliť demarkačnú líniu medzi akýmikoľvek dvoma centrami na podlahe. Ak je teda tanečník na jednej strane linky, patrí do jednej skupiny, ak na druhej strane, tak do druhej (ako na obr. 3).

Ryža. 3.Čiary označujú hranice zhlukov

Pomocou týchto demarkačných čiar rozdeľte tanečníkov do skupín a podľa toho ich vyfarbite, ako na obr. 4. Tento diagram, ktorý rozdeľuje priestor na polygóny definované blízkosťou ku konkrétnemu stredu klastra, sa nazýva Voronoiov diagram.

Ryža. 4. Zoskupenie do zhlukov označených rôznymi vzormi pozadia vo Voronoiho diagrame

Pozrime sa na naše počiatočné rozdelenie. Niečo nie je v poriadku, však? Priestor je rozdelený dosť zvláštnym spôsobom: ľavá spodná skupina zostáva prázdna a na hranici pravej hornej skupiny je naopak veľa ľudí.

Algoritmus klastrovania k-means presúva stredy klastrov medzi pohlaviami, kým nedosiahne najlepší výsledok.

Ako určiť „najlepší výsledok“? Každá prítomná osoba je v určitej vzdialenosti od svojho stredu klastra. Čím menšia je priemerná vzdialenosť od účastníkov k stredu ich skupiny, tým lepší je výsledok.

Teraz uvádzame slovo „minimalizácia“ - bude pre vás veľmi užitočné pri optimalizácii modelu pre najlepšie umiestnenie klastrových centier. V tejto kapitole prinútite Nájsť riešenie nespočetnekrát presúvať centrá klastrov. Spôsob, akým nástroj Solution Finder používa na nájdenie najlepšieho miesta pre centrá klastrov, je pomaly ich opakovane presúvať po povrchu, pričom berie najlepšie nájdené výsledky a kombinuje ich (doslova ich spája ako dostihové kone), aby sa našla najlepšia poloha.

Ak teda schéma na obr. 4 vyzerá dosť bledo, „Hľadať riešenie“ môže zrazu usporiadať stredy ako na obr. 5. Tým sa mierne zníži priemerná vzdialenosť medzi každým tanečníkom a jeho stredom.

Ryža. 5. Mierne posuňte stredy

Je zrejmé, že skôr či neskôr Solution Finder si uvedomí, že stredy musia byť umiestnené v strede každej skupiny tanečníkov, ako je znázornené na obr. 6.

Ryža. 6. Optimálne zhlukovanie pri školských tancoch

Skvelé! Takto vyzerá ideálne zhlukovanie. Clusterové centrá sú umiestnené v strede každej skupiny tanečníkov, čím sa minimalizuje priemerná vzdialenosť medzi tanečníkom a najbližším centrom. Teraz, keď je zhlukovanie dokončené, je čas prejsť k zábavnej časti, ktorá sa snaží pochopiť, čo tieto zhluky znamenajú.

Ak poznáte farbu vlasov tanečníkov, ich politické preferencie alebo čas v behu na 100 metrov, potom zhlukovanie nemá veľký zmysel.

Ale akonáhle sa rozhodnete určiť vek a pohlavie prítomných, začnete vidieť niektoré všeobecné trendy. Malá skupina nižšie sú starší ľudia, ktorí s najväčšou pravdepodobnosťou sprevádzajú ľudí. Skupina vľavo sú všetci chlapci a skupina vpravo sú všetky dievčatá. A každý sa veľmi bojí tancovať medzi sebou.

K-means vám teda umožnilo rozdeliť veľa návštevníkov tanca do skupín a dať do súladu charakteristiky každého účastníka s členstvom v konkrétnom klastri, aby ste pochopili dôvod rozdelenia.

Teraz si asi hovoríte: „No tak, aký nezmysel. Odpoveď som poznal už pred začatím." Máš pravdu. V tomto príklade - áno. Zámerne som uviedol taký príklad „hračky“, aby som si bol istý, že to môžete vyriešiť iba pohľadom na bodky. Akcia prebieha v dvojrozmernom priestore, v ktorom sa zhlukovanie robí jednoducho pomocou očí.

Čo ak však prevádzkujete obchod, ktorý predáva tisíce produktov? Niektorí kupujúci uskutočnili jeden alebo dva nákupy za posledné dva roky. Ostatné - desiatky. A každý si kúpil niečo svoje.

Ako ich zoskupíte na takom „tanečnom parkete“? Začnime tým, že tento tanečný parket nie je dvojrozmerný, ba ani trojrozmerný. Ide o tisícrozmerný priestor na predaj tovaru, v ktorom kupujúci tovar v jednotlivých rozmeroch nakúpil alebo nekúpil. Môžete vidieť, ako rýchlo problém zhlukovania začína presahovať možnosti „prvotriedneho oka“, ako radi hovoria moji vojenskí priatelia.

Skutočný život: K-Means Clustering v e-mailovom marketingu

Prejdime ku konkrétnejšiemu prípadu. Som e-mailový marketér, tak vám dám príklad z Mailchimp.com, kde pracujem. Tento istý príklad bude fungovať na údajoch z maloobchodu, konverzie návštevnosti reklám, sociálnych médií atď. Interaguje s takmer akýmkoľvek typom údajov súvisiacich s oslovovaním zákazníkov reklamným materiálom, po ktorom si vás bezpodmienečne vyberú.

Veľkoobchodný predaj Wine Empire Joey Bag O'Donuts

Predstavte si na chvíľu, že žijete v New Jersey, kde prevádzkujete veľkoobchodný predaj vína Joey Bag O'Donuts. Ide o import-exportný podnik, ktorého účelom je dodávať veľké množstvá vína zo zámoria a predávať ho do určitých obchodov s alkoholom. Tento obchod funguje tak, že Joey cestuje po celom svete a hľadá neuveriteľné ponuky na množstvo vína. Posiela ho do svojho domova v Jersey a je len na vás, či ho vložíte do obchodov a zarobíte.

Zákazníkov nájdete mnohými spôsobmi: stránka na Facebooku, účet na Twitteri, niekedy dokonca direct mail – koniec koncov, e-maily „propagujú“ väčšinu typov podnikania. Minulý rok ste posielali jeden e-mail mesačne. Zvyčajne každé písmeno popisuje dve alebo tri transakcie, povedzme jednu pre šampanské a druhú pre malbec. Niektoré ponuky sú úžasné – zľava 80 % alebo viac. Výsledkom bolo, že ste za rok uzavreli asi 32 transakcií a všetky prebehli viac-menej hladko.

Ale to, že veci idú dobre, neznamená, že sa nemôžu zlepšiť. Bolo by užitočné pochopiť motívy vašich zákazníkov trochu hlbšie. Samozrejme, pri pohľade na konkrétnu objednávku vidíte, že istý Adams si v júli kúpil šumivé víno s 50% zľavou, no neviete určiť, čo ho k nákupu podnietilo. Páčilo sa mu minimálne objednané množstvo jednej škatule so šiestimi fľašami alebo cena, ktorá ešte nestúpla na maximum?

Bolo by pekné, keby ste mohli rozdeliť svoj zoznam klientov do záujmových skupín. Potom by ste mohli upravovať listy pre každú skupinu samostatne a možno tak ešte viac propagovať svoju firmu. Akákoľvek dohoda vhodná pre túto skupinu by sa mohla stať predmetom listu a objaviť sa v prvom odseku textu. Tento typ cielenej pošty môže spôsobiť skutočnú explóziu predaja!

Existuje možnosť nechať počítač robiť prácu za vás. Pomocou zoskupovania k-means môžete nájsť najlepšie zoskupenie a potom sa pokúsiť pochopiť, prečo je najlepšie.

Pôvodný súbor údajov

Excelový dokument, ktorý budeme analyzovať v tejto kapitole, sa nachádza na webovej stránke knihy. Obsahuje všetky zdrojové dáta pre prípad, že by ste s nimi chceli pracovať. Alebo môžete jednoducho sledovať text tak, že sa pozriete na zostávajúce listy dokumentu.

Na začiatok máte dva zaujímavé zdroje údajov:

  • metadáta pre každú objednávku sú uložené v tabuľke vrátane odrody, minimálneho množstva vína na objednávku, maloobchodnej zľavy, či bol prekročený cenový limit a krajiny pôvodu. Tieto údaje sa nachádzajú na karte s názvom OfferInformation, ako je znázornené na obr. 7;
  • Keď viete, ktorí zákazníci si čo objednávajú, môžete tieto informácie vytrhnúť z MailChimp a vložiť ich do tabuľky s metadátami ponuky na karte Transakcie. Toto sú variabilné údaje znázornené na obr. 8, veľmi jednoduché: kupujúci a jeho objednávka.

Ryža. 7. Podrobnosti o posledných 32 objednávkach

Ryža. 8. Zoznam objednávok podľa zákazníkov

Určenie predmetu merania

A tu je výzva. V školskom tanečnom probléme bolo meranie vzdialenosti medzi prítomnými a identifikácia centier klastrov jednoduché, však? Musíte len nájsť ten správny meter! Ale čo teraz robiť?

Viete, že minulý rok bolo 32 akčných ponúk a na samostatnej karte máte zoznam 324 objednávok rozdelených podľa kupujúcich. Ak však chcete zmerať vzdialenosť od každého kupujúceho k stredu klastra, musíte ho umiestniť do tohto priestoru s 32 dohodami. Inými slovami, musíte zistiť, aké obchody nedokončili, a vytvoriť maticu podľa jednotlivých zákazníkov, v ktorej každý zákazník dostane svoj vlastný stĺpec s 32 bunkami obchodov vyplnenými jednotkami, ak boli obchody dokončené, a nulami, ak boli dokončené. 't.

Inými slovami, musíte vziať túto riadkovú tabuľku ponúk a premeniť ju na maticu so zákazníkmi usporiadanými vertikálne a ponukami horizontálne. Najlepší spôsob, ako ho vytvoriť, je pomocou kontingenčných tabuliek.

Algoritmus akcie: na hárku s variabilnými údajmi vyberte stĺpce A a B a potom vložte kontingenčnú tabuľku. Pomocou Sprievodcu kontingenčnou tabuľkou jednoducho vyberte Deals ako hlavičku riadka a Zákazníci ako hlavičku stĺpca a vyplňte tabuľku. Bunka bude 1, ak pár zákazník-obchod existuje, a 0, ak neexistuje (v tomto prípade sa 0 zobrazí ako prázdna bunka). Výsledkom je tabuľka znázornená na obr. 9.

Ryža. 9. Súhrnná tabuľka zákazníckych obchodov

Teraz, keď máte informácie o objednávke v maticovom formáte, skopírujte hárok OfferInformation a pomenujte ho Matrix. Do tohto nového pracovného hárka prilepte hodnoty z kontingenčnej tabuľky (nie je potrebné kopírovať a prilepovať číslo obchodu, pretože je už v informáciách o objednávke), začnite stĺpcom H. Mali by ste skončiť s rozšírenou verziou matice, doplnené o informácie o objednávke ako na obr. 10.

Ryža. 10. Popisy transakcií a údaje o objednávkach zlúčené do jednej matice

Štandardizácia údajov

Táto kapitola predstavuje každú dimenziu vašich údajov rovnakým spôsobom, ako informácie o binárnom poradí. Ale v mnohých situáciách zahŕňajúcich klastrovanie to nedokážeme. Predstavte si scenár, v ktorom sú ľudia zoskupení podľa výšky, hmotnosti a platu. Všetky tieto tri typy údajov majú rôzne rozmery. Výška sa môže pohybovať od 1,5 do 2 metrov, pričom hmotnosť sa môže pohybovať od 50 do 150 kg.

V tomto kontexte sa meranie vzdialenosti medzi zákazníkmi (ako medzi tanečníkmi v montážnej hale) stáva mätúcou záležitosťou. Preto je bežné štandardizovať každý stĺpec údajov odčítaním priemeru a následným delením podľa miery rozptylu nazývanej štandardná odchýlka. Všetky stĺpce sú teda zredukované na jednu hodnotu, ktorá sa kvantitatívne mení okolo 0.

Začnime so štyrmi klastrami

Teraz sú všetky vaše údaje zredukované do jediného vhodného formátu. Ak chcete spustiť klastrovanie, musíte vybrať k - počet klastrov v algoritme k-means. Bežný spôsob, ako použiť k-means, je vziať súbor rôznych k a otestovať ich jeden po druhom (vysvetlím, ako ich vybrať neskôr), ale ešte len začíname – takže si vyberieme len jeden .

Budete potrebovať niekoľko klastrov, ktoré sú zhruba vhodné pre to, čo chcete robiť. Zjavne nemáte v úmysle vytvoriť 50 zhlukov a poslať 50 cielených propagačných e-mailov niekoľkým chlapom z každej skupiny. To okamžite marí účel nášho cvičenia. V našom prípade potrebujeme niečo malé. Začnite tento príklad so 4 – v ideálnom svete by ste pravdepodobne rozdelili svoj zoznam klientov na 4 jasné skupiny po 25 ľuďoch (čo je v skutočnosti nepravdepodobné).

Ak teda musíte kupujúcich rozdeliť do 4 skupín, aký je najlepší spôsob ich výberu?

Namiesto zničenia pekného hárku Matrix skopírujte údaje do nového hárku a nazvite ho 4MC. Teraz môžete vložiť 4 stĺpce za vysokú cenu v stĺpcoch H až K, ktoré budú stredmi klastra. (Ak chcete vložiť stĺpec, kliknite pravým tlačidlom myši na stĺpec H a vyberte položku Vložiť. Stĺpec sa zobrazí vľavo.) Pomenujte tieto klastre Klaster 1 až Klaster 4. Môžete na ne použiť aj podmienené formátovanie a kedykoľvek ich nainštalujete, môžete vidieť, akí sú rozdielni.

Hárok 4MC sa zobrazí, ako je znázornené na obr. jedenásť.

Ryža. jedenásť. Prázdne stredy klastra umiestnené na hárku 4MC

V tomto prípade sú všetky stredy klastrov nuly. Technicky však môžu byť čokoľvek a čo sa vám bude obzvlášť páčiť - ako na školskom tanci, sú rozmiestnené tak, aby minimalizovali vzdialenosť medzi každým kupujúcim a jeho centrom klastra.

Je zrejmé, že tieto centrá budú mať hodnoty od 0 do 1 pre každú transakciu, pretože všetky klientske vektory sú binárne.

Čo však znamená „merať vzdialenosť medzi centrom klastra a zákazníkom“?

Euklidovská vzdialenosť: priame meranie vzdialeností

Pre každého klienta máte samostatný stĺpec. Ako merať vzdialenosť medzi nimi? V geometrii sa to nazýva „najkratšia cesta“ a výsledná vzdialenosť sa nazýva euklidovská vzdialenosť.

Vráťme sa na chvíľu do montážnej haly a skúsme pochopiť, ako tam vyriešiť náš problém.

Umiestnime súradnicové osi na podlahu a na obr. 12 uvidíme, že v bode (8,2) máme tanečníka a v bode (4,4) máme stred klastra. Na výpočet euklidovskej vzdialenosti medzi nimi si budete musieť zapamätať Pytagorovu vetu, ktorú poznáte už zo školy.

Ryža. 12. Tanečnica v bode (8,2) a stred zoskupenia v (4,4)

Tieto dva body sú od seba vzdialené 8 - 4 = 4 metre vertikálne a 4 - 2 = 2 metre horizontálne. Podľa Pytagorovej vety je štvorec vzdialenosti medzi dvoma bodmi 4A2+2A2 = 20 metrov. Odtiaľto vypočítame samotnú vzdialenosť, ktorá sa bude rovnať druhej odmocnine z 20, čo je približne 4,47 m (ako na obr. 13).

Ryža. 13. Euklidovská vzdialenosť sa rovná druhej odmocnine súčtu vzdialeností v každom smere

V kontexte odberateľov newslettera máte viac ako dve dimenzie, no platí rovnaký koncept. Vzdialenosť medzi kupujúcim a stredom klastra sa vypočíta tak, že sa zoberú rozdiely medzi dvoma bodmi pre každý obchod, umocní sa ich druhá mocnina, pripočítajú sa a vezmú sa odmocniny. Napríklad na pracovnom hárku 4MS chcete poznať euklidovskú vzdialenosť medzi stredom klastra 1 v stĺpci H a objednávkami zákazníka Adamsa v stĺpci L.

V bunke L34, pod Adamsovými príkazmi, môžete vypočítať rozdiel medzi Adamsovým vektorom a stredom klastra, odmocniť ho, pridať a potom odmocniť pomocou nasledujúceho vzorca pre polia (všimnite si absolútne prepojenia, ktoré vám umožňujú pretiahnuť toto vzorec vpravo alebo dole bez zmeny prepojenia na stred klastra):


(=ROOT(SUM(L$2:L$33-$H$2:$H$33)A2)))

Vzorec poľa (napíšte vzorec a stlačte Ctrl+Shift+Enter alebo Cmd+Return v systéme MacOS, ako je uvedené v kapitole 1) je potrebné použiť, pretože jeho časť (L2:L33-H2:H33)^2 musí „ vedieť“, kde môžete vypočítať rozdiely a odmocniť ich, krok za krokom. Výsledkom je však nakoniec jediné číslo, v našom prípade 1,732 (ako na obr. 14). Má nasledujúci význam: Adams uskutočnil tri obchody, ale keďže počiatočné stredy klastra sú nula, odpoveď sa bude rovnať druhej odmocnine z 3, konkrétne 1,732.

Ryža. 14. Vzdialenosť medzi stredom klastra 1 a Adamsom

V tabuľke na obr. 2-14 som ukotvil horný riadok (pozri kapitolu 1) medzi stĺpce G a H a pomenoval riadok 34 v bunke G34 „Vzdialenosť ku klastri 1“, len aby som pri posúvaní stránky nadol videl, kde sa nachádza.

Vzdialenosti a členstvo v klastri pre každého!

Teraz viete, ako vypočítať vzdialenosť medzi vektorom objednávky a stredom klastra.

Teraz je čas pridať Adamsov výpočet vzdialeností k zostávajúcim stredom klastra potiahnutím bunky L34 nadol na L37 a potom manuálne zmeniť referenciu stredu klastra zo stĺpca H na stĺpce I, J a K v bunkách nižšie. Výsledkom by mali byť nasledujúce 4 vzorce v L34:L37:

(=SQRT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=SQRT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2)))
(=ROOT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=ROOT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=ROOT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=ROOT(SUM((L$2:L$33-$K$2:$K$33)A2)))

Keďže ste použili absolútne prepojenia pre stredy klastrov (to znamená znak $ vo vzorcoch, ako je vysvetlené v kapitole 1), môžete pretiahnuť L34:L37 do DG34:DG37 a vypočítať vzdialenosť od každého zákazníka ku všetkým štyrom stredom klastra. Riadky v stĺpci G v bunkách 35 až 37 pomenujte „Vzdialenosť do klastra 2“ atď. Novo vypočítané vzdialenosti sú znázornené na obr. 15.

Ryža. 15. Výpočet vzdialeností od každého kupujúceho do všetkých centier klastra

Teraz poznáte vzdialenosť každého klienta od všetkých štyroch centier klastra. Ich rozdelenie do zhlukov sa uskutočnilo podľa najkratšej vzdialenosti v dvoch krokoch nasledovne.

Najprv sa vráťme k Adamsovi v stĺpci L a vypočítajme minimálnu vzdialenosť od stredu klastra v bunke L38. Je to jednoduché:

Min(L34:L37)
=min(L34:L37)

Na výpočet používame vzorec match/searchpose (podrobnejšie v kapitole 1). Po umiestnení do L39 vidíte číslo bunky z intervalu L34:L37 (počítam každú v poradí od 1), čo je v minimálnej vzdialenosti:

Zhoda(L38,L34:L37,0) =searchpose(L38,L34:L37,0)

V tomto prípade je vzdialenosť rovnaká pre všetky štyri zhluky, takže vzorec vyberie prvý (L34) a vráti 1 (obrázok 16).

Ryža. 16. Pridanie klastrových väzieb na hárok

Tieto dva vzorce môžete tiež presunúť myšou na DG38: DG39. Ak chcete byť prehľadnejší, pridajte názvy riadkov 38 a 39 do buniek 38 a 39 stĺpca G, „Minimálna vzdialenosť klastra“ a „Priradený klaster“.

Hľadanie riešení pre klastrové centrá

Vaša tabuľka bola aktualizovaná o výpočty vzdialeností a prepojenie na klastre. Teraz, aby sme určili najlepšie umiestnenie centier klastra, musíme nájsť tie hodnoty v stĺpcoch H až K, ktoré minimalizujú celkovú vzdialenosť medzi kupujúcimi a centrami klastra, ku ktorým sú pripojené, uvedené v riadku 39 pre každého kupujúceho. .

Keď počujete slovo „minimalizovať“, začína sa fáza optimalizácie a optimalizácia sa vykonáva pomocou „hľadania riešenia“.

Ak chcete použiť funkciu Nájsť riešenie, budete potrebovať bunku s výsledkami, takže v A36 zhrnieme všetky vzdialenosti medzi zákazníkmi a ich centrami klastra:

SUM(L38:DG38)
=CUMMA(L3 8:DG3 8)

Tento súčet vzdialeností od klientov k ich najbližším klastrovým centrám je presne tou objektívnou funkciou, s ktorou sme sa stretli skôr pri zhlukovaní auly Macakne High School. Ale euklidovská vzdialenosť so svojimi mocninami a odmocninami je príšerne nelineárna funkcia, takže namiesto simplexnej metódy budete musieť použiť algoritmus evolučného riešenia.

Túto metódu ste už použili v kapitole 1. Simplexný algoritmus, ak je možné ho použiť, pracuje rýchlejšie ako ostatné, ale nedá sa použiť na výpočet koreňov, štvorcov a iných nelineárnych funkcií. OpenSolver, ktorý používa simplexný algoritmus, aj keď to vyzerá, že bral steroidy, je rovnako zbytočný.

V našom prípade evolučný algoritmus zabudovaný do nástroja Solution Finder využíva kombináciu náhodného hľadania a vynikajúceho riešenia kríženia, aby, podobne ako evolúcia v biologickom kontexte, našiel efektívne riešenia.

Pred „Hľadaním riešenia“ máte všetko, čo potrebujete na nastavenie problému:

  • cieľ: minimalizovať celkové vzdialenosti od zákazníkov k ich centrám klastrov (A36);
  • premenné: vektor každej transakcie vo vzťahu k stredu klastra (H2:K33);
  • podmienky: stredy klastrov musia mať hodnoty v rozsahu od 0 do 1.

Odporúča sa mať „Vyhľadávač riešení“ a kladivo. Nastavili sme úlohu „Hľadanie riešenia“: minimalizujte A36 zmenou hodnôt H2:K33 s podmienkou H2:K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

Ryža. 17. Nastavenia „Solution Search“ pre 4-centrové zoskupovanie

Ale nastaviť problém nie je všetko. Budete sa musieť trochu zapotiť a vybrať potrebné možnosti pre evolučný algoritmus kliknutím na tlačidlo „Možnosti“ v okne „Vyhľadávanie riešení“ a prechodom do okna nastavení. Odporúčam vám nastaviť maximálny čas o 30 sekúnd viac, v závislosti od toho, ako dlho ste ochotní čakať, kým sa „Vyhľadávač riešení“ vyrovná so svojou úlohou. Na obr. 18 Moju som nastavil na 600 sekúnd (10 minút). Takto môžem spustiť Find a Solution a ísť na obed. A ak ho chcete predčasne prerušiť, stačí stlačiť Escape a ukončiť ho s najlepším riešením, ktoré sa mu podarilo nájsť.

Ryža. 18. Parametre evolučného algoritmu

Kliknite na položku Spustiť a sledujte, ako Excel robí svoju prácu, kým sa evolučný algoritmus nezblíži.

Význam získaných výsledkov

Keď vám Solver poskytne optimálne centrá klastrov, zábava sa začína. Prejdime k študijným skupinám! Na obr. Na obrázku 19 vidíme, že Solver našiel optimálnu celkovú vzdialenosť 140,7 a všetky štyri stredy klastrov – vďaka podmienenému formátovaniu! - vyzerať úplne inak.

Ryža. 19.Štyri optimálne centrá klastra

Majte na pamäti, že vaše centrá klastrov sa môžu líšiť od tých, ktoré sú uvedené v knihe, pretože evolučný algoritmus používa náhodné čísla a odpoveď je zakaždým iná. Zhluky môžu byť úplne odlišné alebo pravdepodobnejšie v inom poradí (napríklad môj klaster 1 môže byť veľmi blízko vášmu klastru 4 atď.).

Keďže ste pri vytváraní hárku vložili popisy transakcií do stĺpcov B až G, teraz si môžete prečítať podrobnosti na obr. 19, čo je dôležité pre pochopenie myšlienky klastrových centier.

Pre klaster 1 v stĺpci H vyberá podmienené formátovanie obchody 24, 26, 17 a v menšom rozsahu 2. Keď si prečítate popisy týchto obchodov, pochopíte, čo majú spoločné: všetky boli vyrobené na pinote noir.

Pri pohľade na stĺpec I uvidíte, že všetky zelené bunky majú nízke minimálne množstvá. Ide o kupujúcich, ktorí nechcú počas procesu transakcie nakupovať veľké množstvá.

Ale ďalšie dve klastrové centrá, úprimne povedané, je ťažké interpretovať. Namiesto výkladu klastrových centier, čo keby sme študovali samotných kupujúcich v klastri a určili, aké ponuky sa im páčia? To by mohlo problém objasniť.

Hodnotenie transakcií klastrovou metódou

Namiesto toho, aby sme zisťovali, ktoré stredové vzdialenosti klastra sú bližšie k 1, skontrolujme, kto je pripojený ku ktorému klastru a aké obchody preferuje.

Ak to chcete urobiť, začneme skopírovaním hárku OfferInformation. Kópiu nazvime 4MC – TopDealsByCluster. Očíslujte stĺpce H až K na tomto novom hárku od 1 do 4 (ako na obrázku 20).

Ryža. 20. Vytvorenie tabuľky na výpočet popularity obchodu pomocou zhlukov

Na hárku 4MC ste mali väzby pre klastre 1 až 4 v riadku 39. Na spočítanie obchodov podľa klastrov stačí pozrieť sa na názvy stĺpcov H až K na hárku 4MC - TopDealsByCluster, zistiť, ktorý z hárkov 4MC bola prepojená s týmto klastrom v riadku 39 a potom spočítajte počet ich transakcií v každom riadku. Takto získame celkový počet kupujúcich v tomto klastri, ktorí uskutočnili transakcie.

Začnime bunkou H2, ktorá zaznamenáva počet kupujúcich v klastri 1, ktorí prijali ponuku číslo 1, konkrétne januárový Malbec. Je potrebné pridať hodnoty buniek v rozsahu L2: DG2 na hárku 4MC, ale iba kupujúcich z 1 klastra, čo je klasický príklad použitia vzorca sumif / sumif. Vyzerá takto:

SUMIF("4MC"!$L$39:$DG$39,"4MC – TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

Tento vzorec funguje takto: dodáte mu nejaké podmienené hodnoty, ktoré skontroluje v prvej časti „4MC“!$L$39:$DG$39,“4MC, potom porovná s 1 v hlavičke stĺpca („4MC – TopDealsByCluster "!H$1 ) a potom pre každú zhodu pridá túto hodnotu do riadku 2 v tretej časti vzorca "4MC"!$L2:$DG2.

Všimnite si, že ste použili absolútne referencie ($ vo vzorci) pred všetkým, čo súvisí s asociáciou klastra, číslom riadku v hlavičke stĺpcov a písmenom stĺpca pre dokončené obchody. Po absolutizácii týchto odkazov môžete vzorec presunúť kdekoľvek z H2:K33 a vypočítať počet obchodov pre iné centrá klastra a kombinácie obchodov, ako na obr. 21. Aby boli tieto stĺpce čitateľnejšie, môžete na ne použiť aj podmienené formátovanie.

Ryža. 21. Celkový počet transakcií pre každú ponuku rozdelený do skupín

Zvýraznením stĺpcov A až K a použitím automatického filtrovania môžete tieto údaje zoradiť. Zoradením stĺpca H od najmenšieho po najväčší môžete vidieť, ktoré ponuky sú najpopulárnejšie v skupine 1 (obrázok 22).

Ryža. 22. Triedenie zhlukov 1. Pino, pinot, pinot!

Ako som už spomenul, štyri najväčšie obchody pre tento klaster sú pinoty. Títo chlapi zjavne zneužívajú film Sideways. Ak zoradíte zhluk 2, potom vám bude úplne jasné, že ide o malých veľkoodberateľov (obr. 23).

Ale keď zoradíte klaster 3, nebude také ľahké nič pochopiť. Veľké transakcie sa dajú spočítať na jednej ruke a rozdiel medzi nimi a zvyškom nie je taký zrejmý. Najpopulárnejšie ponuky však majú niečo spoločné – celkom dobré zľavy, 5 zo 6 najväčších ponúk je na šumivé víno a Francúzsko je výrobcom produktu pre 3 zo 4 z nich. Tieto predpoklady sú však nejednoznačné.

Pokiaľ ide o Cluster 4, týmto chlapcom sa z nejakého dôvodu jednoznačne páčila augustová ponuka šampanského. Taktiež 5 zo 6 najväčších transakcií sa týka francúzskeho vína a 9 z 10 najväčších transakcií sa týka veľkých objemov tovaru. Možno je to veľký veľkoobchodný klaster smerujúci k francúzskym vínam? Priesečník zhlukov 3 a 4 je tiež znepokojujúci.

Ďalej uvažujeme o segmentácii študentov podľa subjektívnych vlastností (pozri pododdiel 14.1) a podľa výhod (pozri pododdiel 14.4), ktoré poskytuje získanie vysokoškolského vzdelania v dennej forme vzdelávania. Na segmentáciu sa používa technika založená na zhlukovej analýze s použitím viacrozmerného škálovania pre ďalšiu, úplnejšiu analýzu.

Segmentačné premenné– vlastnosti a výhody – musia mať kvantitatívne skóre. Na vyriešenie konkrétneho problému bolo použitých deväť parametrov. Na použitie Likertovej stupnice sú pre každý parameter formulované zodpovedajúce výroky.

  • 1. Toto je najlepší spôsob, ako získať hlboké vedomosti.
  • 2. Toto je príležitosť na plnú komunikáciu a nadväzovanie priateľstiev.
  • 3. Toto je cenná príležitosť na interakciu s učiteľom.
  • 4. Toto je dôležitý krok na začiatku kariéry.
  • 5. Študentský život je nádherné obdobie života.
  • 6. Materiálne náklady denného vzdelávania sú vysoké.
  • 7. Časová náročnosť denného vzdelávania je vysoká.
  • 8. Rozvíja myslenie v odbore.
  • 9. Denné vzdelávanie je prestížne.

Súbor parametrov, ktoré možno použiť, môže byť oveľa širší. Študenti vo svojich dotazníkoch často uvádzajú aj tieto výhody alebo nevýhody denného štúdia na vysokej škole: možnosť rozšírenia si obzorov, možnosť odkladu, možnosť naučiť sa sebadisciplíne a sebaorganizácii, náročnosť skĺbenia štúdia a práce, dôležité obdobie v živote, nedostatok praxe, možnosť získať veľké množstvo informácií, vplyv na ďalšie napredovanie v práci, možnosť v budúcnosti rozhodnúť sa o správnej voľbe povolania, účasť na živote tzv. univerzite.

Zber dát

Zber údajov prebieha pomocou dotazníkovej metódy. Otázky sú formulované pomocou Likertovej škály (pozri časť 8.3). Študentov sa napríklad pýtali na mieru súhlasu alebo nesúhlasu s výrokmi na päťbodovej škále. Sedembodová škála je v literatúre široko používaná, no často sa respondentovi ťažko dávajú odpovede s veľkým počtom stupňov.

Fragment dotazníka vyzerá ako na obr. 24.2.

Ryža. 24.2.

Od respondenta sa vyžaduje iba zaškrtnutie a digitalizácia sa vykonáva pomocou dotazníka. Použila sa päťbodová stupnica s úrovňami od 1 do 5 (1 – úplne nesúhlasím, ..., 5 – úplne súhlasím). Na dotazník odpovedalo 19 respondentov – všetci študenti z tej istej skupiny, čo je, samozrejme, málo.

24.7. Segmentácia podľa vlastností na príklade vzdelávacieho produktu 381

Výpočty pomocou metódy zhlukovej analýzy

Zhluková analýza (pozri pododdiel 23.7) sa široko používa pri segmentácii podľa vlastností produktu (pozri pododdiel 24.3). Segmentácia pomocou zhlukovej analýzy sa niekedy nazýva hierarchické. Na základe získaných známok sa vypočítajú vzdialenosti medzi známkami každého žiaka s každým. Na základe balíka vedeckých štatistických programov Statistica. Najprv sa zostaví matica euklidovských vzdialeností (euklidovské vzdialenosti). Na vytvorenie zhlukov sa použil kombinačný (aglomeratívny) postup využívajúci metódu vzdialeného suseda (úplné prepojenie). Výsledky sú prezentované vo forme diagramu na obr. 24.3.

Ryža. 24.3. dendrogram (DPP) štatistika)

Vertikálna os udáva vzdialenosť medzi pripojenými klastrami (Linkage Distance). Študenti sú uvedení pozdĺž vodorovnej osi s číslami od C_1 do C 19. Ako vyplýva z dendrogramu, na prvom kroku je 19 zhlukov. V prvom a druhom kroku sa spoja body 3 s 5 a 9 s 11. V treťom kroku sa spoja body 8 a 13. Potom proces zlučovania pokračuje.

Pri výbere konečného kroku a podľa toho aj počtu zhlukov vychádzame z plánu aglomerácie (obr. 24.4). Konečná verzia je považovaná za krok, po ktorom sa vzdialenosť medzi zlučovanými klastrami (Linkage Distance) prudko zväčšuje.

Ryža. 24.4.

Vyberme výsledok rozdelenia v súlade s odporúčaniami z pododdielu. 23.7. Ako vyplýva z aglomeračného plánu, na 13. a 17. kroku (krok na obr. 24.4) dochádza k pomerne prudkému nárastu vzdialenosti medzi pripojenými zhlukmi. Preto si treba vybrať medzi 12. a 16. krokom. Jednoznačne vybrať konečný krok v súlade s rovnakými odporúčaniami z ods. 23.7 prejdime k viacrozmernému škálovaniu.

Výsledky segmentácie pomocou metódy viacrozmerného škálovania

Okrem toho, na výber konečnej možnosti klasifikácie sa zvažuje obrázok relatívnych polôh bodov pomocou metódy viacrozmerného škálovania na obr. 24.5, ktorý bol získaný ako výsledok práce s PPP Statistica. Pozdĺž osí sú dve dimenzie – dimenzia 1 a dimenzia 2.

Klastre majú konvexný tvar až v 16. kroku zhlukovej analýzy, čo je možné vidieť z výsledkov kreslenia medziskupinových hraníc na základe viacrozmerného škálovania. Tieto výsledky sú akceptované ako konečné. Vytvorili sa tri klastre a v podstate segmenty. Prvá skupina obsahuje deväť bodov, druhá - tri, tretia - sedem.

Ryža. 24.5.

Charakteristika segmentov

Segmenty môžu byť charakterizované priemernými hodnotami pre každú premennú a výsledky segmentácie môžu byť vizuálne prezentované vo forme profilov pre priemerné hodnoty pre každú premennú (obr. 24.6).

S cieľom poskytnúť zmysluplný, lakonický popis segmentu je daný segment názvom a mottom. Kompletný popis klastra vyplýva z jeho profilu. Názov segmentu môže byť založený na premenných, ktoré majú najvyššie a najnižšie skóre, ako je vidieť pri pohľade na profily. Porovnanie profilov vám umožňuje identifikovať vlastnosti každého segmentu a „umiestniť“ ho na pozadí ostatných.

Sformulujme názov každého prijatého segmentu a uveďme motto. Prvý segment - pozitivisti: „Náklady nie sú hlavná vec“, po druhé – milovníkov života. „Mysli na súčasnosť

Ryža. 24.6.

nie tu pre prestíž a kariéru,“ tretí – účelový: "Náklady platí prestíž." Na získanie názvu segmentu bola použitá nasledujúca technológia.

Skutočne, v súlade s obr. 24.6:

  • Pre prvý klaster Vysoké skóre sú typické pre atribúty (4) „Študium je nádherné obdobie života“ a (8) „Rozvíja myslenie v odbore“. Zároveň výroky (6) „Materiálové náklady sú vysoké“ a (7) „Časové náklady sú vysoké“ získali nízke hodnotenie;
  • druhý klaster – vysoké skóre za výroky (1) „Príležitosť plne komunikovať a nadväzovať priateľstvá“ a (4) „Študium je úžasné obdobie v živote.“ Nízke skóre boli získané za výroky (3) „Dôležitý krok vo vašej kariére“ a (9) „Denné vzdelávanie je prestížne“;
  • tretí klaster – vysoké skóre pre výroky (6) „Materiálové náklady sú vysoké“ a (9) „Denné vzdelávanie je prestížne“ s relatívne nízkym skóre pre (4) „Študium je úžasné obdobie v živote.“
  • Výhody sa tu bežne chápu ako motívy na získanie takéhoto vzdelania.
  • PPP je balík aplikačných programov.
  • Teória metódy je uvedená v podkapitole. 23.6.
  • Pre známejšie zobrazenie profilu ho musíte otočiť o 90° v smere hodinových ručičiek.

Segmentácia trhu je formálny postup založený na aplikácii štatistických metód mnohorozmernej analýzy na výsledky výskumu. Existujú štyri hlavné metódy, ktoré možno použiť na získanie segmentov trhu:

1 Tradičné metódy:

A priori (a priori);

Na základe klastra.

2 nové metódy:

Flexibilná segmentácia;

Komponentná segmentácia.

A priori metóda segmentácie spotrebiteľského trhu sa používa vtedy, keď je možné predložiť hypotézu segmentácie trhu. Na to je potrebné pochopiť potreby, priania a túžby spotrebiteľov. Ako nezávislé premenné budú pôsobiť spotrebiteľské charakteristiky ako intenzita spotreby, potreby, kľúčové prvky motivácie a ich významy a ako závislé premenné budú použité segmentačné premenné (vek, pohlavie, región a pod.).

Pomocou tejto metódy výskumník najprv predloží hypotézu segmentácie trhu a potom ju testuje počas marketingového výskumu.

A priori metóda segmentácie trhu zahŕňa sedem fáz:

1 Výber základu segmentácie. Analýza potrieb, potrieb a iných faktorov, ktoré ovplyvňujú výber spotrebiteľa.

2 Výber segmentačných premenných a vývoj mriežky segmentácie trhu (hypotéza). Vyberú sa a zdôvodnia sa kritériá a premenné pre segmentáciu spotrebiteľského trhu, hľadajú sa pravdepodobné súvislosti medzi bázou a premennými a odstránia sa rozpory v mriežke segmentácie trhu.

3 Odber vzoriek.

4 Vykonáva sa prieskum a zbierajú sa kvantitatívne údaje.

5 Segmenty sú tvorené na základe rozdelenia respondentov spomedzi možných kupujúcich do kategórií.

6 Vytvorenie profilov segmentov. Vytvárajú sa trhové segmenty a testujú sa, či sú v súlade s predloženou hypotézou.

7 Vývoj marketingových stratégií pre každý segment trhu.

Metóda apriórnej segmentácie je najpoužívanejšou metódou. Je to spôsobené jeho jednoduchosťou, nízkymi nákladmi a dostupnosťou techník, ktoré zabezpečujú jeho implementáciu. V praxi však často nastávajú situácie, keď je pomerne ťažké predložiť hypotézu segmentácie trhu.

Klastrová metóda je podobná apriórnej metóde, ale nedefinuje závislú premennú – hľadá prirodzené zhluky. Po prvé, respondenti z radov potenciálnych kupcov sú zoskupení do trhových segmentov pomocou analytického postupu. Potom sa identifikujú premenné, ktoré by sa mohli použiť na definovanie segmentu trhu.

Pri zhlukovaní sa hľadajú prirodzené skupiny a pri klasifikácii sa skupiny vytvárajú podľa umelo určených kritérií.


Zoskupovanie spotrebiteľov pomocou metódy AID je rozšírené. Pri použití tejto metódy sa vyberie kritérium formovania systému. Potom sa vzorka rozdelí na podskupiny, to znamená, že sa vytvoria podskupiny s vysokou hodnotou systémotvorného kritéria.

Nevýhodou tejto metódy je výber segmentu trhu. Metóda je náročná na prácu a nezaručuje presné riešenie.

Segmentácia pomocou metódy zhlukovej analýzy sa vykonáva vzostupne (zdola nahor). Vo fáze marketingového prieskumu sa identifikujú mnohé charakteristiky kupujúceho. Vyžaduje sa vzorka najmenej 200 jednotiek. Výsledky sa spracúvajú. Údaje sa posudzujú v univerzálnej mierke, ktorá určuje závažnosť parametra. Potom sa preskúma každý spotrebiteľ a určia sa tie, ktoré sú si navzájom najviac podobné. Podobní spotrebitelia sa spájajú do zhlukov a pôsobia ako zložený objekt. Ďalej sa vyhľadajú objekty, ktoré sú si navzájom najviac podobné, a spoja sa do nového zhluku. Proces končí, keď nie je možné identifikovať podobné zhluky.

Na implementáciu segmentácie trhu metódou klastrovania možno v praxi použiť štatistické balíky ako SPSS a NCSS&PASS.

Flexibilná segmentácia trhu je dynamický postup, ktorý umožňuje flexibilitu pri vytváraní segmentov na základe analýzy preferencií spotrebiteľov pre produktové alternatívy. Postup spoločnej analýzy je základom flexibilnej segmentácie. Jednou z výhod tejto metódy je, že umožňuje pomerne presne určiť skupiny spotrebiteľov, keď na trh vstúpi nový produkt. Medzi nevýhody metódy flexibilnej segmentácie patrí vysoká cena, zložitý postup implementácie a možné chyby na úrovni vývojára.

Komponentová analýza segmentácie trhu je založená na sofistikovaných technikách štatistickej analýzy. Vyžaduje veľké výpočtové zdroje. Metódu komponentovej analýzy segmentácie trhu navrhol P. Green. Táto metóda sa pokúša určiť, ktorý typ kupujúceho je najvhodnejší pre určité vlastnosti produktu.

Metóda flexibilnej a komponentovej segmentácie trhu je podľa západných expertov čisto akademická a v reálnom živote neaplikovateľná.

V rámci práce na prvej kapitole záverečnej kvalifikačnej práce boli získané teoretické poznatky z oblasti segmentácie spotrebiteľského trhu. Zohľadňujú sa hlavné črty segmentácie spotrebiteľského trhu. Boli študované metódy segmentácie trhu.

Romanyuk E. V.

Rusko, Stavropol, magisterský titul zo Severokaukazskej federálnej univerzity

Prehľad metód klastrovej analýzy a posúdenie ich použiteľnosti pri riešení problému segmentácie spotrebiteľského trhu

anotácia

Tento článok pojednáva o procese segmentácie spotrebiteľského trhu, definícii systému na podporu rozhodovania, ako aj o využití klastrovej analýzy v rôznych oblastiach činnosti, čo je spoločný súbor metód klastrovej analýzy na riešenie marketingových problémov.

Kľúčové slová: Segmentácia, klastrová analýza, dolovanie dát, podpora rozhodovania. Segmentácia, klastrová analýza, dolovanie dát, podpora rozhodovania.

Moderný obsah procesu segmentácie trhu je výsledkom vývoja marketingovej koncepcie. Predtým, ako výrobca začal považovať trh za diferencovanú štruktúru závislú od skupín spotrebiteľov a spotrebiteľských vlastností produktu, jeho názory a vedomie prešli rôznymi marketingovými metódami: masovým, produktovo diferencovaným, cieleným.

Segmentácia trhu je na jednej strane metódou hľadania častí trhu a určovania objektov, ku ktorým smerujú marketingové aktivity podnikov. Na druhej strane je to manažérsky prístup k rozhodovaciemu procesu podniku na trhu, základ pre výber správnej kombinácie marketingových prvkov.

Predmetom segmentácie sú predovšetkým spotrebitelia. Vybrané osobitným spôsobom a majúce určité spoločné vlastnosti tvoria trhový segment. Hlavným zameraním marketingu je hľadanie homogénnych skupín spotrebiteľov, ktorí majú podobné preferencie a podobne reagujú na marketingové ponuky.

Pre úspešnú implementáciu princípov segmentácie sú splnené nasledovné podmienky:

– schopnosť podniku (organizácie) diferencovať marketingovú štruktúru (ceny, spôsoby podpory predaja, miesto predaja, produkty);

– vybraný segment musí byť dostatočne stabilný, priestranný a má perspektívu rastu;

– podnik musí mať údaje o vybranom segmente, merať jeho charakteristiky a požiadavky;

– vybraný segment musí byť dostupný pre podnik, t. j. mať vhodné predajné a distribučné kanály, systém dodávky produktov;

– podnik musí byť v kontakte so segmentom (napríklad prostredníctvom osobných a masových komunikačných kanálov);

– posúdiť ochranu vybraného segmentu pred konkurenciou, určiť silné a slabé stránky konkurentov a ich vlastné výhody v konkurencii.

Výrobca sa teda môže rozhodnúť o výbere segmentu až po dostatočnom preštudovaní vybraného segmentu a posúdení jeho vlastného potenciálu.

Data mining je multidisciplinárna oblasť, ktorá vznikla a rozvíja sa na základe vied ako aplikovaná štatistika, rozpoznávanie vzorov, umelá inteligencia, teória databáz atď.

Data Mining je proces podpory rozhodovania založený na hľadaní skrytých vzorcov v údajoch.

Data mining je proces objavovania v surových dátach predtým neznámych, netriviálnych, prakticky užitočných a interpretovateľných poznatkov potrebných pre rozhodovanie v rôznych oblastiach ľudskej činnosti.

Zhluková analýza sa používa v rôznych oblastiach. Je to užitočné, keď potrebujete klasifikovať veľké množstvo informácií.

V marketingu by to mohla byť úloha segmentovať konkurentov a spotrebiteľov. V marketingovom výskume sa klastrová analýza používa pomerne široko - ako v teoretickom výskume, tak aj u praktických obchodníkov, ktorí riešia problémy zoskupovania rôznych objektov. Zároveň sú vyriešené otázky o skupinách zákazníkov, produktoch atď. Jednou z najdôležitejších úloh pri aplikácii klastrovej analýzy v marketingovom výskume je teda analýza spotrebiteľského správania, a to: zoskupenie spotrebiteľov do homogénnych tried na získanie. najúplnejší obraz o správaní zákazníkov z každej skupiny a faktoroch ovplyvňujúcich jej správanie.

Dôležitou úlohou, ktorú môže klastrová analýza vyriešiť, je positioning, t.j. určenie výklenku, v ktorom by sa mal nový produkt ponúkaný na trhu umiestniť. Výsledkom aplikácie zhlukovej analýzy je zostavenie mapy, z ktorej je možné určiť úroveň konkurencie v rôznych segmentoch trhu a zodpovedajúce vlastnosti produktu pre možnosť vstupu do tohto segmentu. Analýzou takejto mapy je možné identifikovať nové, neobsadené medzery na trhu, na ktorých možno ponúkať existujúce produkty alebo vyvíjať nové.

Data Mining je široko používaný v oblasti marketingu.

Základné marketingové otázky „Čo sa predáva?“, „Ako sa to predáva?“, „Kto je spotrebiteľ?“ Prednáška o problémoch klasifikácie a klastrovania podrobne popisuje využitie zhlukovej analýzy na riešenie marketingových problémov, ako je segmentácia spotrebiteľov.

Ďalším bežným súborom metód riešenia marketingových problémov sú metódy a algoritmy na vyhľadávanie asociačných pravidiel. Úspešne sa tu využíva aj hľadanie časových vzorcov.

V maloobchode, rovnako ako v marketingu, sa používajú:

– algoritmy na vyhľadávanie asociačných pravidiel (na určenie často sa vyskytujúcich skupín tovarov, ktoré kupujúci nakupujú súčasne). Identifikácia takýchto pravidiel pomáha umiestňovať tovar do regálov obchodov, rozvíjať stratégie nákupu tovaru a jeho umiestňovania do skladov atď.

– využitie časových sledov napríklad na určenie požadovaných objemov tovaru v sklade.

– metódy klasifikácie a zoskupovania na identifikáciu skupín alebo kategórií zákazníkov, ktorých znalosť prispieva k úspešnej propagácii tovaru.

Literatúra

  1. Alekseev A. A. „Metodológia segmentácie spotrebiteľov“, // „Marketingový a marketingový výskum v Rusku“, č. 1, 2009.
  2. Basovsky L. E. “Marketing”, Moskva, INFRA M, 2009, – 426 s.
  3. Goltsov A. V. "Vyhliadky na využitie strategického marketingu v podniku." // „Marketing“, 2008, č. 2., s. 72-89.
  4. Croft M. D. "Segmentácia trhu." Petrohrad, „Peter“, 2008 – 128 s.
  5. Reznichenko B. A. „Kritická analýza kritérií segmentácie“, „Marketing v Rusku a zahraničí“, č. 3, 2009.

Segmentačné metódy

Je možné identifikovať niektoré „základné“ metódy segmentácie. Najdôležitejšou z nich je spotrebiteľská zhluková analýza (taxonómia). Spotrebiteľské klastre sa vytvárajú zoskupením tých, ktorí dávajú podobné odpovede na položené otázky. Kupujúci môžu byť zoskupení do klastra, ak majú podobný vek, príjem, zvyky atď. Podobnosť medzi kupujúcimi je založená na rôznych mierach, ale často sa ako miera podobnosti používa vážený štvorec rozdielov medzi odpoveďami kupujúcich na otázku. Výstupom klastrovacích algoritmov môžu byť hierarchické stromy alebo zoskupovanie spotrebiteľov do skupín. Existuje pomerne veľké množstvo klastrových algoritmov.

Napríklad v USA je rozšírená zhluková analýza systémov s názvom PRIZM , ktorá začína klastrovaním znížením súboru 1000 možných sociodemografických ukazovateľov. Tento systém tvorí socio-demografické segmenty pre celé územie USA. Takto bol identifikovaný klaster 28 – rodiny, ktoré spadajú do tohto klastra, zahŕňajú jednotlivcov s najúspešnejšou profesionálnou alebo manažérskou kariérou. Tento zhluk odráža aj vysoký príjem, vzdelanie, majetok a približne stredný vek. Hoci tento klaster predstavuje iba 7 % populácie USA, je rozhodujúci pre podnikateľov predávajúcich tovar vysokej hodnoty.


Existujú aj ďalšie príklady segmentácie spotrebiteľov na základe zhlukovej analýzy. Napríklad medzi „psychologickými“ sektormi má veľmi dôležité miesto „postoj spotrebiteľa k novosti produktu“ (obr. 3).

Obrázok 3

Ako vyplýva z vyššie uvedených údajov, najväčší počet spotrebiteľov tvoria bežní kupujúci.

Segmentácia spotrebiteľov založená na zhlukovej analýze je „klasická“ metóda. Zároveň existujú metódy segmentácie trhu založené na takzvanej „segmentácii produktov“ alebo segmentácii trhu podľa parametrov produktu. Je to dôležité najmä pri uvádzaní a marketingu nových produktov. Osobitný význam má segmentácia produktov založená na štúdiu dlhodobých trhových trendov. Proces vývoja a výroby nového produktu a dokončenie veľkých investičných programov si vyžaduje pomerne dlhé obdobie a tu je obzvlášť dôležitá správnosť výsledkov analýzy trhu a hodnotenia jeho kapacity. V podmienkach fungovania na tradičnom trhu štandardných výrobkov je možné vykonať výpočet jeho kapacity pomocou metódy súčtu trhu. V moderných podmienkach na zvýšenie svojej konkurencieschopnosti a správne určenie trhovej kapacity už nestačí, aby podnik vykonával segmentáciu trhu iba jedným smerom - definovaním skupín spotrebiteľov podľa určitých kritérií. V rámci integrovaného marketingu je potrebné segmentovať aj samotný produkt podľa najdôležitejších parametrov pre jeho presadenie sa na trhu. Na tento účel sa používa spôsob zostavovania funkčné mapy- vykonávanie druhu dvojitej segmentácie podľa produktu a spotrebiteľa.

Funkčné mapy môžu byť jednofaktorové (segmentácia sa vykonáva podľa jedného faktora a pre homogénnu skupinu produktov) a viacfaktorové (analýza, pre ktoré skupiny spotrebiteľov je konkrétny model produktu určený a ktoré z jeho parametrov sú najdôležitejšie propagácia produktov na trhu) Pomocou zostavenia funkčných máp možno určiť, pre ktorý segment trhu je daný produkt určený, aké funkčné parametre zodpovedajú určitým potrebám spotrebiteľa.

Pri vývoji nových produktov táto metodika predpokladá zohľadnenie všetkých faktorov odrážajúcich systém spotrebiteľských preferencií a zároveň technické parametre nového produktu, pomocou ktorých je možné uspokojiť potreby spotrebiteľov; sú identifikované skupiny spotrebiteľov, z ktorých každá má svoj vlastný súbor požiadaviek a preferencií; všetky vybrané faktory sú zoradené podľa dôležitosti pre každú skupinu spotrebiteľov.

Tento prístup vám umožňuje vidieť už vo fáze vývoja, ktoré parametre produktu si vyžadujú konštrukčné vylepšenia, alebo zistiť, či pre tento model existuje dostatočne veľký trh.

Uveďme príklad takejto analýzy trhu v súvislosti s pripravovaným počítačovým projektom Apple (tabuľka 1) (pozri nasledujúcu stranu)

Stôl 1." Segmentácia trhu s osobnými počítačmi a faktory, ktoré sa berú do úvahy pri vývoji produktov preň (1982) "

Faktory Trhové segmenty podľa skupín spotrebiteľov Model
Doma V škole Na univerzite Do domu. kancelária V malom podnikaní V korporácii A IN
Technické špecifikácie * * *** ** ** ** *** **
cena *** *** ** *** *** ** 0 **
Špeciálne vlastnosti * * ** * * * ** *
Spoľahlivosť ** * * ** ** * 0 **
Pohodlné použitie ** ** * ** * 0 *** ***
Kompatibilita 0 0 0 0 0 *** 0 0
Periférne zariadenia 0 0 0 0 0 *** 0 0
softvér * * ** ** ** *** * **

*** je veľmi dôležitý faktor

** - dôležitý faktor

* - nepodstatný faktor

0 - nevýznamný faktor

Táto jednoduchá analýza ukazuje, že model A je počítač bez trhu a model B je najvhodnejší produkt pre univerzity a malé podniky.

Spoločnosť raz vsadila na počítač A a prehrala.

Vo svetovej praxi sa vo všeobecnosti používajú 2 základné prístupy k segmentácii marketingu - (pozri: všeobecná schéma segmentovej analýzy (obr. 4)) (nasledujúca strana)



V rámci prvej metódy. označované ako „a priory“, charakteristiky segmentácie, počet segmentov, ich počet, charakteristiky a mapa záujmov sú už predtým známe. To znamená, že sa predpokladá, že skupiny segmentov v tejto metóde už boli vytvorené. Metóda „a priori“ sa používa v prípadoch, keď segmentácia nie je súčasťou aktuálneho výskumu, ale slúži ako pomocný základ pre riešenie iných marketingových problémov. Niekedy sa táto metóda používa, keď sú segmenty trhu veľmi jasne definované, keď variabilita segmentov trhu nie je vysoká. „A priory“ je prijateľné aj pri vytváraní nového produktu zameraného na známy segment trhu.

V rámci druhej metódy, nazvanej „post hoc (založená na klastroch), je implikovaná neistota charakteristík segmentácie a podstaty samotných segmentov Výskumník najskôr vyberie množstvo premenných, ktoré sú vo vzťahu k respondentovi interaktívne (metóda zahŕňa uskutočnenie prieskumu) a potom v závislosti od vyjadreného postoja k určitej skupine premenných patria respondenti do zodpovedajúceho segmentu. V tomto prípade sa mapa záujmov identifikovaná v procese následnej analýzy považuje za sekundárnu používa sa pri segmentácii spotrebiteľských trhov, ktorých segmentová štruktúra nie je definovaná vo vzťahu k predávanému produktu.

Segmentácia podľa " priorstvo "

Pri výbere počtu segmentov, na ktoré sa má trh rozdeliť, sa zvyčajne riadia cieľovou funkciou – identifikáciou najperspektívnejšieho segmentu. Je zrejmé, že pri vytváraní vzorky nie je potrebné zahrnúť segmenty, ktorých nákupný potenciál je v porovnaní so skúmaným produktom dosť malý. Počet segmentov, ako ukazujú štúdie, by nemal presiahnuť 10; prebytok je zvyčajne spojený s nadmernou podrobnosťou prvkov segmentácie a vedie k zbytočnému „rozmazaniu“ prvkov.

Napríklad pri segmentácii podľa úrovne príjmu sa odporúča rozdeliť všetkých potenciálnych kupujúcich do segmentov s rovnakým objemom, pričom treba vziať do úvahy, že objem každého segmentu nie je aspoň menší ako odhadovaný objem predaja služieb na základe znalosti výrobná kapacita podniku. Najúspešnejším príkladom, ktorý vysvetľuje vyššie uvedené a demonštruje možnosť rozdelenia potenciálnych spotrebiteľov do stabilných segmentových skupín, môže byť segmentácia populácie na základe príjmu, kedy je celá populácia rozdelená do piatich 20 % skupín. Prezentované rozdelenie príjmov podľa piatich 20 % skupín obyvateľstva je pravidelne prezentované v štatistických zbierkach a správach, podobne ako v tabuľke. 2

tabuľka 2 ."Rozdelenie príjmov podľa skupín obyvateľstva. %"

Pohodlie práce s takýmito skupinami segmentov je zrejmé, najmä z hľadiska sledovania ich kapacity.