Методи за сегментиране на пазара. Методи за сегментиране на пазара Метод на сегментиране на клъстери

Работя в индустрията за имейл маркетинг за сайт, наречен MailChimp.com. Ние помагаме на клиентите да създават бюлетини за тяхната рекламна аудитория. Всеки път, когато някой нарече работата ни „пълнеж по пощата“, усещам неприятен студ в сърцето си.

Защо? Да, защото имейл адресите вече не са черни кутии, които бомбардирате със съобщения като гранати. Не, в имейл маркетинга (както и в други форми на онлайн контакт, включително туитове, публикации във Facebook и кампании в Pinterest), фирмите получават представа за това как аудиторията се ангажира на индивидуално ниво чрез проследяване на кликвания, онлайн поръчки, разпространение на статуси в социалните мрежи, и т.н. Тези данни не са просто намеса. Те характеризират вашата аудитория. Но за непосветените тези операции са подобни на мъдростта на гръцкия език. Или есперанто.

Как събирате транзакционни данни от вашите клиенти (потребители, абонати и т.н.) и как използвате техните данни, за да разберете по-добре вашата аудитория? Когато имате работа с много хора, е трудно да изучавате всеки клиент поотделно, особено ако всички контактуват с вас по различен начин. Дори ако на теория можете да достигнете лично до всеки, на практика това е малко вероятно да бъде осъществимо.

Трябва да вземете вашата клиентска база и да намерите средата между произволното бомбардиране и персонализирания маркетинг за всеки отделен клиент. Един от начините за постигане на този баланс е чрез използване на групиране за сегментиране на вашия клиентски пазар, така че да можете да се харесате на различни сегменти от вашата клиентска база с различно целево съдържание, оферти и т.н.

Клъстерният анализ е събирането на различни обекти и разделянето им на групи от подобни. Като работите с тези групи - идентифицирайки какво общо имат техните членове и какво ги отличава - можете да научите много за бъркотията от данни, които имате. Това знание ще ви помогне да вземате по-добри решения и то на по-подробно ниво от преди.

В този контекст клъстерирането се нарича проучвателно извличане на данни, тъй като тези техники помагат да се „извлече“ информация за връзки в огромни набори от данни, които не могат да бъдат уловени визуално. А откриването на връзки в социални групи е полезно във всяка индустрия - за препоръчване на филми въз основа на навиците на целевата аудитория, за идентифициране на престъпни центрове в даден град или за оправдаване на финансови инвестиции.

Едно от любимите ми приложения на групирането е групирането на изображения: събиране на файлове с изображения, които „изглеждат еднакви“ на компютъра. Например в услугите за хостинг на изображения като Flickr потребителите създават много съдържание и простата навигация става невъзможна поради големия брой снимки. Но използвайки техники за групиране, можете да групирате подобни изображения заедно, позволявайки на потребителя да навигира между тези групи преди детайлно сортиране.

Контролирано или неконтролирано машинно обучение?

При извличането на данни, по дефиниция, вие не знаете предварително какъв вид данни търсите. Вие сте изследовател. Можете ясно да обясните кога двама клиента си приличат и кога различно, но не знаете кой е най-добрият начин да сегментирате клиентската си база. Ето защо „да поискате“ компютър да сегментира вашата клиентска база вместо вас се нарича машинно обучение без надзор, защото вие не контролирате – не казвате на компютъра как да си върши работата.

За разлика от този процес има контролирано машинно обучение, което има тенденция да се появява, когато изкуственият интелект излезе на първа страница. Ако знам, че искам да разделя клиентите на две групи - да речем, "вероятно да купят" и "малко вероятно да купят" - и да заредя компютъра с исторически примери за такива клиенти, прилагайки всички иновации към една от тези групи, тогава това е контрол.

Ако вместо това кажа: „Ето какво знам за моите клиенти и ето как да разбера дали са различни или еднакви. Кажи ми нещо интересно, това е липса на контрол.

Тази глава разглежда най-простия метод за клъстериране, наречен k-средни, който датира от 50-те години и оттогава се е превърнал в основен елемент в откриването на знания от бази данни (DKD) във всички индустрии и правителствени агенции.

Методът на k-средните не е най-математически точният от всички методи. Създаден е предимно от съображения за практичност и здрав разум - като афро-американска кухня. Няма толкова шикозно родословие като френското, но често угажда на нашите гастрономически капризи. Клъстерният анализ с k-средни стойности, както скоро ще видите, е отчасти математика и отчасти история (за минали събития на компания, ако това сравнение се отнася за методите за обучение по управление). Безспорното му предимство е неговата интуитивна простота.

Нека видим как работи този метод, използвайки прост пример.

Момичета танцуват с момичета, момчета се почесват по главите

Целта на групирането на k-средства е да изберете няколко точки в пространството и да ги превърнете в k групи (където k е всяко число, което изберете). Всяка група се определя от точка в центъра, като знаме, забито в луната и сигнализиращо: „Хей, ето го центърът на моята група! Присъединете се, ако сте по-близо до това знаме от останалите!“ Този център на групата (официално наречен центроид на клъстер) е средната стойност на името на метода на k-средните стойности.

Да вземем за пример училищните танци. Ако сте успели да изтриете от паметта си ужаса на това „забавление“, много съжалявам, че ви връщам толкова болезнени спомени.

Героите на нашия пример - ученици от гимназия Макакне, които дойдоха на танцова вечер под романтичното име „Бал на дъното на морето“ - са разпръснати из залата за събрания, както е показано на фиг. 1. Дори боядисах паркета във фотошоп, за да си представя по-лесно ситуацията.

Ориз. 1.Ученици от гимназия Макакне седят в заседателната зала

Ето примери за песни, на които тези млади лидери на свободния свят ще танцуват несръчно (ако внезапно искате музикален съпровод, например в Spotify):

Стикс: Ела, отплувай
Всичко освен момичето: липсва
Асо на основата: Всичко, което тя иска
Soft Cell: Опетнена любов
Монтел Джордан: Ето как го правим
Айфел 65: Син

Сега k-означава клъстерирането зависи от броя на клъстерите, на които искате да разделите присъстващите. Нека започнем с три клъстера (ще разгледаме избора на k по-късно в тази глава). Алгоритъмът поставя три знамена на пода на заседателната зала по някакъв приемлив начин, както е показано на фиг. 2, където виждате 3 начални знамена, разпределени по пол и маркирани с черни кръгове.

Ориз. 2.Поставяне на начални клъстерни центрове

При k-означава клъстериране, танцьорите се назначават към най-близкия център на клъстера, така че да може да се начертае демаркационна линия между всеки два центъра на пода. Така, ако танцьорът е от едната страна на линията, той принадлежи към една група, ако е от другата страна, тогава към друга (както на фиг. 3).

Ориз. 3.Линиите маркират границите на клъстера

Използвайки тези демаркационни линии, разделете танцьорите на групи и ги оцветете съответно, както на фиг. 4. Тази диаграма, която разделя пространството на полигони, дефинирани от близостта до определен център на клъстера, се нарича диаграма на Вороной.

Ориз. 4.Групиране в клъстери, маркирани с различни фонови модели в диаграма на Вороной

Нека да разгледаме първоначалното ни разделение. Нещо не е наред, нали? Пространството е разделено по доста странен начин: долната лява група остава празна, а на границата на горната дясна група, напротив, има много хора.

Алгоритъмът за групиране на k-средни премества центровете на клъстерите между половете, докато достигне най-добрия резултат.

Как да определим „най-добрия резултат“? Всеки присъстващ човек е на известно разстояние от своя клъстерен център. Колкото по-малко е средното разстояние от участниците до центъра на тяхната група, толкова по-добър е резултатът.

Сега въвеждаме думата „минимизиране“ - тя ще ви бъде много полезна при оптимизиране на модела за най-добро местоположение на клъстерни центрове. В тази глава ще накарате Find a Solution да премества центровете на клъстерите безброй пъти. Начинът, по който Solution Finder намира най-доброто местоположение за клъстерни центрове, е бавно итеративно да ги премества по повърхността, като взема най-добрите намерени резултати и ги комбинира (буквално ги чифтосва като състезателни коне), за да намери най-доброто местоположение.

Така че, ако диаграмата на фиг. 4 изглежда доста бледо, „Търсене на решение“ може внезапно да подреди центровете, както на фиг. 5. Това леко ще намали средното разстояние между всеки танцьор и неговия център.

Ориз. 5.Леко изместете центровете

Очевидно рано или късно Solution Finder ще разбере, че центровете трябва да бъдат поставени в средата на всяка група танцьори, както е показано на фиг. 6.

Ориз. 6.Оптимално групиране на училищни танци

Страхотен! Ето как изглежда идеалното групиране. Клъстерните центрове са разположени в центъра на всяка група танцьори, свеждайки до минимум средното разстояние между танцьор и най-близкия център. Сега, когато клъстерирането е завършено, е време да преминем към забавната част, която се опитва да разбере какво означават тези клъстери.

Ако знаете цвета на косите на танцьорите, политическите им предпочитания или времето им в бягането на 100 метра, тогава групирането няма много смисъл.

Но след като решите да определите възрастта и пола на присъстващите, ще започнете да виждате някои общи тенденции. Малката група по-долу са възрастни хора, най-вероятно придружаващи хора. Групата отляво е изцяло от момчета, а групата отдясно е от момичета. И всички много се страхуват да танцуват един с друг.

По този начин k-средните ви позволяват да разделите много танцуващи на групи и да свържете характеристиките на всеки присъстващ с членството в конкретен клъстер, за да разберете причината за разделението.

Сега сигурно си казвате: „Хайде, какви глупости. Вече знаех отговора преди да започна.” Прав си. В този пример – да. Нарочно дадох такъв пример с „играчка“, като бях сигурен, че можете да го решите само като гледате точките. Действието се развива в двуизмерно пространство, в което клъстерирането става просто с помощта на очите.

Но какво ще стане, ако управлявате магазин, който продава хиляди продукти? Някои купувачи са направили една или две покупки през последните две години. Други - десетки. И всеки купуваше нещо свое.

Как ги групирате на такъв „дансинг“? Нека започнем с факта, че този дансинг не е двуизмерен или дори триизмерен. Това е хилядоизмерно пространство за продажба на стоки, в което купувачът е закупил или не е закупил стоките във всяко измерение. Можете да видите колко бързо проблемът с групирането започва да надхвърля възможностите на „първокласна очна ябълка“, както обичат да казват моите военни приятели.

Реален живот: K-означава групиране в имейл маркетинга

Нека да преминем към по-конкретен случай. Аз съм специалист по имейл маркетинг, така че ще ви дам пример от Mailchimp.com, където работя. Същият този пример ще работи върху данни от търговия на дребно, преобразуване на рекламен трафик, социални медии и т.н. Той взаимодейства с почти всякакъв тип данни, свързани с достигане до клиенти с рекламни материали, след което те избират безусловно вас.

Винена империя на едро Joey Bag O'Donuts

Представете си за момент, че живеете в Ню Джърси, където управлявате Joey Bag O'Donuts Wholesale Wine Empire. Това е бизнес за внос и износ, чиято цел е да доставя големи количества вино от чужбина и да го продава на определени магазини за алкохол в цялата страна. Начинът, по който работи този бизнес, е, че Джоуи пътува по целия свят, търсейки невероятни сделки за много вино, и от вас зависи да го поставите в магазините и да спечелите.

Вие намирате клиенти по много начини: страница във Facebook, акаунт в Twitter, понякога дори директна поща - в края на краищата имейлите „насърчават“ повечето видове бизнес. Миналата година изпратихте по един имейл на месец. Обикновено всяко писмо описва две или три транзакции, да речем една за шампанско и друга за малбек. Някои сделки са невероятни - 80% отстъпка или повече. В резултат на това сте сключили около 32 сделки за една година и всички те са преминали повече или по-малко гладко.

Но това, че нещата вървят добре, не означава, че не могат да се подобрят. Би било полезно да разберете мотивите на вашите клиенти малко по-дълбоко. Разбира се, гледайки конкретна поръчка, виждате, че определен Адамс е купил пенливо вино през юли с 50% отстъпка, но не можете да определите какво го е подтикнало да купи. Дали му хареса минималното количество за поръчка от една кутия с шест бутилки или цената, която все още не беше достигнала максимума си?

Би било хубаво да можете да разделите списъка си с клиенти на групи по интереси. След това можете да редактирате писма до всяка група поотделно и може би да популяризирате бизнеса си още повече. Всяка подходяща за тази група сделка може да стане тема на писмото и да се появи в първия абзац на текста. Този тип целенасочена поща може да предизвика истинска експлозия в продажбите!

Има опция да оставите компютъра да свърши работата вместо вас. Използвайки k-означава групиране, можете да намерите най-доброто групиране и след това да се опитате да разберете защо е най-доброто.

Оригинален набор от данни

Документът на Excel, който ще анализираме в тази глава, се намира на уебсайта на книгата. Той съдържа всички изходни данни, в случай че искате да работите с тях. Или можете просто да следвате текста, като гледате останалите листове на документа.

Като начало имате два интересни източника на данни:

метаданните за всяка поръчка се съхраняват в електронна таблица, включително сорт, минимално количество вино за поръчка, отстъпка на дребно, дали горната граница на цената е премината и страна на произход. Тези данни се намират в раздел, наречен OfferInformation, както е показано на фиг. 7;
Знаейки кои клиенти какво поръчват, можете да извлечете тази информация от MailChimp и да я подадете в електронна таблица с метаданни за офертата в раздела Транзакции. Това са променливи данни, представени, както е показано на фиг. 8, много просто: купувачът и неговата поръчка.

Ориз. 7.Подробности за последните 32 поръчки

Ориз. 8.Списък на поръчките по клиент

Определяне на предмета на измерване

И тук е предизвикателството. В проблема с училищния танц измерването на разстоянието между присъстващите и идентифицирането на клъстерните центрове беше лесно, нали? Просто трябва да намерите правилната ролетка! Но какво да правим сега?

Знаете, че миналата година имаше 32 предложения за сделки и имате списък от 324 поръчки в отделен раздел, разбит по купувач. Но за да измерите разстоянието от всеки купувач до центъра на клъстера, трябва да ги поставите в това пространство от 32 сделки. С други думи, трябва да разберете какви сделки не са изпълнили и да създадете матрица сделка по клиент, в която всеки клиент получава своя собствена колона с 32 клетки за сделки, попълнени с единици, ако сделките са били извършени, и нули, ако не са 'T.

С други думи, трябва да вземете тази редово-ориентирана таблица със сделки и да я превърнете в матрица, с клиенти, подредени вертикално и оферти хоризонтално. Най-добрият начин да го създадете е с осеви таблици.

Алгоритъм на действие: на листа с променливи данни изберете колони A и B и след това поставете обобщена таблица. С помощта на съветника за обобщена таблица просто изберете Сделки като заглавка на реда и Клиенти като заглавка на колона и попълнете таблицата. Клетката ще бъде 1, ако двойката клиент-сделка съществува, и 0, ако не съществува (в този случай 0 се показва като празна клетка). Резултатът е таблицата, показана на фиг. 9.

Ориз. 9.Обобщена таблица за сделки с клиенти

След като вече имате информацията за вашата поръчка в матричен формат, копирайте листа с информация за офертата и го наименувайте Matrix. В този нов работен лист поставете стойностите от обобщената таблица (няма нужда да копирате и поставяте номера на сделката, защото вече е в информацията за поръчката), като започнете с колона H. Трябва да завършите с разширена версия на матрицата, пълна с информация за поръчката, както е показано на фиг. 10.

Ориз. 10.Описанията на транзакциите и данните за поръчките са обединени в една матрица

Стандартизация на данните

Тази глава представя всяко измерение на вашите данни по същия начин като информация за двоичен ред. Но в много ситуации, включващи групиране, не можем да направим това. Представете си сценарий, в който хората са групирани по височина, тегло и заплата. И трите вида данни имат различни измерения. Височината може да варира от 1,5 до 2 метра, докато теглото може да варира от 50 до 150 кг.

В този контекст измерването на разстоянието между клиентите (като между танцьори в зала) става объркващо. Следователно е обичайно да се стандартизира всяка колона от данни чрез изваждане на средната стойност и след това разделяне на свой ред на мярка за дисперсия, наречена стандартно отклонение. По този начин всички колони се свеждат до една стойност, варираща количествено около 0.

Да започнем с четири клъстера

Е, сега всичките ви данни са сведени до един удобен формат. За да започнете клъстерирането, трябва да изберете k - броят на клъстерите в алгоритъма за k-средни стойности. Често срещан начин за използване на k-средни е да вземете набор от различни k и да ги тествате един по един (ще обясня как да ги изберете по-късно), но тепърва започваме - така че ще изберем само един .

Ще ви трябват няколко клъстера, които са приблизително подходящи за това, което искате да правите. Очевидно не възнамерявате да създадете 50 клъстера и да изпратите 50 насочени промоционални имейла до няколко момчета от всяка група. Това незабавно проваля целта на нашето упражнение. В нашия случай имаме нужда от нещо малко. Започнете този пример с 4 - в един идеален свят вероятно бихте разделили списъка си с клиенти на 4 ясни групи от по 25 души всяка (което е малко вероятно в действителност).

И така, ако трябва да разделите купувачите на 4 групи, какъв е най-добрият начин да ги изберете?

Вместо да разваляте хубавия матричен лист, копирайте данните в нов лист и го наречете 4MC. Сега можете да вмъкнете 4 колони след най-високата цена в колони H до K, които ще бъдат центровете на клъстерите. (За да вмъкнете колона, щракнете с десния бутон върху колона H и изберете Вмъкване. Колоната ще се появи отляво.) Наименувайте тези клъстери Клъстер 1 до Клъстер 4. Можете също така да приложите условно форматиране върху тях и всеки път, когато ги инсталирате, можете да видите колко различни са те.

Листът 4MC ще се появи, както е показано на фиг. единадесет.

Ориз. единадесет.Празни центрове на клъстери, поставени върху лист 4MC

В този случай всички центрове на клъстери са нули. Но технически те могат да бъдат всякакви и, което особено ще ви хареса - като на училищни танци, те са разпределени по такъв начин, че да минимизират разстоянието между всеки купувач и неговия център на клъстера.

Очевидно тогава тези центрове ще имат стойности от 0 до 1 за всяка транзакция, тъй като всички клиентски вектори са двоични.

Но какво означава „измерване на разстоянието между центъра на клъстера и клиента“?

Евклидово разстояние: директно измерване на разстояния

Имате отделна колона за всеки клиент. Как да измерим разстоянието между тях? В геометрията това се нарича "най-краткият път", а полученото разстояние се нарича евклидово разстояние.

Нека се върнем за момент в залата за събрания и се опитаме да разберем как да решим проблема си там.

Нека поставим координатните оси на пода и на фиг. 12 ще видим, че в точка (8,2) имаме танцьор, а в (4,4) имаме център на клъстера. За да изчислите евклидовото разстояние между тях, ще трябва да запомните Питагоровата теорема, с която сте запознати от училище.

Ориз. 12.Танцьор на (8,2) и център на клъстера на (4,4)

Тези две точки са на 8 - 4 = 4 метра една от друга вертикално и 4 - 2 = 2 метра хоризонтално. Според Питагоровата теорема квадратът на разстоянието между две точки е 4A2+2A2 = 20 метра. От тук изчисляваме самото разстояние, което ще бъде равно на корен квадратен от 20, което е приблизително 4,47 m (както на фиг. 13).

Ориз. 13.Евклидовото разстояние е равно на корен квадратен от сбора на разстоянията във всяка посока

В контекста на абонатите за бюлетин имате повече от две измерения, но се прилага същата концепция. Разстоянието между купувача и центъра на клъстера се изчислява, като се вземат разликите между двете точки за всяка сделка, повдигат се на квадрат, добавят се и се изважда корен квадратен. Например на работен лист 4MS искате да знаете евклидовото разстояние между центъра на клъстер 1 в колона H и поръчките на клиента Adams в колона L.

В клетка L34, под поръчките на Адамс, можете да изчислите разликата между вектора на Адамс и центъра на клъстера, да го повдигнете на квадрат, да го добавите и след това да го изкорените, като използвате следната формула за масиви (обърнете внимание на абсолютните връзки, което ви позволява да плъзнете това формула надясно или надолу, без да променяте връзката към центъра на клъстера):

(=КОРЕН(СУМА(L$2:L$33-$H$2:$H$33)A2)))

Формулата на масива (напишете формулата и натиснете Ctrl+Shift+Enter или Cmd+Return на MacOS, както е посочено в глава 1) трябва да се използва, защото (L2:L33-H2:H33)^2 частта от нея трябва да " know", къде се свържете, за да изчислите разликите и да ги повдигнете на квадрат стъпка по стъпка. Въпреки това, резултатът в крайна сметка е едно число, в нашия случай 1,732 (както на фиг. 14). Има следното значение: Адамс направи три сделки, но тъй като първоначалните центрове на клъстера са нула, отговорът ще бъде равен на корен квадратен от 3, а именно 1,732.

Ориз. 14.Разстояние между център на клъстер 1 и Адамс

В електронната таблица на фиг. 2-14, закотвих горния ред (вижте Глава 1) между колони G и H и нарекох ред 34 в клетка G34 „Разстояние до клъстер 1“, само за да мога да видя какво къде е, докато превъртах надолу по страницата.

Разстояния и членство в клъстери за всички!

Сега знаете как да изчислите разстоянието между вектора на поръчката и центъра на клъстера.

Сега е време да добавите изчисляване на Адамс на разстояния до останалите центрове на клъстери, като плъзнете клетка L34 надолу до L37 и след това ръчно промените препратката към центъра на клъстера от колона H на колона I, J и K в клетките по-долу. Резултатът трябва да бъде следните 4 формули в L34:L37:

(=SQRT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=SQRT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2)))
(=КОРЕН(СУМА((L$2:L$33-$H$2:$H$33)A2)))
(=КОРЕН(СУМА((L$2:L$33-$I$2:$I$33)A2)))
(=КОРЕН(СУМА((L$2:L$33-$J$2:$J$33)A2)))
(=КОРЕН(СУМА((L$2:L$33-$K$2:$K$33)A2)))

Тъй като сте използвали абсолютни връзки за клъстерните центрове (това означава знакът $ във формулите, както е обяснено в Глава 1), можете да плъзнете L34:L37 в DG34:DG37, за да изчислите разстоянието от всеки клиент до четирите клъстерни центъра. Озаглавете редовете в колона G в клетки от 35 до 37 „Разстояние до клъстер 2“ и т.н. Новоизчислените разстояния са показани на фиг. 15.

Ориз. 15.Изчисляване на разстояния от всеки купувач до всички клъстерни центрове

Сега знаете разстоянието на всеки клиент до четирите клъстерни центъра. Разпределението им в клъстери беше извършено според най-късото разстояние в две стъпки, както следва.

Първо, нека се върнем към Адамс в колона L и изчислим минималното разстояние до центъра на клъстера в клетка L38. Просто е:

Мин. (L34:L37)
=мин(L34:L37)

За да изчислим, ние използваме формулата за съответствие/позиция за търсене (повече подробности в Глава 1). Като го поставите в L39, можете да видите номера на клетката от интервала L34:L37 (броя всеки по ред от 1), който е на минималното разстояние:

Match(L38,L34:L37,0) =търсене(L38,L34:L37,0)

В този случай разстоянието е еднакво за всичките четири клъстера, така че формулата избира първия (L34) и връща 1 (Фигура 16).

Ориз. 16.Добавяне на клъстерни обвързвания към листа

Можете също да плъзнете и пуснете тези две формули върху DG38: DG39. За да бъдете по-организирани, добавете заглавията на редове 38 и 39 към клетки 38 и 39 на колона G, „Минимално разстояние на клъстера“ и „Присвоен клъстер“.

Намиране на решения за клъстерни центрове

Вашата електронна таблица е актуализирана с изчисления на разстоянието и свързване към клъстери. Сега, за да установим най-добрата позиция на клъстерните центрове, трябва да намерим онези стойности в колони H до K, които минимизират общото разстояние между купувачите и клъстерните центрове, към които са прикрепени, посочени в ред 39 за всеки купувач.

Когато чуете думата „минимизиране“: етапът на оптимизация започва и оптимизирането се извършва с помощта на „Търсене на решение“.

За да използвате Find a Solution, ще ви трябва клетка с резултати, така че в A36 ще обобщим всички разстояния между клиентите и техните клъстерни центрове:

SUM(L38:DG38)
=CUMMA(L3 8:DG3 8)

Тази сума от разстоянията от клиентите до техните най-близки клъстерни центрове е точно обективната функция, която срещнахме по-рано по време на клъстерирането на аудиторията на гимназия Macakne. Но евклидовото разстояние, със своите степени и квадратни корени, е чудовищно нелинейна функция, така че ще трябва да използвате алгоритъм за еволюционно решение вместо симплексния метод.

Вече сте използвали този метод в Глава 1. Симплексният алгоритъм, ако е възможно да се използва, работи по-бързо от другите, но не може да се използва за изчисляване на корени, квадрати и други нелинейни функции. OpenSolver, който използва симплекс алгоритъм, дори и да изглежда, че е на стероиди, е също толкова безполезен.

В нашия случай еволюционният алгоритъм, вграден в Solution Finder, използва комбинация от произволно търсене и отлично решение за кръстосване, за да намери ефективни решения, подобно на еволюцията в биологичен контекст.

Имате всичко необходимо, за да поставите проблема преди „Търсене на решение“:

цел: минимизиране на общите разстояния от клиентите до техните клъстерни центрове (A36);
променливи: вектор на всяка транзакция спрямо центъра на клъстера (H2:K33);
условия: клъстерните центрове трябва да имат стойности от 0 до 1.

Препоръчително е да имате „Solution Finder” и чук. Поставяме задачата „Търсене на решение“: минимизирайте A36, като промените стойностите на H2: K33 с условието H2: K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

Ориз. 17.Настройки „Търсене на решение“ за 4-центрово клъстериране

Но поставянето на проблем не е всичко. Ще трябва да се поизпотите малко, като изберете необходимите опции за еволюционния алгоритъм, като щракнете върху бутона „Опции“ в прозореца „Търсене на решение“ и отидете до прозореца за настройки. Съветвам ви да зададете максималното време на 30 секунди повече, в зависимост от това колко дълго сте готови да чакате „Solution Finder“ да се справи със задачата си. На фиг. 18 Настроих моята на 600 секунди (10 минути). По този начин мога да стартирам Find a Solution и да отида на обяд. И ако искате да го прекъснете по-рано, просто натиснете Escape и го излезте с най-доброто решение, което успя да намери.

Ориз. 18.Параметри на еволюционния алгоритъм

Щракнете върху Изпълнение и гледайте как Excel върши работата си, докато еволюционният алгоритъм се сближи.

Значението на получените резултати

След като Solver ви даде оптималните клъстерни центрове, забавлението започва. Да преминем към учебните групи! На фиг. На Фигура 19 виждаме, че Solver намери оптималното общо разстояние от 140,7 и всичките четири центъра на клъстера - благодарение на условното форматиране! - изглеждат напълно различни.

Ориз. 19.Четири оптимални клъстерни центъра

Имайте предвид, че вашите клъстерни центрове може да се различават от представените в книгата, тъй като еволюционният алгоритъм използва произволни числа и отговорът е различен всеки път. Клъстерите може да са напълно различни или, по-вероятно, в различен ред (например моят клъстер 1 може да е много близо до вашия клъстер 4 и т.н.).

Тъй като, когато сте създали листа, сте вмъкнали описания на транзакции в колони B до G, сега можете да прочетете подробностите на фиг. 19, което е важно за разбирането на идеята за клъстерни центрове.

За клъстер 1, в колона H, условното форматиране избира сделки 24, 26, 17 и, в по-малка степен, 2. Четейки описанията на тези сделки, можете да разберете какво е общото между тях: всички те са направени на пино ноар.

Като погледнете колона I, ще видите, че всички зелени клетки имат ниски минимални количества. Това са купувачи, които не искат да купуват огромни количества по време на процеса на транзакция.

Но другите два клъстерни центъра, честно казано, са трудни за тълкуване. Вместо да тълкуваме клъстерни центрове, какво ще кажете да проучим самите купувачи в клъстера и да определим какъв вид сделки харесват? Това може да изясни въпроса.

Оценка на транзакциите по метода на клъстера

Вместо да откриваме кои разстояния до кой център на клъстера са по-близо до 1, нека проверим кой към кой клъстер е прикрепен и какви сделки предпочита.

За да направим това, ще започнем с копиране на листа с информация за офертата. Нека наречем копието 4MC - TopDealsByCluster. Номерирайте колоните H до K на този нов лист от 1 до 4 (както на фигура 20).

Ориз. 20.Създаване на таблица за изчисляване на популярността на сделката с помощта на клъстери

На листа 4MC имате обвързванията за клъстери от 1 до 4 в ред 39. Всичко, което трябва да направите, за да преброите сделките по клъстер, е да погледнете имената на колони H до K на листа 4MC - TopDealsByCluster, вижте кой от листа 4MC беше свързан с този клъстер в ред 39 и след това добавете броя на техните транзакции във всеки ред. По този начин ще получим общия брой купувачи в този клъстер, които са направили транзакции.

Нека започнем с клетка H2, която записва броя на купувачите в клъстер 1, които са приели оферта номер 1, а именно януарския малбек. Необходимо е да добавите стойностите на клетките в диапазона L2: DG2 на лист 4MC, но само купувачи от 1 клъстер, което е класически пример за използване на формулата sumif / sumif. Изглежда така:

SUMIF("4MC"!$L$39:$DG$39,"4MC - Топ сделки по клъстер"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

Тази формула работи по следния начин: предоставяте й някои условни стойности, които тя проверява в първата част "4MC"!$L$39:$DG$39,"4MC, след което сравнява с 1 в заглавката на колоната ("4MC - TopDealsByCluster "!H$1 ), а след това за всяко съвпадение добавя тази стойност към ред 2 в третата част на формулата "4MC"!$L2:$DG2.

Забележете, че сте използвали абсолютни препратки ($ във формулата) преди всичко, свързано с асоциирането на клъстера, номера на реда в заглавките на колоните и буквата на колоната за завършени сделки. След като сте направили тези връзки абсолютни, можете да плъзнете формулата навсякъде от H2:K33, за да изчислите броя на сделките за други клъстерни центрове и комбинации от сделки, както е на фиг. 21. За да направите тези колони по-четими, можете също да приложите условно форматиране към тях.

Ориз. 21.Общ брой транзакции за всяка оферта, разделени на клъстери

Като маркирате колони от A до K и приложите автоматично филтриране, можете да сортирате тези данни. Като сортирате колона H от най-малката към най-голямата, можете да видите кои сделки са най-популярни в клъстер 1 (Фигура 22).

Ориз. 22.Клъстерен сорт 1. Пино, пино, пино!

Както споменах по-рано, четирите най-големи сделки за този клъстер са пино. Тези момчета очевидно злоупотребяват с филма Sideways. Ако сортирате клъстер 2, тогава ще ви стане абсолютно ясно, че това са малки купувачи на едро (фиг. 23).

Но когато сортирате клъстер 3, няма да е толкова лесно да разберете нищо. Големите транзакции се броят на пръстите на едната ръка и разликата между тях и останалите не е толкова очевидна. Най-популярните оферти обаче имат нещо общо - доста добри отстъпки, 5 от 6-те най-големи сделки са за пенливо вино, а Франция е производител на продукта за 3 от 4 от тях. Тези предположения обаче са двусмислени.

Що се отнася до Клъстер 4, тези момчета очевидно харесаха августовската сделка за шампанско по някаква причина. Освен това 5 от 6-те най-големи сделки са за френско вино, а 9 от 10-те най-големи сделки са за големи обеми стоки. Може би това е голям клъстер на едро, който гравитира към френските вина? Пресечната точка на клъстери 3 и 4 също е тревожна.

След това разглеждаме сегментирането на студентите по субективни свойства (вижте подраздел 14.1) и по ползи (вижте подраздел 14.4), които предоставя получаването на висше образование в редовно обучение. За сегментиране се използва техника, базирана на клъстерен анализ с използване на многомерно мащабиране за допълнителен, по-пълен анализ.

Променливи за сегментиране– свойства и ползи – трябва да има количествени оценки. Девет параметъра бяха използвани за решаване на конкретен проблем. За да се приложи скалата на Likert, за всеки параметър се формулират съответни твърдения.

1. Това е най-добрият начин да придобиете задълбочени знания.
2. Това е възможност за пълноценно общуване и създаване на приятелства.
3. Това е ценна възможност за взаимодействие с учителя.
4. Това е важна стъпка в началото на кариерата.
5. Студентството е прекрасен период от живота.
6. Материалните разходи на редовното обучение са високи.
7. Времето, необходимо за редовно обучение е високо.
8. Развива мисленето по специалността.
9. Дневното обучение е престижно.

Наборът от параметри, които могат да се използват, може да бъде много по-широк. Студентите в своите въпросници също често посочват следните предимства или недостатъци на редовното обучение в университета: възможността да разширят хоризонтите си, възможността за отлагане, възможността да се научат на самодисциплина и самоорганизация, трудността при комбиниране на обучение и работа, важен период в живота, липса на практика, възможност за получаване на голямо количество информация, влияние за по-нататъшен напредък в работата, възможност в бъдеще да се вземе решение за правилния избор на професия, участие в живота на университет.

Събиране на данни

Събирането на данни се извършва по метода на въпросника. Въпросите са формулирани с помощта на скала на Ликерт (виж раздел 8.3). Например студентите бяха запитани за степента на съгласие или несъгласие с твърдения по петобална скала. Седемстепенната скала е широко използвана в литературата, но често респондентът се затруднява да даде отговори с голям брой градации.

Фрагмент от въпросника изглежда така, както е показано на фиг. 24.2.

Ориз. 24.2.

От респондента се изисква само да постави отметка, а цифровизацията се извършва от въпросника. Използвана е петобална скала с нива от 1 до 5 (1 – абсолютно несъгласен, ..., 5 – напълно съгласен). На въпросника са отговорили 19 респонденти - всички ученици от една група, което, разбира се, не е достатъчно.

24.7. Сегментиране по свойства на примера на образователен продукт 381

Изчисления по метода на клъстерния анализ

Клъстерният анализ (вижте подраздел 23.7) се използва широко при сегментиране по свойства на продукта (вижте подраздел 24.3). Понякога се нарича сегментиране чрез клъстерен анализ йерархичен. На базата на получените оценки се изчисляват разстоянията между оценките на всеки ученик с всеки един. На базата на пакета от научни статистически програми Statistica. Първо се съставя матрица на евклидови разстояния (евклидови разстояния). За формиране на клъстери беше използвана комбинираща (агломеративна) процедура, използваща метода на далечния съсед (пълна връзка). Резултатите са представени под формата на диаграма на фиг. 24.3.

Ориз. 24.3. Дендрограма (DPP) статистика)

Вертикалната ос показва разстоянието между прикрепените клъстери (разстояние на свързване). Учениците са изброени по хоризонталната ос с номера от C_1 до C 19. Както следва от дендрограмата, на първата стъпка има 19 клъстера. В първата и втората стъпка се комбинират точки 3 с 5 и 9 с 11. В третата стъпка се комбинират точки 8 и 13. След това процесът на сливане продължава.

Когато избираме крайната стъпка и съответно броя на клъстерите, използваме плана за агломерация (фиг. 24.4). Окончателната версия се приема като стъпка, след която разстоянието между обединяваните клъстери (Linkage Distance) рязко се увеличава.

Ориз. 24.4.

Нека изберем резултата от разделянето в съответствие с препоръките от подраздел. 23.7. Както следва от плана на агломерацията, относително рязко увеличение на разстоянието между прикрепените клъстери се случва на 13-та и 17-та стъпка (стъпка на фиг. 24.4). Следователно трябва да се направи избор между 12-та и 16-та стъпка. За да изберете недвусмислено крайната стъпка в съответствие със същите препоръки от разд. 23.7 нека се обърнем към многомерното мащабиране.

Резултати от сегментиране с помощта на метода на многомерно мащабиране

Освен това, за да изберем окончателната опция за класификация, ние разглеждаме картината на относителните позиции на точките, използвайки метода за многоизмерно мащабиране на фиг. 24.5, който е получен в резултат на работа със Statistica PPP. Има две измерения по осите – Измерение 1 и Измерение 2.

Клъстерите имат изпъкнала форма само на 16-та стъпка от клъстерния анализ, което може да се види от резултатите от изчертаването на междугрупови граници въз основа на многомерно мащабиране. Тези резултати се приемат за окончателни. Формирани са три клъстера и по същество сегменти. Първият клъстер включва девет точки, вторият – три, третият – седем.

Ориз. 24.5.

Характеристики на сегментите

Сегментите могат да се характеризират със средни стойности за всяка променлива, а резултатите от сегментирането могат да бъдат визуално представени под формата на профили за средни стойности за всяка променлива (фиг. 24.6).

За да се осигури смислено, лаконично описание на сегмента, му се дава име и мото. Пълно описание на клъстера следва от неговия профил. Името на сегмента може да се основава на променливите, които имат най-високи и най-ниски резултати, както се вижда от прегледа на профилите. Сравняването на профили ви позволява да идентифицирате характеристиките на всеки сегмент и да го „позиционирате“ на фона на останалите.

Нека формулираме името на всеки получен сегмент и да дадем мото. Първи сегмент – позитивисти: „Разходите не са най-важното“, второ – любители на живота. „Помислете за настоящето. Ние

Ориз. 24.6.

не е тук за престиж и кариера”, третият – целенасочено: "Престижът плаща разходите." За получаване на името на сегмента е използвана следната технология.

Наистина, в съответствие с фиг. 24.6:

За първи клъстер Високите резултати са характерни за атрибутите (4) „Студентството е прекрасен период от живота” и (8) „Развива мисленето по специалността”. В същото време твърденията (6) „Разходите за материали са високи“ и (7) „Разходите за време са високи“ са получили ниски оценки;
втори клъстер – високи резултати за твърденията (1) „Възможността за пълноценно общуване и създаване на приятели“ и (4) „Студентството е прекрасен период от живота“. Ниски резултати са получени за твърденията (3) „Важна стъпка в кариерата“ и (9) „Редовното обучение е престижно“;
трети клъстер – високи резултати за твърдения (6) „Материалните разходи са високи“ и (9) „Дневното образование е престижно“ със сравнително ниски резултати за (4) „Студентството е прекрасен период от живота“.

Тук ползите се разбират удобно като мотиви за получаване на такова образование.
PPP е пакет от приложни програми.
Теорията на метода е представена в подт. 23.6.
За по-познат изглед на профила трябва да го завъртите на 90° по часовниковата стрелка.

Сегментирането на пазара е официална процедура, основана на прилагането на статистически методи за многовариантен анализ към резултатите от изследванията. Има четири основни метода, които могат да се използват за получаване на пазарни сегменти:

1 Традиционни методи:

Априори (априори);

Базиран на клъстер.

2 нови метода:

Гъвкаво сегментиране;

Компонентно сегментиране.

Априорният метод за сегментиране на потребителския пазар се използва, когато е възможно да се изложи хипотеза за сегментиране на пазара. За да направите това, е необходимо да разберете нуждите, желанията и желанията на потребителите. Потребителските характеристики като интензивност на потреблението, нужди, ключови елементи на мотивацията и техните значения ще действат като независими променливи, а променливите за сегментиране (възраст, пол, регион и т.н.) ще се използват като зависими променливи.

Използвайки този метод, изследователят първоначално излага хипотеза за сегментиране на пазара и след това я тества по време на маркетингово проучване.

Априорният метод за сегментиране на пазара включва седем етапа:

1 Избор на основа за сегментиране. Анализ на нуждите, нуждите и други фактори, които влияят върху потребителския избор.

2 Избор на променливи за сегментиране и разработване на мрежа за сегментиране на пазара (хипотеза). Извършва се избор и обосновка на критерии, променливи за сегментиране на потребителския пазар, търсене на вероятни връзки между основата и променливите и се елиминират противоречията в мрежата за сегментиране на пазара.

3 Вземане на проби.

4 Провежда се проучване и се събират количествени данни.

5 Сегменти се формират въз основа на разпределението на респондентите от възможните купувачи по категории.

6 Създаване на сегментни профили. Формират се пазарни сегменти и се проверяват за съответствие с изложената хипотеза.

7 Разработване на маркетингови стратегии за всеки пазарен сегмент.

Методът на априорно сегментиране е най-използваният метод. Това се дължи на неговата простота, ниска цена и наличието на техники, които гарантират неговото прилагане. На практика обаче често възникват ситуации, когато е доста трудно да се изложи хипотеза за сегментиране на пазара.

Клъстерният метод е подобен на априорния метод, но не дефинира зависимата променлива - той търси естествени клъстери. Първо, респондентите измежду потенциалните купувачи се групират в пазарни сегменти с помощта на аналитична процедура. След това се идентифицират променливи, които могат да се използват за определяне на пазарен сегмент.

При групирането се търсят естествени групи, а при класифицирането се формират групи по изкуствено зададени критерии.

Групирането на потребителите по метода AID е широко разпространено. При използване на този метод се избира системообразуващ критерий. След това извадката се разделя на подгрупи, тоест се формират подгрупи с висока стойност на системообразуващия критерий.

Недостатъкът на този метод е изборът на пазарен сегмент. Методът е трудоемък и не гарантира точно решение.

Сегментирането по метода на клъстерния анализ се извършва по възходящ (отдолу нагоре) начин. На етапа на маркетингово проучване се идентифицират много характеристики на купувача. Изисква се извадка от най-малко 200 единици. Резултатите се обработват. Данните се разглеждат в универсална скала, която определя тежестта на параметъра. След това се изследва всеки консуматор и се определят най-сходните помежду си. Подобни потребители се комбинират в клъстери и действат като съставен обект. След това обектите, които са най-сходни един с друг, се търсят и се комбинират в нов клъстер. Процесът приключва, когато подобни клъстери не могат да бъдат идентифицирани.

За прилагане на сегментиране на пазара чрез метода на клъстеризиране на практика могат да се използват статистически пакети като SPSS и NCSS&PASS.

Гъвкавото пазарно сегментиране е динамична процедура, която включва гъвкавост при конструирането на сегменти въз основа на анализ на потребителските предпочитания за продуктови алтернативи. Процедурата за комбиниран анализ е в основата на гъвкавото сегментиране. Едно от предимствата на този метод е, че ви позволява да определите доста точно потребителските групи, когато нов продукт навлезе на пазара. Недостатъците на метода за гъвкаво сегментиране включват висока цена, сложна процедура за внедряване и възможни грешки на ниво разработчик.

Компонентният анализ на пазарното сегментиране се основава на сложни техники за статистически анализ. Изисква големи изчислителни ресурси. Методът на компонентния анализ на сегментирането на пазара е предложен от П. Грийн. Този метод се опитва да определи кой тип купувачи са най-подходящи за определени характеристики на продукта.

Според западни експерти методът на гъвкаво и компонентно пазарно сегментиране е чисто академичен и неприложим в реалния живот.

Като част от работата по първата глава от крайната квалификационна работа бяха получени теоретични знания в областта на сегментирането на потребителския пазар. Разгледани са основните характеристики на сегментацията на потребителския пазар. Изследвани са методите за сегментиране на пазара.

Романюк Е. В.

Русия, Ставропол, магистърска степен от Северно-Кавказкия федерален университет

Преглед на методите за клъстерен анализ и оценка на тяхната приложимост за решаване на проблема със сегментацията на потребителския пазар

анотация

Тази статия разглежда статия за процеса на сегментиране на потребителския пазар, дефинирането на система за подпомагане на вземането на решения, както и използването на клъстерен анализ в различни области на дейност, общ набор от методи за клъстерен анализ за решаване на маркетингови проблеми.

Ключови думи:Сегментиране, клъстерен анализ, Data Mining, подкрепа при вземане на решения. Сегментиране, клъстерен анализ, Data Mining, подкрепа при вземане на решения.

Съвременното съдържание на процеса на сегментиране на пазара е резултат от еволюцията на маркетинговата концепция. Преди производителят да започне да разглежда пазара като диференцирана структура в зависимост от потребителските групи и потребителските свойства на продукта, неговите възгледи и съзнание преминаха през различни маркетингови методи: масови, продуктово диференцирани, целеви.

Сегментирането на пазара е, от една страна, метод за намиране на части от пазара и определяне на обектите, към които са насочени маркетинговите дейности на предприятията. От друга страна, това е управленски подход към процеса на вземане на решения на предприятието на пазара, основата за избор на правилната комбинация от маркетингови елементи.

Обектите на сегментиране са преди всичко потребителите. Подбрани по специален начин и притежаващи определени общи характеристики, те съставляват пазарен сегмент. Основният фокус на маркетинга е върху намирането на хомогенни групи от потребители, които имат сходни предпочитания и реагират по подобен начин на маркетинговите предложения.

За успешното прилагане на принципите на сегментиране са изпълнени следните условия:

– способността на предприятието (организацията) да диференцира маркетинговата структура (цени, методи за насърчаване на продажбите, място на продажба, продукти);

– избраният сегмент трябва да бъде достатъчно стабилен, обемен и с перспективи за растеж;

– предприятието трябва да разполага с данни за избрания сегмент, да измерва неговите характеристики и изисквания;

– избраният сегмент трябва да бъде достъпен за предприятието, т.е. да има подходящи канали за продажба и дистрибуция, система за доставка на продукти;

– предприятието трябва да има контакт със сегмента (например чрез лични и масови комуникационни канали);

– оценка на защитата на избрания сегмент от конкуренция, определяне на силните и слабите страни на конкурентите и техните собствени предимства в конкуренцията.

По този начин, само след достатъчно проучване на избрания сегмент и оценка на собствения си потенциал, производителят може да вземе решение за избор на сегмент.

Извличането на данни е мултидисциплинарна област, възникнала и развиваща се на базата на такива науки като приложна статистика, разпознаване на образи, изкуствен интелект, теория на базите данни и др.

Извличането на данни е процес за подпомагане на вземането на решения, базиран на търсене на скрити модели в данните.

Извличането на данни е процес на откриване в сурови данни на неизвестни преди това, нетривиални, практически полезни и интерпретируеми знания, необходими за вземане на решения в различни области на човешката дейност.

Клъстерният анализ се използва в различни области. Полезно е, когато трябва да класифицирате голямо количество информация.

В маркетинга това може да бъде задачата за сегментиране на конкуренти и потребители. В маркетинговите изследвания клъстерният анализ се използва доста широко - както в теоретични изследвания, така и от практикуващи маркетолози, които решават проблеми с групирането на различни обекти. В същото време се решават въпроси за групи клиенти, продукти и т.н. По този начин една от най-важните задачи при прилагането на клъстерния анализ в маркетинговите изследвания е анализът на потребителското поведение, а именно: групирането на потребителите в хомогенни класове за получаване на най-пълна картина на поведението на клиентите от всяка група и факторите, влияещи върху нейното поведение.

Важна задача, която може да реши клъстерният анализ, е позиционирането, т.е. определянето на нишата, в която да бъде позициониран нов продукт, предлаган на пазара. В резултат на прилагането на клъстерен анализ се изгражда карта, от която може да се определи нивото на конкуренция в различни пазарни сегменти и съответните характеристики на продукта за възможността за навлизане в този сегмент. Чрез анализа на такава карта е възможно да се идентифицират нови, незаети ниши на пазара, в които могат да се предлагат съществуващи продукти или да се разработват нови.

Data Mining се използва широко в областта на маркетинга.

Основни маркетингови въпроси “Какво се продава?”, “Как се продава?”, “Кой е потребителят?” Лекцията за проблемите на класификацията и клъстерирането описва подробно използването на клъстерен анализ за решаване на маркетингови проблеми, като сегментиране на потребителите.

Друг общ набор от методи за решаване на маркетингови проблеми са методите и алгоритмите за търсене на асоциативни правила. Търсенето на темпорални модели също се използва успешно тук.

В търговията на дребно, както и в маркетинга, се използват:

– алгоритми за търсене на правила за асоцииране (за определяне на често срещани набори от продукти, които купувачите купуват едновременно). Идентифицирането на такива правила помага за поставяне на стоки на рафтовете на магазините, разработване на стратегии за закупуване на стоки и поставянето им в складове и т.н.

– използване на времеви последователности, например за определяне на необходимите обеми стоки в склад.

– методи за класификация и групиране за идентифициране на групи или категории клиенти, познаването на които допринася за успешното промоциране на стоки.

Литература

Алексеев А. А. „Методология за сегментиране на потребителите“, // „Маркетинг и маркетингови изследвания в Русия“, № 1, 2009 г.
Basovsky L. E. “Маркетинг”, Москва, INFRA M, 2009, – 426 с.
Голцов А. В. „Перспективи за използване на стратегически маркетинг в предприятието.“ // “Маркетинг”, 2008, № 2, с. 72-89.
Croft M. D. „Сегментиране на пазара“. Санкт Петербург, "Петър", 2008 г. - 128 с.
Резниченко Б. А. „Критичен анализ на критериите за сегментиране”, „Маркетинг в Русия и в чужбина”, № 3, 2009 г.

Методи за сегментиране

Могат да бъдат идентифицирани някои "основни" методи за сегментиране. Най-важният от тях е потребителският клъстерен анализ (таксономия). Потребителските клъстери се формират чрез групиране заедно на онези, които дават сходни отговори на зададените въпроси. Купувачите могат да бъдат групирани в клъстер, ако имат сходна възраст, доход, навици и т.н. Сходството между купувачите се основава на различни мерки, но често претегленият квадрат на разликите между отговорите на купувачите на даден въпрос се използва като мярка за сходство. Резултатът от клъстерните алгоритми може да бъде йерархични дървета или групиране на потребители в групи. Има доста голям брой клъстерни алгоритми.

Например в САЩ клъстерният анализ на системи, наречен PRIZM, е широко разпространен , който започва групиране чрез намаляване на набор от 1000 възможни социално-демографски индикатора. Тази система формира социално-демографски сегменти за цялата територия на САЩ. Така беше идентифициран клъстер 28 - семействата, които попадат в този клъстер, включват лица с най-успешна професионална или управленска кариера. Този клъстер също отразява висок доход, образование, имущество и приблизително средна възраст. Въпреки че този клъстер представлява само 7% от населението на САЩ, той е от решаващо значение за предприемачите, продаващи стоки с висока стойност.

Има и други примери за потребителско сегментиране въз основа на клъстерен анализ. Например сред „психологическите“ сектори много важно място заема „отношението на потребителя към новостта на продукта“ (фиг. 3).

Фигура 3

Както се вижда от горните данни, най-голям брой потребители са обикновените купувачи.

Сегментирането на потребителите на базата на клъстерен анализ е „класически” метод. В същото време съществуват методи за пазарно сегментиране, базирани на така нареченото „продуктово сегментиране“ или сегментиране на пазара според параметрите на продукта. Това е особено важно при пускането и маркетинга на нови продукти. Продуктовото сегментиране, базирано на проучване на дългосрочни пазарни тенденции, е от особено значение. Процесът на разработване и производство на нов продукт и изпълнението на големи инвестиционни програми изисква доста дълъг период, като тук е особено важно правилността на резултатите от анализа на пазара и оценката на неговия капацитет. В условията на работа на традиционния пазар на стандартни продукти, изчисляването на неговия капацитет може да се извърши чрез използване на метода на сумиране на пазара. В съвременните условия, за да повиши своята конкурентоспособност и правилно да определи капацитета на пазара, вече не е достатъчно предприятието да извършва сегментиране на пазара само в една посока - определяне на потребителски групи според определени критерии. Като част от интегрирания маркетинг е необходимо и сегментирането на самия продукт според най-важните параметри за промотирането му на пазара. За тази цел методът на компил функционални карти- извършване на своеобразна двойна сегментация, по продукт и по потребител.

Функционалните карти могат да бъдат еднофакторни (сегментирането се извършва по един фактор и за хомогенна група продукти) и многофакторни (анализ за кои потребителски групи е предназначен конкретен продуктов модел и кои от неговите параметри са най-важни за промотиране на продукти на пазара) Използването на компилационни функционални карти може да се използва, за да се определи за кой пазарен сегмент е предназначен даден продукт, какви функционални параметри отговарят на определени потребителски нужди.

При разработването на нови продукти тази методология предполага, че трябва да се вземат предвид всички фактори, отразяващи системата от потребителски предпочитания, и в същото време техническите параметри на новия продукт, с които е възможно да се задоволят нуждите на потребителите; идентифицират се потребителски групи, всяка със собствен набор от искания и предпочитания; всички избрани фактори са подредени по важност за всяка потребителска група.

Този подход ви позволява да видите още на етапа на разработка кои параметри на продукта изискват подобрения в дизайна или да определите дали има достатъчно обемен пазар за този модел.

Нека дадем пример за такъв анализ на пазара във връзка с компютърния проект на Apple в процес на разработка (Таблица 1) (вижте следващата страница)

Маса 1." Сегментиране на пазара на персонални компютри и фактори, взети предвид при разработването на продукти за него (1982 г.) "

Фактори	Пазарни сегменти по потребителски групи						Модел
Фактори	Вкъщи	В училище	В университета	Към къщата. офис	В малкия бизнес	В корпорация	А	IN
Технически спецификации	*	*	***	**	**	**	***	**
Цена	***	***	**	***	***	**	0	**
Специални качества	*	*	**	*	*	*	**	*
Надеждност	**	*	*	**	**	*	0	**
Удобен за използване	**	**	*	**	*	0	***	***
Съвместимост	0	0	0	0	0	***	0	0
Периферно оборудване	0	0	0	0	0	***	0	0
Софтуер	*	*	**	**	**	***	*	**

*** е много важен фактор

** - важен фактор

* - маловажен фактор

0 - незначителен фактор

Този прост анализ показва, че модел A е компютър без пазар, а модел B е най-подходящият продукт за университети и малки фирми.

Веднъж компанията заложи на компютър А и загуби.

Като цяло в световната практика се използват 2 основни подхода за маркетингово сегментиране - (вижте: обща схема на сегментен анализ (фиг. 4)) (следваща страница)

В рамките на първия метод. наречен „априор“, характеристиките на сегментирането, броят на сегментите, техният брой, характеристиките и картата на интересите са предварително известни. Тоест предполага се, че сегментните групи в този метод вече са формирани. Методът „a priori“ се използва в случаите, когато сегментирането не е част от текущите изследвания, а служи като спомагателна основа за решаване на други маркетингови проблеми. Понякога този метод се използва, когато пазарните сегменти са много ясно дефинирани, когато променливостта на пазарните сегменти не е голяма. „Приоритет“ е приемлив и при формирането на нов продукт, насочен към добре познат пазарен сегмент.

В рамките на втория метод, наречен „post hoc (базиран на клъстери), се подразбира несигурността на характеристиките на сегментирането и същността на самите сегменти. Изследователят първо избира редица променливи, които са интерактивни по отношение на респондента (методът. включва провеждане на проучване) и след това, в зависимост от изразеното отношение към определена група променливи, респондентите принадлежат към съответния сегмент. В този случай картата на интересите, идентифицирана в процеса на последващ анализ, се счита за вторична използва се при сегментиране на потребителски пазари, чиято сегментна структура не е дефинирана по отношение на продавания продукт.

Сегментиране по " приорат "

Когато избират броя на сегментите, на които трябва да бъде разделен пазарът, те обикновено се ръководят от целевата функция - идентифициране на най-обещаващия сегмент. Очевидно при формирането на извадка не е необходимо да се включват сегменти, чийто покупателен потенциал е доста малък по отношение на изследвания продукт. Броят на сегментите, както показват проучванията, не трябва да надвишава 10; излишъкът обикновено се свързва с прекомерна детайлност на характеристиките на сегментиране и води до ненужно „замъгляване“ на характеристиките.

Например, когато се сегментира по ниво на дохода, се препоръчва да се разделят всички потенциални купувачи на сегменти с еднакъв обем, като се има предвид, че обемът на всеки сегмент е поне не по-малък от прогнозния обем на продажбите на услуги, въз основа на познаването на производствения капацитет на предприятието. Най-успешният пример, който обяснява горното и демонстрира възможността за разделяне на потенциалните потребители на стабилни сегментни групи, може да бъде сегментирането на населението въз основа на доходите, когато цялото население е разделено на пет 20% групи. Представеното разпределение на доходите по пет 20% групи от населението редовно се представя в статистически сборници и отчети, подобно на представеното в табл. 2

таблица 2 ."Разпределение на доходите по групи от населението. %"

Удобството на работа с такива сегментни групи е очевидно, особено по отношение на проследяването на техния капацитет.