Методи сегментації ринку. Методи сегментації ринку Кластерний метод сегментування

Я працюю в галузі поштового маркетингу для сайту під назвою MailChimp.com. Ми допомагаємо клієнтам робити розсилку новин для своєї рекламної аудиторії. Щоразу, коли хтось називає нашу роботу «поштовим вкиданням», я відчуваю на серці неприємний холод.

Чому? Та тому що адреси електронної пошти – більше не чорні скриньки, які ви закидаєте повідомленнями, наче гранатами. Ні, в поштовому маркетингу (як і в інших формах онлайн-контакту, включаючи твіти, пости у Facebook та кампанії на Pinterest) бізнес отримує відомості про те, як аудиторія вступає в контакт на індивідуальному рівні, за допомогою відстеження кліків, онлайн-замовлень, поширення статусів у соціальних мережах і т. д. Ці дані – не просто перешкоди. Вони характеризують вашу аудиторію. Але для непосвяченого ці операції схожі на премудростей грецької мови. Або есперанто.

Як ви збираєте дані про операції з вашими клієнтами (користувачами, передплатниками тощо) і чи використовуєте їх дані, щоб краще зрозуміти свою аудиторію? Коли ви маєте справу з безліччю людей, важко вивчити кожного клієнта окремо, особливо, якщо всі вони по-різному зв'язуються з вами. Навіть якби теоретично ви могли достукатися до кожного особисто, на практиці це навряд чи можна здійснити.

Потрібно взяти клієнтську базу і знайти золоту середину між «бомбардуванням» навмання та персоналізованим маркетингом для кожного окремого покупця. Один із способів досягти такого балансу – використання кластеризації для сегментування ринку ваших клієнтів, щоб ви могли звертатися до різних сегментів вашої клієнтської бази з різним цільовим контентом, пропозиціями тощо.

Кластерний аналіз - це збирання різних об'єктів і поділ їх на групи собі подібних. Працюючи з цими групами - визначаючи, що з їхніх членів спільного, що відрізняє їх друг від друга - ви можете багато дізнатися про безладному наявному у вас масиві даних. Це знання допоможе вам приймати оптимальні рішення, причому на більш детальному рівні, ніж раніше.

У цьому розрізі кластеризація називається розвідувальним видобутком даних, тому що ці техніки допомагають «витягнути» інформацію про зв'язки у величезних наборах даних, які візуально не охопиш. А виявлення зв'язків у соціальних групах корисне у будь-якій галузі - для рекомендацій фільмів на основі звичок цільової аудиторії, визначення кримінальних центрів міста або обґрунтування фінансових вкладень.

Одне з моїх улюблених застосувань кластеризації - кластеризація зображень: звалювання в купу файлів зображень, які «виглядають однаково» для комп'ютера. Наприклад, у сервісах розміщення зображень типу Flickr користувачі виробляють купу контенту і проста навігація стає неможливою через велику кількість фотографій. Але, використовуючи кластерні техніки, ви можете поєднувати схожі зображення, дозволяючи користувачеві орієнтуватися між цими групами ще до детального сортування.

Контрольоване чи неконтрольоване машинне навчання?

У розвідувальній видобуванні даних ви, за визначенням, не знаєте раніше часу, що ж за дані ви шукаєте. Ви – дослідник. Ви можете чітко пояснити, коли двоє клієнтів виглядають схожими, а коли різними, але ви не знаєте найкращого способу сегментувати свою клієнтську базу. Тому «прохання» до комп'ютера сегментувати клієнтську базу за вас називається неконтрольованим машинним навчанням, тому що ви нічого не контролюєте – не диктуєте комп'ютеру, як робити його роботу.

На противагу цьому процесу, існує контрольоване машинне навчання, яке з'являється, як правило, коли штучний інтелект потрапляє на першу смугу. Якщо я знаю, що хочу розділити клієнтів на дві групи - скажімо, "швидше за все куплять" і "навряд чи куплять" - і постачаю комп'ютер історичними прикладами таких покупців, застосовуючи всі нововведення до однієї з цих груп, це контроль.

Якщо натомість я скажу: «Ось що я знаю про своїх клієнтів і ось як визначити, різні вони чи однакові. Розкажи щось цікавеньке», - то це відсутність контролю.

У цьому розділі розглядається найпростіший спосіб кластеризації під назвою метод k-середніх, який веде свою історію з 50-х років і з того часу став черговим у відкритті знань з баз даних (ОЗБД) у всіх галузях та урядових структурах.

Метод k-середніх - не найматематичніший з усіх методів. Він створений, насамперед, з міркувань практичності та здорового глузду – як афроамериканська кухня. У неї немає такого шикарного родоводу, як у французького, але й він часто догоджає нашим гастрономічним капризам. Кластерний аналіз за допомогою k-середніх, як ви незабаром переконаєтеся, - це частково математика, а частково - екскурс в історію (про минулі події компанії, якщо це порівняння стосується методів навчання менеджменту). Його безперечною перевагою є інтуїтивна простота.

Подивимося, як цей метод, на простому прикладі.

Дівчата танцюють з дівчатками, хлопці чухають у потилиці

Мета кластеризації методом k-середніх - вибрати кілька точок у просторі і перетворити їх на k групи (де k - будь-яке обране вами число). Кожна група визначена точкою в центрі на кшталт прапора, встромленого Місяцем і сигналізуючого: «Гей, ось центр моєї групи! Приєднуйтесь, якщо до цього прапора ви ближчі, ніж до інших!» Цей центр групи (з офіційною назвою кластерний центроїд) - та сама середня з назви методу k-середніх.

Згадаймо для прикладу шкільні танці. Якщо ви зуміли стерти жах цієї «розваги» зі своєї пам'яті, я дуже перепрошую за повернення таких хворобливих спогадів.

Герої нашого прикладу - учні середньої школи Макакне, які прийшли на танцювальний вечір під романтичною назвою «Бал на морському дні», - розпорошені актовим залом, як показано на рис. 1. Я навіть підмалював у Photoshop паркет, щоб було легше уявити ситуацію.

Мал. 1.Учні середньої школи Макакне розташувалися в актовій залі

А ось приклади пісень, під які ці юні лідери вільного світу незграбно танцюватимуть (якщо раптом вам захочеться музичного супроводу, наприклад, на Spotify):

  • Styx: Come Sail Away
  • Everything But the Girl: Missing
  • Ace of Base: All that She Wants
  • Soft Cell: Tainted Love
  • Montell Jordan: This is How We Do It
  • Eiffel 65: Blue

Тепер кластеризація за k-середнім залежить від кількості кластерів, на яку ви бажаєте поділити присутніх. Давайте зупинимося спочатку на трьох кластерах (далі в цьому розділі ми розглянемо питання вибору k). Алгоритм розміщує три прапорці на підлозі актового залу деяким допустимим чином, як показано на рис. 2, де ви бачите 3 початкові прапорці, розподілені по підлозі і позначені чорними кружками.

Мал. 2.Розміщення початкових центрів кластерів

У кластеризації методом k-середніх танцюристи прив'язані до найближчого для них кластерного центру, тому між двома будь-якими центрами на підлозі можна намалювати демаркаційну лінію. Таким чином, якщо танцюрист знаходиться на одній стороні лінії, він належить до однієї групи, якщо по інший бік – то вже до іншої (як на рис. 3).

Мал. 3.Лінії відзначають межі кластерів

Використовуючи ці демаркаційні лінії, розділимо танцюристів на групи та розфарбуємо відповідним чином, як на рис. 4. Ця діаграма, яка розділяє простір на багатокутники, визначені близькістю до того чи іншого кластерного центру, називається діаграмою Вороного.

Мал. 4.Угруповання за кластерами, відміченими різними фоновими візерунками на діаграмі Вороного

Подивимося на наш початковий поділ. Щось не так, чи не так? Простір розділений досить дивним чином: нижня ліва група залишилася порожньою, але в межі верхньої правої групи, навпаки, багато людей.

Алгоритм кластеризації методом k-середніх переміщає кластерні центри по підлозі, доки не досягне найкращого результату.

Як визначити "найкращий результат"? Кожен присутній відстоїть трохи від свого кластерного центру. Чим менша середня відстань від учасників до центру їхньої групи, тим кращий результат.

Тепер вводимо слово «мінімізація» - воно вам знадобиться в оптимізації моделі для кращого розташування кластерних центрів. У цьому розділі ви будете змушувати «Пошук рішення» пересувати кластерні центри безліч разів. Спосіб, який використовує «Пошук рішення» для знаходження найкращого розташування кластерних центрів, - це повільне ітеративне переміщення їх по поверхні з фіксацією кращих знайдених результатів та комбінуванням їх (буквально спарюванням, як скакових коней) для знаходження найкращого положення.

Тож якщо діаграма на рис. 4 виглядає досить блідо, «Пошук рішення» може раптово розташувати центри як на рис. 5. Таким чином, середня відстань між кожним танцюристом і його центром трохи зменшиться.

Мал. 5.Злегка зміщуємо центри

Очевидно, що рано чи пізно «Пошук рішення» зрозуміє, що центри мають бути розміщені у середині кожної групи танцюристів, як показано на рис. 6.

Мал. 6.Оптимальна кластеризація на шкільних танцях

Чудово! Ось так виглядає ідеальна кластеризація. Кластерні центри знаходяться в центрі кожної групи танцюристів, мінімізуючи середню відстань між танцюристом та найближчим центром. Тепер, коли кластеризація закінчена, час перейти до розважальної частини, а саме: спробі зрозуміти, що ці кластери означають.

Якщо ви дізналися колір волосся танцюристів, його політичні переваги або час подолання ними стометрівки, то кластеризація не має особливого сенсу.

Але вирішивши визначити вік та стать присутніх, ви почнете бачити деякі загальні тенденції. Невелика група внизу - це люди похилого віку, швидше за все супроводжують. Група ліворуч вся складається з хлопчиків, а група справа - з дівчаток. І всі дуже бояться танцювати один з одним.

Таким чином, метод k-середніх дозволив вам розділити безліч відвідувачів танців на групи та скорелювати характеристики кожного відвідувача з належністю до певного кластера, щоб зрозуміти причину поділу.

Тепер ви напевно кажете собі: «Та гаразд, що за дурниці. Я вже на початку знав відповідь». Ви маєте рацію. У цьому прикладі – так. Я навів такий «іграшковий» приклад, будучи впевненим, що ви можете вирішити його, просто глянувши на точки. Дія відбувається у двовимірному просторі, у якому кластеризація проводиться елементарно за допомогою очей.

Але що якщо ви тримаєте магазин, що реалізує тисячі товарів? Деякі покупці здійснили одну або дві покупки за останні два роки. Інші – десятки. І кожен купував щось своє.

Як ви кластеризуєте їх на такому "танцполі"? Почнемо з того, що ця танцпол не двомірна, і навіть не тривимірна. Це тисячомірний простір реалізації товару, у якому покупець придбав чи придбав товар у кожному вимірі. Бачите, як швидко проблема кластеризації починає виходити межі здібностей «очного яблука першого розряду», як люблять говорити мої друзі-військові.

Реальне життя: кластеризація методом k-середніх в електронному маркетингу

Давайте перейдемо до більш предметного випадку. Я займаюся електронним маркетингом, тому наведу приклад із життя Mailchimp.com, у якому працюю. Цей самий приклад буде працювати і на даних про роздрібну торгівлю, перетворення рекламного трафіку, соціальних мереж і т. д. Він взаємодіє практично з будь-яким типом даних, пов'язаних з донесенням до клієнтів рекламного матеріалу, після чого вони беззастережно вибирають вас.

Оптова Винна Імперія Джоуї Бег О"Донатса

Уявіть на хвилину, що ви живете в Нью-Джерсі, де тримаєте Оптову Винну Імперію Джоуї Бег О"Донатса. Це імпортно-експортний бізнес, метою якого є доставка величезної кількості вина з-за кордону та продажу його певним винним магазинам по всій країні. Цей бізнес працює таким чином, що Джоуї подорожує по всьому світу в пошуках неймовірних угод з великою кількістю вина, він відправляє його до себе в Джерсі, а влаштувати надіслане в магазини і отримати прибуток - ваша турбота.

Ви знаходите покупців різними способами: сторінка на Facebook, обліковий запис у Twitter, часом навіть пряме розсилання - адже електронні листи «розкручують» більшість видів бізнесу. Минулого року ви надсилали один лист на місяць. Зазвичай у кожному листі описуються дві чи три угоди, скажімо, одна із шампанським, а інша з мальбеком. Деякі угоди просто дивовижні – знижка складає 80% або більше. У результаті ви уклали близько 32 угод за рік і всі вони пройшли більш-менш гладко.

Але те, що справи йдуть просто добре, не означає, що вони не можуть краще йти. Було б не надто трохи глибше зрозуміти мотиви своїх покупців. Звичайно, поглянувши на конкретне замовлення, ви бачите, що якийсь Адамс купив скільки-небудь ігристого в липні з 50% знижкою, але не можете визначити, що спонукало його на покупку. Чи сподобався йому мінімальний обсяг замовлення в одну коробку із шістьма пляшками чи ціна, яка ще не піднялася до свого максимуму?

Було б добре мати можливість розбити перелік клієнтів на групи за інтересами. Тоді ви могли б відредагувати листи до кожної групи окремо і, можливо, розкрутили б бізнес ще більше. Будь-яка відповідна цій групі угода могла стати темою листа і у першому абзаці тексту. Такий тип цільової розсилки може викликати формений вибух продажу!

Є можливість дати комп'ютер зробити роботу за вас. Використовуючи кластеризацію методом k-середніх, ви можете знайти найкращий варіант розбиття на групи, а потім спробувати зрозуміти, чому він кращий.

Вихідний набір даних

Документ Excel, який ми розбиратимемо в цьому розділі, знаходиться на сайті книги. У ньому містяться всі вихідні дані у разі, якщо вам захочеться попрацювати з ними. Або ви можете просто стежити за текстом, підглядаючи в інші аркуші документа.

Для початку у вас є два цікаві джерела даних:

  • метадані за кожним замовленням збережені в електронній таблиці, включаючи сорт, мінімальну кількість вина в замовленні, знижку на роздрібний продаж, інформацію про те, чи пройдено ціновий максимум, та про країну походження. Ці дані розміщені у вкладці під назвою OfferInformation, як показано на рис. 7;
  • знаючи, хто з клієнтів що замовляє, ви можете витрусити цю інформацію з MailChimp і згодувати електронній таблиці з метаданими пропозиціями у вкладці «Transactions». Це змінні дані, подані, як показано на рис. 8, дуже просто: покупець та його замовлення.

Мал. 7.Деталі останніх 32 замовлень

Мал. 8.Список кількості замовлень щодо покупців

Визначаємо предмет вимірів

І ось завдання. У проблемі шкільних танців вимірювання відстані між присутніми та визначення кластерних центрів були нескладними, чи не так? Досить просто знайти потрібну рулетку! Але що робити зараз?

Ви знаєте, що в минулому році було 32 пропозиції угод і у вас є список із 324 замовлень в окремій вкладці, розбитий за покупцями. Але щоб виміряти відстань від кожного покупця до кластерного центру, ви повинні помістити їх у цей 32-угодний простір. Інакше кажучи, вам потрібно зрозуміти, що за угоди вони не здійснили, і створити матрицю угод по покупцям, в якій кожен клієнт отримує свій власний стовпець з 32 осередками угод, заповнені одиницями, якщо угоди були вчинені, і нулями, якщо ні.

Іншими словами, вам потрібно взяти цю орієнтовану рядками таблицю угод і перетворити її на матрицю, в якій клієнти розташовуються по вертикалі, а пропозиції - по горизонталі. Найкращим способом її створити є зведені таблиці.

Алгоритм дії: на аркуші зі змінними даними виділіть стовпці А та В, а потім вставте зведену таблицю. Використовуючи Майстер створення зведених таблиць, просто виберіть угоди як заголовок рядка, а покупців як заголовок стовпця та заповніть таблицю. У комірці буде 1, якщо пара «клієнт-угода» існує, і 0, якщо ні (у даному випадку 0 відображається як порожня комірка). В результаті виходить таблиця, показана на рис. 9.

Мал. 9.Зведена таблиця «клієнт-угода»

Тепер, коли ви маєте інформацію про замовлення у форматі матриці, скопіюйте лист OfferInformation і назвіть його Matrix. У цей новий аркуш вставте значення зі зведеної таблиці (не потрібно копіювати і вставляти номер угоди, тому що він вже міститься в інформації про замовлення), починаючи зі стовпця Н. У результаті ви маєте отримати розширену версію матриці, доповнену інформацією про замовлення, як на рис. 10.

Мал. 10.Опис угод та дані про замовлення, злиті в єдину матрицю

Стандартизація даних

У цьому розділі кожен вимір ваших даних представлений однаково у вигляді бінарної інформації про замовлення. Але у багатьох ситуаціях, пов'язаних із кластеризацією, ми не можемо так зробити. Уявіть сценарій, в якому люди кластеризовані за зростанням, вагою та зарплатою. Всі ці три види даних мають різну розмірність. Зростання може змінюватись від 1,5 до 2 метрів, у той час як вага – від 50 до 150 кг.

У цьому контексті вимір відстані між покупцями (як між танцюристами в актовому залі) стає заплутаною справою. Тому прийнято стандартизувати кожен стовпець з даними, віднімаючи середнє і потім поділяючи по черзі на міру розкиду під назвою середньоквадратичне відхилення. Таким чином, усі стовпці наводяться до єдиної величини, кількісно варіюючи близько 0.

Почнемо з чотирьох кластерів

Ну що ж, тепер усі ваші дані зведені до єдиного зручного формату. Щоб почати кластеризувати, потрібно вибрати k – кількість кластерів у алгоритмі k-середніх. Найчастіше метод k-середніх застосовується так: береться набір різних k і перевіряється по одному (як їх вибирати, я поясню пізніше), але ми тільки починаємо – тож виберемо лише одне.

Вам знадобиться кількість кластерів, яка приблизно підходить для того, чим ви хочете зайнятися. Ви явно не збираєтеся створювати 50 кластерів і розсилати 50 цільових рекламних листів парі хлопців з кожної групи. Це миттєво позбавляє сенсу наша вправа. У нашому випадку потрібне щось невелике. Почніть цей приклад із 4 - в ідеальному світі ви, можливо, розділили б ваш список клієнтів на 4 зрозумілі групи по 25 осіб у кожній (що реально малоймовірно).

Отже, якщо доведеться розділити покупців на 4 групи, як найкраще їх підібрати?

Замість псувати симпатичний аркуш Matrix, скопіюйте дані в новий аркуш і назвіть його 4МС. Тепер ви можете вставити 4 стовпці після цінового максимуму до стовпців від Н до К, які будуть кластерними центрами. (Щоб вставити стовпець, клацніть правою клавішею мишки на стовпці Н і виберіть «Вставити». Стовпець з'явиться зліва.) Назвіть ці кластери від Cluster 1 до Cluster 4. Ви також можете застосувати на них умовне форматування, і коли б ви не встановили їх, ви можете побачити, наскільки вони відрізняються.

Лист 4МС з'явиться, як показано на рис. 11.

Мал. 11.Порожні кластерні центри, поміщені на аркуш 4МС

В даному випадку всі кластерні центри – нулі. Але технічно вони можуть бути будь-якими і, що вам особливо сподобається - як на шкільних танцях, розподілені таким чином, що мінімізують відстань між кожним покупцем та його кластерним центром.

Вочевидь, тоді ці центри матимуть значення від 0 до 1 кожної угоди, оскільки всі клієнтські вектори бінарні.

Але що означає «виміряти відстань між кластерним центром та покупцем»?

Евклідова відстань: вимірювання відстаней напряму

Для кожного клієнта ви маєте окремий стовпець. Як виміряти відстань між ними? У геометрії це називається «найкоротший шлях», а відстань, яку отримуємо в результаті, - евклідовою відстанню.

Повернемося ненадовго до актової зали та спробуємо зрозуміти, як вирішити нашу проблему там.

Помістимо координатні осі на підлозі та на рис. 12 побачимо, що у точці (8,2) у нас танцюрист, а у (4,4) – кластерний центр. Щоб розрахувати евклідову відстань між ними, доведеться згадати теорему Піфагора, з якою ви знайомі ще зі шкільної лави.

Мал. 12.Танцюрист в точці (8,2) і кластерний центр в (4,4)

Ці дві точки знаходяться в 8 - 4 = 4 метрах одна від одної по вертикалі та в 4 - 2 = 2 метрах по горизонталі. За теоремою Піфагора, квадрат відстані між двома точками дорівнює 4Л2+2Л2 = 20 метрів. Звідси ми обчислюємо саму відстань, яка дорівнює квадратному кореню з 20, що становить приблизно 4,47м (як на рис. 13).

Мал. 13.Евклідова відстань дорівнює квадратному кореню із суми відстаней у кожному напрямку

У контексті передплатників на розсилку у вас більше двох вимірів, але застосовна та сама концепція. Відстань між покупцем та кластерним центром розраховується шляхом визначення різниць між двома точками для кожної угоди, зведення їх у квадрат, додавання та вилучення квадратного кореня. Наприклад, на аркуші 4МС ви хочете дізнатися про евклідову відстань між центром кластера 1 в стовпці Н і замовленнями покупця Адамса в стовпці L.

У осередку L34, під замовлення Адамса, можна обчислити різницю між вектором Адамса і кластерним центром, звести її в квадрат, скласти і потім витягти корінь, використовуючи наступну формулу для масивів (позначте абсолютні посилання, що дозволяють вам перетягувати цю формулу вправо або вниз без зміни на кластерний центр):


(=КОРІНЬ(СУМА(L$2:L$33-$H$2:$H$33)A2))))

Формулу для масивів (введіть формулу і натисніть Ctrl+Shift+Enter або Cmd+Return у MacOS, як сказано в розділі 1) потрібно використовувати, тому що її частина (L2:L33-H2:H33)^2 повинна знати, куди звертатися для обчислення різниць та зведення їх у квадрат, крок за кроком. Однак результат у результаті - однина, у нашому випадку 1,732 (як на рис. 14). Він має наступний сенс: Адамс уклав три угоди, але так як початкові кластерні центри - нулі, відповідь дорівнюватиме квадратному кореню з 3, а саме 1,732.

Мал. 14.Відстань між центром 1 кластера та Адамсом

У електронній таблиці на рис. 2-14 я закріпив верхній рядок (див. розділ 1) між стовпцями G і Н і назвав рядок 34 в осередку G34 «Distance to Cluster 1», просто щоб бачити, де знаходиться, якщо промотувати сторінку вниз.

Відстань та приналежність до кластера для всіх!

Тепер ви знаєте, як обчислити відстань між вектором замовлення та кластерним центром.

Настав час додати Адамсу розрахунок відстаней до інших кластерних центрів, перетягнувши комірку L34 вниз на L37, а потім змінивши вручну посилання кластерний центр зі стовпця Н на стовпець I, J і К в комірках нижче. В результаті повинні вийти наступні 4 формули L34:L37:

(=SQRT(SUM((L$2:L$33-$H$2:$H$33)A2))))
(=SQRT(SUM((L$2:L$33-$I$2:$I$33)A2))))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2))))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2))))
(=КОРІНЬ(СУМА((L$2:L$33-$H$2:$H$33)A2))))
(=КОРІНЬ(СУМА((L$2:L$33-$I$2:$I$33)A2))))
(=КОРІНЬ(СУМА((L$2:L$33-$J$2:$J$33)A2))))
(=КОРІНЬ(СУМА((L$2:L$33-$K$2:$K$33)A2))))

Так як ви використовували абсолютні посилання для кластерних центрів (адже значок $ у формулах позначає саме це, як було сказано в розділі 1), можна перетягнути L34:L37 DG34:DG37, щоб розрахувати відстань від кожного покупця до всіх чотирьох кластерних центрів. Зазначте рядки в стовпці G в осередках з 35 по 37 «Distance to Cluster 2» і т. д. Свіжерозраховані відстані показані на рис. 15.

Мал. 15.Розрахунок відстаней від кожного покупця до всіх кластерних центрів

Тепер вам відома відстань кожного клієнта до всіх чотирьох кластерних центрів. Їх розподіл за кластерами проведено по найкоротшій відстані два прийоми наступним чином.

Спочатку повернемося до Адамса в стовпець L і розрахуємо мінімальну відстань до кластерного центру в осередку L38. Це просто:

Min(L34:L37)
= хв (L34: L37)

Для розрахунку використовуємо формулу match/пошукпоз (докладніше у розділі 1). Помістивши її в L39, ви можете побачити номер осередку з проміжку L34:L37 (вважаю кожний по порядку від 1), який знаходиться на мінімальній відстані:

Match(L38,L34:L37,0) =пошукпоз(L38,L34:L37,0)

В даному випадку відстань однакова для всіх чотирьох кластерів, тому формула вибирає перший (L34) і повертає 1 (рис. 16).

Мал. 16.Додавання на лист прив'язки до кластерів

Ви також можете перетягнути ці дві формули на DG38: DG39. Для більшої організованості додайте назви рядків 38 та 39 у осередки 38 та 39 стовпця G «Minimum Cluster Distance» та «Assigned Cluster».

Пошук рішень для кластерних центрів

Ваша електронна таблиця поповнилася розрахунком відстаней та прив'язкою до кластерів. Тепер, щоб встановити найкраще положення кластерних центрів, потрібно знайти такі значення в стовпцях від Н до К, які мінімізують загальну відстань між покупцями та кластерними центрами, до яких вони прив'язані, зазначеними у рядку 39 кожного покупця.

Коли чуєте слово "мінімізувати": починається етап оптимізації, а оптимізація здійснюється за допомогою "Пошуку рішення".

Щоб використати «Пошук рішення», вам знадобиться комірка для результатів, тому в А36 підсумуємо всі відстані між покупцями та їх кластерними центрами:

SUM(L38:DG38)
=CУMMA(L3 8:DG3 8)

Ця сума відстаней від клієнтів до найближчих до них кластерних центрів точно є тією цільовою функцією, з якою ми зустрічалися раніше, під час кластеризації актової зали середньої школи Макакне. Але евклідова відстань зі своїми ступенями і квадратним корінням - жахливо нелінійна функція, тому вам доведеться використовувати еволюційний алгоритм рішення замість симплекс-метода.

У розділі 1 ви вже скористалися цим методом. Симплексний алгоритм, якщо є можливість його застосувати, працює швидше за інших, але ним не можна скористатися для обчислення коренів, квадратів та інших нелінійних функцій. Так само марний OpenSolver, який використовує симплексний алгоритм, нехай навіть і ніби прийняв стероїди.

У нашому випадку вбудований у «Пошук рішення» еволюційний алгоритм використовує комбінацію випадкового пошуку та відмінне рішення «схрещування», щоб, подібно до еволюції в біологічному контексті, знаходити ефективні рішення.

У вас є все, що потрібно для встановлення завдання перед «Пошуком рішення»:

  • ціль: мінімізувати загальні відстані від покупців до їх кластерних центрів (А36);
  • змінні: вектор кожної угоди щодо кластерного центру (Н2:К33);
  • умови: кластерні центри повинні мати значення від 0 до 1.

Рекомендується наявність «Пошуку рішення» та молотка. Ставимо завдання «Пошуку рішення»: мінімізувати А36 шляхом зміни значень Н2: К33 за умовою Н2: К33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

Мал. 17.Установки «Пошуку рішення» для 4-центрової кластеризації

Але постановка завдання – ще не все. Прийде трохи попотіти, вибираючи потрібні опції еволюційного алгоритму, натиснувши кнопку «Параметри» у вікні «Пошуку рішення» і перейшовши у вікно налаштування. Раджу встановити максимальний час секунд на 30 більше, залежно від того, скільки ви готові чекати, поки «Пошук рішень» впорається зі своїм завданням. На рис. 18 я поставив своє на 600 секунд (10 хвилин). Таким чином, я можу запустити «Пошук рішення» та піти обідати. А якщо вам захочеться перервати його раніше, просто натисніть на Escape і вийдіть з нього з найкращим рішенням, яке той встиг знайти.

Мал. 18.Параметри еволюційного алгоритму

Натисніть «Виконати» та спостерігайте, як Excel робить свою справу, доки еволюційний алгоритм не зійдеться.

Сенс отриманих результатів

Як тільки «Пошук рішення» видає вам оптимальні кластерні центри, починається найвеселіше. Переходимо до вивчення груп! На рис. 19 ми бачимо, що «Пошук рішення» знайшов оптимальну загальну відстань 140,7, а всі чотири кластерні центри – завдяки умовному форматуванню! - виглядають абсолютно по-різному.

Мал. 19.Чотири оптимальні кластерні центри

Майте на увазі, що ваші кластерні центри можуть відрізнятися від представлених у книзі, тому що еволюційний алгоритм використовує випадкові числа і відповідь щоразу виходить різною. Кластери можуть бути зовсім іншими або, що більш ймовірно, розташовуватися в іншому порядку (наприклад, мій кластер 1 може бути дуже близьким до кластера 4 і т. д.).

Так як при створенні аркуша ви вставили в стовпці від опису угод до G, тепер можна прочитати подробиці на рис. 19, що важливо задля розуміння ідеї кластерних центрів.

Для кластера 1 у стовпці Н умовне форматування вибирає угоди 24, 26, 17 і, меншою мірою, 2. Прочитавши опис цих угод, можна зрозуміти, що вони загального: вони всі укладалися на піно нуар.

Поглянувши на стовпець I, ви побачите, що у всіх зелених осередках низька мінімальна кількість. Це покупці, які не бажають набувати величезних партій у процесі угоди.

А ось два інші кластерні центри, чесно кажучи, складно інтерпретувати. Як щодо того, щоб замість інтерпретації кластерних центрів вивчити самих покупців у кластері та визначити, які угоди їм подобаються? Це могло б внести у запитання ясність.

Рейтинг угод кластерним методом

Замість з'ясування, які відстані до якого кластерного центру ближче до 1, перевіримо, хто до якого кластера прив'язаний і які угоди віддає перевагу.

Щоб це зробити, почнемо з копіювання аркуша Offerlnformation. Копію назвемо 4МС – TopDealsByCluster. Пронумеруйте стовпці від Н до К на цьому новому аркуші від 1 до 4 (як на рис. 20).

Мал. 20.Створення листа таблиці для підрахунку популярності угод за допомогою кластерів

На аркуші 4МС у вас були прив'язки за кластерами від 1 до 4 у рядку 39. Все, що вам потрібно зробити, щоб порахувати угоди за кластерами, - це поглянути на назви стовпців від Н до К на аркуші 4МС - TopDealsByCluster, подивитися, хто з аркуша 4МС був прив'язаний до цього кластера у рядку 39, а потім скласти кількість їхніх угод у кожному рядку. Таким чином ми отримаємо загальну кількість покупців у даному кластері, які вчинили угоди.

Почнемо з осередку Н2, в якому записано кількість покупців кластера 1, які прийняли пропозицію №1, а саме січневий мальбек. Потрібно скласти значення осередків діапазону L2: DG2 на аркуші 4МС, але тільки покупців з 1 кластера, що є класичним прикладом використання формули sumif/сумесі. Виглядає вона так:

SUMIF("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

Ця формула працює таким чином: ви постачаєте її деякими умовними значеннями, які вона перевіряє в першій частині "4MC"! ), а потім при кожному збігу, додає це значення рядок 2 у третій частині формули "4MC"!$L2:$DG2.

Зауважте, що ви використовували абсолютні посилання ($ у формулі) перед усім, що стосується прив'язки до кластера, номера рядка в заголовках стовпців і букві, що означає стовпець, для скоєних угод. Зробивши ці посилання абсолютними, можна перетягнути формулу будь-яке місце з Н2:К33, щоб розрахувати кількість угод інших кластерних центрів і комбінації угод, як у рис. 21. Щоб ці стовпці були читанішими, ви також можете застосувати до них умовне форматування.

Мал. 21.Загальна кількість угод за кожною пропозицією, розбита за кластерами

Виділяючи стовпці від А до К та застосовуючи автофільтрацію, ви можете сортувати ці дані. Відсортувавши від найменшого до найбільшого стовпець Н, ви побачите, які угоди найпопулярніші у кластері 1 (рис. 22).

Мал. 22.Сортування кластера 1. Піно, піно, піно!

Як я згадував раніше, чотири найбільші угоди для цього кластера - це піно. Ці хлопці явно зловживають фільмом "На узбіччі". Якщо ви відсортуєте кластер 2, то вам стане зрозуміло, що це - дрібнооптові покупці (рис. 23).

Але коли ви відсортуєте кластер 3, зрозуміти щось буде не так просто. Великі угоди можна перерахувати на пальцях, а різниця між ними та іншими не так очевидна. Однак у найпопулярніших угод все ж таки є щось спільне - досить хороші знижки, 5 з 6 найбільших угод - на ігристе вино, і Франція - виробник товару для 3 з 4 з них. Проте ці припущення є неоднозначними.

Що стосується кластера 4, то цим хлопцям з якоїсь причини сподобалася серпнева пропозиція на шампанське. Також 5 із 6 найбільших угод - на французьке вино, а 9 із 10 перших за величиною - на великий обсяг товару. Може, це великооптовий кластер, що тяжіє до французьких вин? Перетин кластерів 3 і 4 теж непокоїть.

Далі розглядається сегментація студентів за суб'єктивними властивостями (див. підрозд. 14.1) та з вигод (див. підрозд. 14.4), які дає здобуття вищої освіти при денній формі навчання. Для сегментації застосовується методика, що базується на кластерному аналізі із залученням багатовимірного шкалювання для додаткового, більш повного аналізу.

Змінні сегментації– властивості та вигоди – повинні мати кількісні бальні оцінки. При вирішенні конкретного завдання було використано дев'ять параметрів. Для застосування шкали Лайкерта за кожним параметром сформульовано відповідні твердження.

  • 1. Це найкращий спосіб отримати глибокі знання.
  • 2. Це можливість повноцінного спілкування та придбання друзів.
  • 3. Це цінна можливість спілкування із викладачем.
  • 4. Це важливий крок для початку кар'єри.
  • 5. Студентство – прекрасний період життя.
  • 6. Матеріальні витрати на денне навчання великі.
  • 7. Тимчасові витрати на денне навчання великі.
  • 8. Розвиває мислення за фахом.
  • 9. Денне навчання престижне.

Набір параметрів, які можна використовувати, може бути набагато ширшим. Студенти у своїх анкетах часто вказують також такі переваги або недоліки денного навчання в університеті: можливість розширення кругозору, можливість відстрочення, можливість навчитися самодисципліні та самоорганізації, утруднення поєднання навчання та роботи, важливий період у житті, відсутність практики, можливість отримати великий обсяг інформації, вплив на подальший поступ по роботі, поява в майбутньому можливості визначитися з правильністю вибору професії, участь у житті університету.

Збір даних

Збір даних здійснюється шляхом анкетування. Питання сформульовані із застосуванням шкали Лайкерта (див. підрозд. 8.3). Наприклад, студентів опитали щодо ступеня їхньої згоди-незгоди із твердженнями за шкалою із п'ятьма градаціями. У літературі широко застосовується семибальна шкала, але часто респонденту важко давати відповіді при великій кількості градацій.

Фрагмент анкети має вигляд, наведений на рис. 24.2.

Мал. 24.2.

Від респондента потрібно лише поставити тільки "галочку", а оцифрування проводить анкетер. Застосовано п'ятибальну шкалу з рівнями від 1 до 5 (1 – категорично не згоден, ..., 5 – повністю згоден). На анкету відповіли 19 респондентів – усі студенти однієї групи, чого, звісно, ​​недостатньо.

24.7. Сегментація за властивостями на прикладі освітнього продукту 381

Розрахунки за методом кластерного аналізу

Кластерний аналіз (див. підрозд. 23.7) широко застосовується при проведенні сегментації за властивостями продукту (див. підрозд. 24.3). Сегментацію за кластерним аналізом іноді називають ієрархічної. На основі отриманих оцінок розраховуються відстані між оцінками кожного студента з кожним. За підсумками пакету наукових статистичних програм Statistica. Спочатку складається матриця евклідових відстаней (Euclidean distances). Для утворення кластерів застосовано об'єднуючу (агломеративною) процедуру за методом далекого сусіда (Complete linkage). Результати представлені як діаграми на рис. 24.3.

Мал. 24.3. Дендрограма (ППП Statistica)

По вертикальній осі дасться відстань між кластерами, що приєднуються (Linkage Distance). По горизонтальній осі номерами від С_1 до 19 перераховані студенти. Як випливає з дендрограми, на першому етапі є 19 кластерів. На першому і другому кроках об'єднуються точки 3 з 5 і 9 з 11. На третьому кроці об'єднуються точки 8 і 13. Потім процес об'єднання триває.

При виборі остаточного кроку і кількості кластерів використовуємо план агломерації (рис. 24.4). За остаточний варіант приймається крок, після якого відстань між кластерами (Linkage Distance), що об'єднуються, різко зростає.

Мал. 24.4.

Виберемо результат розбиття відповідно до рекомендацій з підрозд. 23.7. Як випливає з плану агломерації, відносно різкий приріст відстані між кластерами, що приєднуються, відбувається на 13-му і 17-му кроках (Step на рис. 24.4). Отже, необхідно зробити вибір між 12-м та 16-м кроками. Для однозначного вибору завершального кроку відповідно до тих же рекомендацій з розд. 23.7 звернемося до багатовимірного шкалювання.

Результати сегментації за методом багатовимірного шкалювання

Додатково для вибору остаточного варіанта класифікації розглядається картина взаємного розташування точок методом багатовимірного шкалювання на рис. 24.5 який отриманий в результаті роботи з ППП Statistica. По осях дано два виміри – Dimension 1 та Dimension 2.

Кластери мають опуклу форму тільки на 16-му етапі кластерного аналізу, що видно за результатами проведення міжгрупових кордонів на основі багатовимірного шкалювання. Ці результати приймаються за остаточні. Утворено три кластери, а по суті – сегменти. Перший кластер включає дев'ять точок, другий - три, третій - сім.

Мал. 24.5.

Характеристика сегментів

Сегменти можуть бути охарактеризовані середніми значеннями за кожною змінною, а результати сегментації наочно можуть бути представлені у вигляді профілів за середніми значеннями за кожною змінною (рис. 24.6).

Для змістовної лаконічної характеристики сегмента йому надається ім'я, девіз. Повна характеристика кластера випливає з профілю. В основу імені сегмента можуть бути покладені змінні, за якими отримані найвищі та найнижчі оцінки, що видно з розгляду профілів. Порівняння профілів дозволяє виявити особливості кожного сегмента, "позиціонувати" його і натомість інших.

Сформулюємо ім'я кожного отриманого сегмента та дамо девіз. Перший сегмент – позитивісти: "Витрати не головне", другий - життєлюби. "Думай про сьогодення. Ми

Мал. 24.6.

тут не для престижу та кар'єри", третій – цілеспрямовані: "Престиж окупає витрати". Застосовувалася така технологія отримання імені сегмента.

Справді, відповідно до рис. 24.6:

  • для першого кластера характерні високі оцінки для ознак (4) "Студентство – прекрасний період у житті" та (8) "Розвиває мислення за спеціальністю". При цьому низькі оцінки отримали затвердження (6) "Матеріальні витрати великі" та (7) "Тимчасові витрати великі";
  • другого кластера – високі оцінки для тверджень (1) "Можливість повноцінного спілкування та придбання друзів" та (4) "Студентство – прекрасний період у житті". Низькі оцінки отримані для тверджень (3) "Важливий крок у кар'єрі" та (9) "Денна освіта престижна";
  • третього кластера – високі оцінки для тверджень (6) "Матеріальні витрати великі" і (9) "Денне навчання престижне" за відносно низькою для (4) "Студентство – прекрасний період у житті".
  • Під вигодами тут зручно розуміти мотиви здобуття такої освіти.
  • ППП – пакет прикладних програм.
  • Теорія методу викладена у подразд. 23.6.
  • Для більш звичного представлення профілю його потрібно повернути на 90 ° за годинниковою стрілкою.

Сегментування ринку - це формальна процедура, заснована на застосуванні статистичних методів багатовимірного аналізу до результатів досліджень. Щоб отримати ринкові сегменти можна використовувати чотири основні методи:

1 Традиційні методи:

Апріорний (a priori);

Кластерний (cluster based).

2 Нові методи:

Гнучке сегментування (flexible);

Компонентне сегментування (componential).

Апріорний метод сегментування ринку споживачів використовується, коли є можливість висунути гіпотезу сегментування ринку. Для цього необхідно розуміти потреби, потреби, бажання споживачів. Характеристики споживача, такі як інтенсивність споживання, потреби, ключові елементи мотивації та їх значення будуть виступати як незалежні змінні, а змінні сегментування (вік, стать, регіон тощо) будуть використані як залежні змінні.

Використовуючи цей метод, дослідник спочатку висуває гіпотезу сегментування ринку, та був у ході маркетингових досліджень перевіряє її.

Апріорний метод сегментування ринку включає сім етапів:

1 Вибір базису сегментування. Аналіз потреб, потреб та інших чинників, мають впливом геть вибір споживача.

2 Вибір змінних сегментування та розробка сітки сегментування ринку (гіпотези). Відбувається вибір та обгрунтування критеріїв, змінних сегментування ринку споживачів, пошук можливих зв'язків між базисом і змінними, усуваються протиріччя сітці сегментування ринку.

3 Формування вибірки.

4 Проводиться анкетування, збирання кількісних даних.

5 Формуються сегменти виходячи з розбивки опитаних у складі можливих покупців за категоріями.

6 Встановлення профілів сегментів. Проводиться формування ринкових сегментів та його перевірка відповідність висунутої гіпотезі.

7 Розробка маркетингових стратегій кожному за сегменти ринку.

Апріорний метод сегментування - метод, що найбільш використовується. Це зумовлено його простотою, не високою вартістю та наявністю методик, що забезпечують його реалізацію. Однак на практиці досить часто виникають ситуації, коли висунути гіпотезу сегментування ринку досить важко.

Кластерний метод схожий на апріорний метод, але не визначається залежна змінна – шукаються природні кластери. Спочатку проводиться угруповання опитаних з-поміж потенційних покупців за допомогою аналітичної процедури в сегменти ринку. Потім виявляються змінні, з яких можна було б задати ринковий сегмент.

При кластеризації шукаються природні групи, а класифікації – групи формуються за штучно заданим критеріям.


Широко поширена угруповання споживачів методом AID. При використанні цього методу здійснюється вибір системотворчого критерію. Після цього вибірка поділяється на підгрупи, тобто формуються підгрупи з високим значенням системоутворюючого критерію.

Недолік цього методу - підбір ринкового сегмента. Метод є трудомістким і гарантує отримання точного рішення.

Сегментування за методом кластерного аналізу здійснюється за висхідною (знизу-вгору). На етапі маркетингового дослідження виділяється безліч показників покупця. Необхідна вибірка щонайменше 200 одиниць. Проводиться обробка результатів. Дані розглядаються за універсальною шкалою, що визначає виразність параметра. Потім обстежується кожен споживач і визначаються схожі між собою. Подібні споживачі об'єднуються в кластери і виступають як складовий об'єкт. Далі шукаються найбільш схожі між собою об'єкти та об'єднуються у новий кластер. Процес закінчується, коли неможливо визначити схожі кластери.

Для реалізації сегментування ринку за допомогою методу кластеризації на практиці можуть бути використані статистичні пакети типу SPSS та NCSS&PASS.

Гнучке сегментування ринку – це динамічна процедура, яка передбачає гнучкість при побудові сегментів, виходячи з аналізі споживчих переваг щодо альтернатив продукту. Процедура спільного аналізу є основою гнучкого сегментування. Однією з переваг даного методу є те, що він дозволяє досить точно визначити групи споживачів при виході нового товару ринку. До недоліків методу гнучкого сегментування можна віднести дорожнечу, складну процедуру реалізації та можливі похибки на рівні розробників.

Компонентний аналіз сегментування ринку ґрунтується на складних методах статистичного аналізу. Він потребує великих обчислювальних ресурсів. Метод компонентного аналізу сегментування ринку було запропоновано П. Гріном. Цей метод намагається визначити який тип покупців найбільше підходить під певні характеристики товару.

На думку західних фахівців, метод гнучкого та компонентного сегментування ринку є суто академічними та незастосовними до реального життя.

У рамках роботи над першим розділом випускної кваліфікаційної роботи отримано теоретичні знання у галузі сегментування ринку споживачів. Розглянуто основні ознаки сегментування ринку споживачів. Вивчено методи сегментування ринку.

Романюк О. В.

Ставрополь, магістр Північно-Кавказького Федерального Університету

Огляд методів кластерного аналізу та оцінка їх застосовності для вирішення задачі сегментації споживчого ринку

Анотація

У цій роботі розглянуто статтю про процес сегментації споживчого ринку, визначення системи підтримки рішень, а також застосування кластерного аналізу в різних сферах діяльності, поширений набір методів кластерного аналізу для вирішення завдань маркетингу.

Ключові слова:Сегментація, кластерний аналіз, Data Mining, підтримка ухвалення рішень. Segmentation, cluster analysis, Data Mining, decision support.

Сучасний зміст процесу сегментації ринку є наслідком еволюції концепції маркетингу. Перш ніж виробник став розглядати ринок як диференційовану структуру в залежності від груп споживачів та споживчих властивостей товару його погляди, і свідомість пройшли через різні методи маркетингу: масовий, товарно-диференційований, цільовий.

Ринкова сегментація є, з одного боку, метод перебування частин ринку й визначення об'єктів, куди спрямовано маркетингова діяльність підприємств. З іншого боку, – це управлінський підхід до процесу прийняття підприємством рішень над ринком, основа вибору правильного поєднання елементів маркетингу.

Об'єктами сегментації є насамперед споживачі. Виділені особливим чином, які мають певні загальні ознаки вони становлять сегмент ринку. Основна увага в маркетингу приділяється пошуку однорідних груп споживачів, які мають подібні переваги і однаково реагують на рекламні пропозиції.

Для успішної реалізації принципів сегментації є такі умови:

- Здатність підприємства (організації) здійснювати диференціацію структури маркетингу (цін, способів стимулювання збуту, місця продажу, продукції);

- Вибраний сегмент повинен бути досить стійким, ємним і мати перспективи зростання;

– підприємство має мати у своєму розпорядженні дані про обраний сегмент, виміряти його характеристики та вимоги;

- Вибраний сегмент повинен бути доступним для підприємства, тобто мати відповідні канали збуту та розподілу продукції, систему доставки виробів;

– підприємство повинне мати контакт із сегментом (наприклад, через канали особистої та масової комунікації);

– оцінити захищеність обраного сегменту від конкуренції, визначити сильні та слабкі сторони конкурентів та власні переваги у конкурентній боротьбі.

Таким чином – тільки при достатньому вивченні обраного сегмента та оцінивши власний потенціал, виробник може ухвалити рішення про вибір сегмента.

Data Mining - мультидисциплінарна область, що виникла і розвивається на базі таких наук як прикладна статистика, розпізнавання образів, штучний інтелект, теорія баз даних та ін.

Data Mining – це процес підтримки прийняття рішень, заснований на пошуку даних прихованих закономірностей.

Data Mining – це процес виявлення у сирих даних раніше невідомих, нетривіальних, практично корисних і доступних інтерпретації знань, необхідні прийняття рішень у різних сферах людської діяльності.

Кластерний аналіз застосовується у різних галузях. Він корисний, коли потрібно класифікувати велику кількість інформації.

У маркетингу це може бути завдання сегментації конкурентів та споживачів. У маркетингових дослідженнях кластерний аналіз застосовується досить широко – як і теоретичних дослідженнях, і практикуючими маркетологами, вирішальними проблеми угруповання різних об'єктів. При цьому вирішуються питання про групи клієнтів, продуктів і т. д. Так, одним з найбільш важливих завдань при застосуванні кластерного аналізу в маркетингових дослідженнях є аналіз поведінки споживача, а саме: угруповання споживачів у однорідні класи для отримання максимально повного уявлення про поведінку клієнта кожної групи та про фактори, що впливають на його поведінку.

Важливим завданням, яке може вирішити кластерний аналіз, є позиціонування, тобто визначення ніші, в якій слід позиціонувати новий продукт, який пропонується на ринку. В результаті застосування кластерного аналізу будується карта, за якою можна визначити рівень конкуренції в різних сегментах ринку та відповідні характеристики товару для можливості влучення в цей сегмент. За допомогою аналізу такої карти можливе визначення нових, незайнятих ніш на ринку, в яких можна пропонувати існуючі товари або розробляти нові.

У сфері маркетингу Data Mining знаходить широке застосування.

Основні питання маркетингу "Що продається?", "Як продається?", "Хто є споживачем?" У лекції, присвяченій завданням класифікації та кластеризації, докладно описано використання кластерного аналізу для вирішення завдань маркетингу, як, наприклад, сегментація споживачів.

Інший поширений набір методів для вирішення завдань маркетингу – методи та алгоритми пошуку асоціативних правил. Також успішно тут використовують пошук тимчасових закономірностей.

У сфері роздрібної торгівлі, як і в маркетингу, застосовуються:

– алгоритми пошуку асоціативних правил (для визначення найпоширеніших наборів товарів, які покупці купують одночасно). Виявлення таких правил допомагає розміщувати товари на прилавках торгових залів, виробляти стратегії закупівлі товарів та їх розміщення на складах тощо.

- Використання тимчасових послідовностей, наприклад, для визначення необхідних обсягів запасів товарів на складі.

– методи класифікації та кластеризації для визначення груп чи категорій клієнтів, знання яких сприяє успішному просуванню товарів.

Література

  1. Алексєєв А. А. «Методика сегментування споживачів», / / ​​«Маркетинг та маркетингові дослідження в Росії», № 1,2009
  2. Басовський Л. Є. «Маркетинг», Москва, ІНФРА М, 2009, - 426 с.
  3. Гольцов А. У. «Перспективи використання стратегічного маркетингу для підприємства». // «Маркетинг», 2008, № 2., с. 72-89.
  4. Крофт М. Д. "Сегментування ринку". Санкт-Петербург, «Пітер», 2008 - 128 с.
  5. Резніченко Б. А. «Критичний аналіз критеріїв сегментування», «Маркетинг у Росії та за кордоном», №3,2009 р.

Методи сегментування

Можна виділити деякі "базові" методи сегментування. Найважливішим із них є кластерний аналіз споживачів (таксономія). Кластери споживачів формуються об'єднанням у групу тих, хто дає подібні відповіді ці запитання. Покупці можуть бути об'єднані у кластер, якщо вони мають подібний вік, дохід, звички тощо. Подібність між покупцями ґрунтується на різних вимірювачах, але часто як міра подібності використовується зважена зуміла квадрата відмінностей між відповідями покупців на питання. Виходом алгоритмів кластеризації може бути ієрархічні дерева чи об'єднання споживачів у групи. Існує досить багато кластерних алгоритмів.

Наприклад, США широко поширений кластерний аналіз систем, званий PRIZM , який починає кластеризацію, скорочуючи набір із 1000 можливих соціально-демографічних показників. Ця система формує соціально-демографічні сегменти для всієї території США. Так, виділено кластер 28 - сім'ї, які потрапили до цього кластера, включають осіб із найбільш успішною професійною чи управлінською кар'єрою. Цей кластер також відбиває високий дохід, освіту, власність, приблизно середній вік. Хоча цей кластер становить лише 7% населення США, він є критичним для підприємців, які продають дорогі товари.


Існують інші приклади сегментації споживачів з урахуванням кластерного аналізу. Наприклад, серед "психологічних" секторів дуже важливе місце посідає "ставлення споживача до новизни товару" (рис. 3).

Малюнок 3

Як видно з наведених даних, найбільше споживачів належить до звичайних покупців.

Сегментація споживачів з урахуванням кластерного аналізу є " класичним " методом. У той самий час існують прийоми сегментування ринку з урахуванням так званої " продуктової сегментації " чи сегментації ринку за параметрами продукції. Вона має особливо важливе значення при випуску та збуті нових виробів. Особливого значення набуває сегментація за продуктом, що базується на вивченні довгострокових тенденцій на ринку. Процес розробки та виробництва нового виробу, завершення великих інвестиційних програм вимагають досить тривалого періоду, і правильність результатів аналізу ринку, оцінки його ємності тут є особливо важливою. В умовах роботи на традиційний ринок стандартної продукції розрахунок його ємності може бути здійснений шляхом використання методу підсумовування ринків. У сучасних умовах підвищення своєї конкурентоспроможності та правильного визначення ємності ринку підприємству вже недостатньо проводити сегментацію ринку тільки в одному напрямку - визначення груп споживачів за якимись ознаками. У рамках інтегрованого маркетингу необхідна ще й сегментація самого виробу за найважливішими для його просування на ринку параметрами. З цією метою використовується метод складання функціональних карт- Проведення свого роду подвійної сегментації, по виробу та споживачеві.

Функціональні карти можуть бути однофакторними (сегментація проводиться за якимось одним фактором і для однорідної групи виробів) і багатогофакторними (аналіз того, для яких груп споживачів призначена конкретна модель виробів і які її параметри найбільш важливі для просування продукції на ринку). функціональних карт можна визначити який сегмент ринку розраховано даний виріб, які його функціональні параметри відповідають тим чи іншим запитам споживачів.

При розробці нової продукції дана методика передбачає, що повинні враховуватись всі фактори, що відображають систему споживчих переваг, і одночасно технічні параметри нового виробу, за допомогою яких можна задовольнити запити споживача; визначаються групи споживачів, кожна зі своїм набором запитів та переваг; всі обрані чинники ранжуються за рівнем значимості кожної із груп споживачів.

Такий підхід дозволяє вже на стадії розробки побачити, які параметри виробу потребують конструкторського доопрацювання, або визначити, чи є достатньо ємний ринок для даної моделі.

Наведемо приклад подібного аналізу ринку стосовно проекту, що розробляється комп'ютерів "Apple" (Таб. 1) (див. наступну сторінку)

Таблиця 1." Сегментація ринку персональних комп'ютерів та фактори, що враховуються при розробці виробів для нього (1982) "

Чинники Сегменти ринку за групами споживачів Модель
Будинки В школі У вузі В дім. кабінеті У дрібному бізнесі У корпорації А У
Технічні хар-ки * * *** ** ** ** *** **
Ціна *** *** ** *** *** ** 0 **
Особливі якості * * ** * * * ** *
Надійність ** * * ** ** * 0 **
Зручність у ісп-ії ** ** * ** * 0 *** ***
Сумісність 0 0 0 0 0 *** 0 0
Периф-е обладнання 0 0 0 0 0 *** 0 0
Прог-е забезпечення * * ** ** ** *** * **

*** - дуже важливий фактор

** - важливий фактор

* - маловажливий фактор

0 – незначний фактор

Цей нескладний аналіз показує, що модель А – комп'ютер без ринку, а модель В – найбільш підходящий продукт для університетів та дрібного бізнесу.

Компанія свого часу поставила на комп'ютер А та програла.

Взагалі, у світовій практиці використовуються 2 принципові підходи до маркетингового сегментування - (дивись: загальна схема сегментного аналізу (рис. 4)) (наступна сторінка)



У межах першого методу. іменованого "а рriory" попередньо відомі ознаки сегментування, чисельність сегментів, їх кількість, характеристики, карта інтересів. Тобто мається на увазі, що сегментні групи у цьому методі вже сформовані. Метод "а рriory" використовують у тих випадках, коли сегментування не є частиною поточного дослідження, а служить допоміжним базисом при вирішенні інших маркетингових завдань. Іноді цей метод застосовують за дуже чіткої визначеності сегментів ринку, коли варіантність сегментів ринку не висока. "A priory" припустимо і для формування нового продукту, орієнтованого на відомий сегмент ринку.

В рамках другого методу, що називається "post hoc (cluster based), мається на увазі невизначеність ознак сегментування і сутності самих сегментів. Дослідник попередньо вибирає ряд інтерактивних по відношенню до респондента (метод передбачає проведення опитування) змінних і далі залежно від висловленого ставлення до певної груп респонденти відносяться до відповідного сегмента, при цьому карта інтересів, виявлена ​​в процесі подальшого аналізу, розглядається як вторинна, цей метод застосовують при сегментуванні споживчих ринків, сегментна структура яких не визначена щодо продукту, що продається.

Сегментування за методом a priory "

При виборі кількості сегментів, яку має бути розбитий ринок, зазвичай керуються цільової функцією - визначення найперспективнішого сегмента. Вочевидь, зайвим для формування вибірки є включення до неї сегментів, чий купівельний потенціал досить малий стосовно досліджуваному виробу. Кількість сегментів, як свідчать дослідження, має перевищувати 10, перевищення зазвичай пов'язані з зайвою деталізацією ознак сегментування і веде до непотрібного " розмивання " ознак.

Наприклад, при сегментації за рівнем доходу рекомендується розбивка всіх потенційних покупців на рівні за обсягом сегменти, з урахуванням того, щоб обсяг кожного з сегментів був, принаймні, не меншим від очікуваного обсягу реалізації послуг, заснованого на знанні виробничих потужностей підприємства. Найбільш вдалим прикладом, що пояснює сказане вище і демонструє можливість розбивки потенційних споживачів на стійкі сегментні групи, може послужити сегментація населення за ознакою доходу, коли все населення розбивається на п'ять 20% груп. Поданий розподіл обсягу доходів за п'ятьма 20% груп населення наводиться регулярно у статистичних збірниках та зведеннях, аналогічно представленому в табл. 2

Таблиця 2 ."Розподіл обсягу доходів за групами населення. %"

Очевидно зручність роботи з такими сегментними групами, особливо щодо відстеження їх ємності.