روش های تقسیم بندی بازار روش های تقسیم بندی بازار روش تقسیم بندی خوشه ای

من در صنعت بازاریابی ایمیلی برای سایتی به نام MailChimp.com کار می کنم. ما به مشتریان کمک می کنیم تا برای مخاطبان تبلیغاتی خود خبرنامه بسازند. هر بار که کسی کار ما را «پر کردن نامه» می‌نامد، سرمای ناخوشایندی در قلبم احساس می‌کنم.

چرا؟ بله، زیرا آدرس‌های ایمیل دیگر جعبه‌های سیاهی نیستند که شما آن‌ها را با پیام‌هایی مانند نارنجک بمباران کنید. خیر، در بازاریابی ایمیلی (مانند سایر اشکال تماس آنلاین، از جمله توییت‌ها، پست‌های فیس‌بوک، و کمپین‌های پینترست)، کسب‌وکارها از طریق ردیابی کلیک‌ها، سفارش‌های آنلاین، توزیع وضعیت‌ها در شبکه‌های اجتماعی، بینشی درباره نحوه تعامل مخاطبان در سطح فردی کسب می‌کنند. و غیره این داده ها فقط تداخل نیستند. آنها مخاطب شما را مشخص می کنند. اما برای افراد ناآشنا، این عملیات شبیه به حکمت زبان یونانی است. یا اسپرانتو

چگونه داده های تراکنش را از مشتریان خود (کاربران، مشترکین و غیره) جمع آوری می کنید و از داده های آنها برای درک بهتر مخاطبان خود استفاده می کنید؟ وقتی با افراد زیادی سروکار دارید، مطالعه هر مشتری به صورت جداگانه دشوار است، به خصوص اگر همه آنها به طور متفاوتی با شما تماس بگیرند. حتی اگر در تئوری بتوانید شخصاً به همه افراد دسترسی داشته باشید، در عمل این امر امکان پذیر نیست.

شما باید پایگاه مشتریان خود را انتخاب کنید و حد وسطی بین بمباران تصادفی و بازاریابی شخصی برای هر مشتری پیدا کنید. یکی از راه‌های دستیابی به این تعادل، استفاده از خوشه‌بندی برای تقسیم‌بندی بازار مشتریان خود است تا بتوانید برای بخش‌های مختلف پایگاه مشتریان خود با محتوای هدفمند، پیشنهادات و غیره متفاوت جذب کنید.

تجزیه و تحلیل خوشه ای مجموعه ای از اشیاء مختلف و تقسیم آنها به گروه های مشابه است. با کار با این گروه ها - شناسایی وجوه مشترک اعضای آنها و آنچه آنها را متمایز می کند - می توانید چیزهای زیادی در مورد درهم ریختگی داده های خود بیاموزید. این دانش به شما کمک می کند تا تصمیمات بهتر و در سطحی دقیق تر از قبل بگیرید.

در این زمینه، خوشه‌بندی داده‌کاوی اکتشافی نامیده می‌شود، زیرا این تکنیک‌ها به بیرون کشیدن اطلاعات در مورد روابط در مجموعه‌های داده عظیمی که نمی‌توانند به صورت بصری ضبط شوند، کمک می‌کنند. و کشف ارتباطات در گروه های اجتماعی در هر صنعتی مفید است - برای توصیه فیلم بر اساس عادات مخاطب هدف، برای شناسایی مراکز جرم و جنایت در یک شهر، یا توجیه سرمایه گذاری های مالی.

یکی از استفاده‌های مورد علاقه من از خوشه‌بندی، خوشه‌بندی تصاویر است: جمع کردن فایل‌های تصویری که برای رایانه «یکسان به نظر می‌رسند». به عنوان مثال، در سرویس های میزبانی تصویر مانند Flickr، کاربران حجم زیادی محتوا تولید می کنند و به دلیل تعداد زیاد عکس ها، پیمایش ساده غیرممکن می شود. اما با استفاده از تکنیک‌های خوشه‌بندی، می‌توانید تصاویر مشابه را با هم گروه‌بندی کنید و به کاربر این امکان را می‌دهد تا قبل از مرتب‌سازی دقیق، بین این گروه‌ها حرکت کند.

یادگیری ماشینی تحت نظارت یا بدون نظارت؟

در داده کاوی، طبق تعریف، شما از قبل نمی دانید به دنبال چه نوع داده ای هستید. شما یک محقق هستید. شما می توانید به وضوح توضیح دهید که چه زمانی دو مشتری شبیه هم هستند و چه زمانی متفاوت به نظر می رسند، اما بهترین راه برای تقسیم بندی مشتریان خود را نمی دانید. به همین دلیل است که «از رایانه ای بخواهید تا پایگاه مشتری شما را برای شما تقسیم کند، یادگیری ماشینی بدون نظارت نامیده می شود، زیرا شما کنترلی در دست ندارید - شما به رایانه نمی گویید که چگونه کار خود را انجام دهد.

برخلاف این فرآیند، یادگیری ماشینی تحت نظارت وجود دارد که وقتی هوش مصنوعی در صفحه اول قرار می گیرد، ظاهر می شود. اگر بدانم که می‌خواهم مشتریان را به دو گروه تقسیم کنم - مثلاً «احتمال خرید» و «بعید است بخرم» - و رایانه را با نمونه‌های تاریخی چنین مشتریانی تغذیه کنم و همه نوآوری‌ها را در یکی از این گروه‌ها اعمال کنم، پس این کنترل است.

اگر به جای آن می‌گفتم: «در اینجا چیزی است که درباره مشتریانم می‌دانم و در اینجا نحوه تشخیص تفاوت یا یکسان بودن آنها آمده است. چیز جالبی به من بگو، این عدم کنترل است.

این فصل ساده‌ترین روش خوشه‌بندی به نام k-means را بررسی می‌کند که به دهه 50 برمی‌گردد و از آن زمان به یکی از اصلی‌ترین روش‌های کشف دانش پایگاه داده (DKD) در تمام صنایع و سازمان‌های دولتی تبدیل شده است.

روش k-means از نظر ریاضی دقیق ترین روش در بین همه روش ها نیست. این در درجه اول به دلایل عملی و عقل سلیم ایجاد شد - مانند یک آشپزخانه آفریقایی-آمریکایی. این شجره نامه شیکی مانند فرانسوی ندارد، اما اغلب به هوس های خوراکی ما پاسخ می دهد. تحلیل خوشه‌ای با k-means، همانطور که به زودی خواهید دید، بخشی از ریاضی و بخشی از تاریخ است (در مورد رویدادهای گذشته یک شرکت، اگر این مقایسه برای روش‌های آموزش مدیریت اعمال شود). مزیت بدون شک آن سادگی بصری آن است.

بیایید ببینیم این روش با استفاده از یک مثال ساده چگونه کار می کند.

دختران با دختران می رقصند، پسرها سر خود را می خارند

هدف از خوشه‌بندی k-means انتخاب چندین نقطه در فضا و تبدیل آنها به گروه k است (که k هر عددی است که انتخاب می‌کنید). هر گروه با یک نقطه در مرکز تعریف می شود، مانند پرچمی که در ماه گیر کرده و علامت می دهد: «هی، اینجا مرکز گروه من است! اگر به این پرچم از بقیه نزدیکترید، بپیوندید!» این مرکز گروه (به طور رسمی به آن مرکز خوشه ای می گویند) میانگین نام روش k-means است.

بیایید رقص های مدرسه را به عنوان مثال در نظر بگیریم. اگر توانسته اید وحشت این "سرگرمی" را از حافظه خود پاک کنید، بسیار متاسفم که چنین خاطرات دردناکی را یادآوری می کنم.

قهرمانان نمونه ما - دانش آموزان دبیرستان مااکنه که به یک شب رقص با نام عاشقانه "توپ در ته دریا" آمدند - همانطور که در شکل نشان داده شده است در اطراف سالن اجتماعات پراکنده شده اند. 1. من حتی کف پارکت را در فتوشاپ رنگ کردم تا بتوانم شرایط را راحت تر تصور کنم.

برنج. 1.دانش آموزان دبیرستان مککنه در سالن می نشینند

در اینجا نمونه هایی از آهنگ هایی وجود دارد که این رهبران جوان دنیای آزاد به طور ناشیانه ای با آنها می رقصند (اگر به طور ناگهانی می خواهید موسیقی همراهی کنید، مثلاً در Spotify):

Styx: بیا با بادبان برو
همه چیز جز دختر: گم شده
Ace of Base: All That She Wants
سلول نرم: عشق آلوده
مونتل جردن: ما این کار را چگونه انجام می دهیم
ایفل 65: آبی

اکنون خوشه بندی k-means به تعداد خوشه هایی بستگی دارد که می خواهید افراد حاضر را به آنها تقسیم کنید. بیایید با سه خوشه شروع کنیم (ما بعداً در این فصل به انتخاب k خواهیم پرداخت). این الگوریتم همانطور که در شکل نشان داده شده است، سه پرچم را به روشی قابل قبول در کف سالن اجتماعات قرار می دهد. 2، جایی که 3 پرچم اولیه را می بینید که بر اساس جنسیت توزیع شده و با دایره های سیاه مشخص شده اند.

برنج. 2.قرار دادن مراکز خوشه اولیه

در خوشه‌بندی k-means، رقصنده‌ها به نزدیک‌ترین مرکز خوشه خود اختصاص داده می‌شوند، به طوری که می‌توان یک خط مرزی بین هر دو مرکز روی زمین ترسیم کرد. بنابراین، اگر رقصنده در یک طرف خط باشد، او به یک گروه تعلق دارد، اگر در طرف دیگر، سپس به گروه دیگر (مانند شکل 3).

برنج. 3.خطوط مرزهای خوشه را مشخص می کنند

با استفاده از این خطوط مرزی، رقصنده ها را به گروه ها تقسیم کنید و آنها را مطابق شکل رنگ آمیزی کنید. 4. این نمودار که فضا را به چند ضلعی تقسیم می کند که با نزدیکی به یک مرکز خوشه مشخص است، نمودار Voronoi نامیده می شود.

برنج. 4.گروه بندی به خوشه هایی که با الگوهای پس زمینه مختلف در نمودار ورونوی مشخص شده اند

بیایید به تقسیم بندی اولیه خود نگاه کنیم. چیزی اشتباه است، اینطور نیست؟ فضا به روشی نسبتاً عجیب تقسیم شده است: گروه پایین سمت چپ خالی می ماند و در مرز گروه بالا سمت راست، برعکس، افراد زیادی وجود دارند.

الگوریتم خوشه‌بندی k-means مراکز خوشه‌ها را بین جنسیت‌ها حرکت می‌دهد تا زمانی که به بهترین نتیجه برسد.

چگونه می توان "بهترین نتیجه" را تعیین کرد؟ هر فرد حاضر مقداری از مرکز خوشه خود فاصله دارد. هرچه میانگین فاصله شرکت کنندگان تا مرکز گروهشان کمتر باشد، نتیجه بهتری حاصل می شود.

اکنون کلمه "به حداقل رساندن" را معرفی می کنیم - در بهینه سازی مدل برای بهترین مکان مراکز خوشه برای شما بسیار مفید خواهد بود. در این فصل، «یافتن راه‌حل» را مجبور خواهید کرد بارها و بارها مراکز خوشه‌ای را جابجا کند. روشی که Solution Finder برای یافتن بهترین مکان برای مراکز خوشه استفاده می کند این است که به آرامی و به طور مکرر آنها را در اطراف سطح حرکت می دهد، بهترین نتایج یافت شده را می گیرد و آنها را ترکیب می کند (به معنای واقعی کلمه آنها را مانند اسب های مسابقه جفت می کند) تا بهترین مکان را پیدا کند.

بنابراین اگر نمودار در شکل. 4 نسبتاً کم رنگ به نظر می رسد، "جستجوی راه حل" می تواند به طور ناگهانی مراکز را مانند شکل 1 مرتب کند. 5. با این کار فاصله متوسط بین هر رقصنده و مرکز او کمی کاهش می یابد.

برنج. 5.مرکزها را کمی جابجا کنید

بدیهی است که دیر یا زود Solution Finder متوجه خواهد شد که مراکز باید در وسط هر گروه از رقصندگان قرار گیرند، همانطور که در شکل نشان داده شده است. 6.

برنج. 6.خوشه بندی بهینه در رقص های مدرسه

عالی! این همان چیزی است که خوشه بندی ایده آل به نظر می رسد. مراکز خوشه ای در مرکز هر گروه از رقصندگان قرار دارند و میانگین فاصله بین یک رقصنده و نزدیکترین مرکز را به حداقل می رساند. اکنون که خوشه بندی کامل شده است، وقت آن است که به قسمت سرگرم کننده بپردازیم، که تلاش برای درک معنای این خوشه ها است.

اگر رنگ موی رقصندگان، ترجیحات سیاسی آنها یا زمان آنها در دوی 100 متر را می دانید، پس خوشه بندی چندان منطقی نیست.

اما زمانی که تصمیم گرفتید سن و جنسیت افراد حاضر را تعیین کنید، روندهای کلی را مشاهده خواهید کرد. گروه کوچک زیر افراد مسن تر هستند که به احتمال زیاد افراد همراه هستند. گروه سمت چپ همه پسر هستند و گروه سمت راست همه دختر هستند. و همه از رقصیدن با یکدیگر بسیار می ترسند.

بنابراین، k-means به شما این امکان را می‌دهد که بسیاری از رقص‌بازان را به گروه‌هایی تقسیم کنید و ویژگی‌های هر شرکت‌کننده را با عضویت در یک خوشه خاص مرتبط کنید تا دلیل تقسیم را بفهمید.

حالا احتمالاً با خود می گویید: «بیا، چه مزخرفی. من قبلاً جواب را قبل از شروع می دانستم.» حق با شماست. در این مثال - بله. من عمداً چنین مثال "اسباب بازی" را آوردم، مطمئن بودم که فقط با نگاه کردن به نقاط می توانید آن را حل کنید. عمل در فضایی دو بعدی اتفاق می افتد که در آن خوشه بندی به سادگی با کمک چشم انجام می شود.

اما اگر فروشگاهی را اداره کنید که هزاران محصول را به فروش می رساند چه؟ برخی از خریداران در دو سال اخیر یک یا دو خرید انجام داده اند. دیگران - ده ها. و هر کس چیزی از خودش خرید.

چگونه آنها را در چنین "پیست رقص" دسته بندی می کنید؟ بیایید با این واقعیت شروع کنیم که این پیست رقص دو بعدی یا حتی سه بعدی نیست. این یک فضای هزار بعدی برای فروش کالایی است که خریدار در هر بعد کالا را خریداری کرده یا نخریده است. همانطور که دوستان نظامی من دوست دارند بگویند، می توانید ببینید که مشکل خوشه بندی با چه سرعتی فراتر از توانایی های یک کره چشم درجه یک می رود.

زندگی واقعی: K-Means Clustering در بازاریابی ایمیلی

بیایید به یک مورد خاص تر برویم. من یک بازاریاب ایمیل هستم، بنابراین یک مثال از Mailchimp.com، جایی که در آن کار می کنم، برای شما می زنم. همین مثال با داده‌های خرده‌فروشی، تبدیل ترافیک تبلیغات، رسانه‌های اجتماعی، و غیره کار می‌کند. تقریباً با هر نوع داده‌ای که مربوط به دستیابی به مشتریان با مطالب تبلیغاتی است، تعامل دارد، پس از آن آنها شما را بدون قید و شرط انتخاب می‌کنند.

عمده فروشی Wine Empire Joey Bag O'Donuts

برای لحظه ای تصور کنید که در نیوجرسی زندگی می کنید، جایی که امپراتوری شراب عمده فروشی Joey Bag O'Donuts را اداره می کنید. این یک تجارت واردات و صادرات است که هدف آن ارسال مقادیر زیادی شراب از خارج از کشور و فروش آن به مشروب فروشی های خاص در سراسر جهان است. روش کار این تجارت به این صورت است که جوی به سرتاسر جهان سفر می‌کند و به دنبال معاملات باورنکردنی بر روی مقدار زیادی شراب است، او آن را به خانه‌اش در جرسی می‌فرستد و این به شما بستگی دارد که آن را در فروشگاه‌ها قرار دهید و سود کسب کنید.

شما مشتریان را به طرق مختلف پیدا می کنید: یک صفحه فیس بوک، یک حساب توییتر، گاهی اوقات حتی ایمیل مستقیم - بالاخره ایمیل ها اکثر انواع کسب و کار را "ترویج" می کنند. سال گذشته هر ماه یک ایمیل ارسال کردید. معمولاً هر حرف دو یا سه معامله را توصیف می کند، مثلاً یکی برای شامپاین و دیگری برای malbec. برخی از معاملات شگفت انگیز هستند - 80٪ تخفیف یا بیشتر. در نتیجه شما حدود 32 تراکنش را در یک سال منعقد کردید و همه آنها کم و بیش بدون مشکل پیش رفتند.

اما فقط به این دلیل که همه چیز خوب پیش می رود به این معنی نیست که نمی توانند بهتر شوند. این مفید خواهد بود که انگیزه های مشتریان خود را کمی عمیق تر درک کنید. البته با نگاهی به یک سفارش مشخص، می بینید که فلان آدامز در ماه جولای مقداری شراب گازدار با 50 درصد تخفیف خریده است، اما نمی توانید تعیین کنید که چه چیزی او را به خرید ترغیب کرده است. آیا او حداقل مقدار سفارش یک جعبه شش بطری را دوست داشت یا قیمتی که هنوز به حداکثر افزایش نیافته بود؟

خوب است که بتوانید لیست مشتریان خود را به گروه های ذینفع تقسیم کنید. سپس می توانید نامه های هر گروه را به طور جداگانه ویرایش کنید و شاید کسب و کار خود را بیشتر تبلیغ کنید. هر معامله مناسب برای این گروه می تواند موضوع نامه شود و در پاراگراف اول متن ظاهر شود. این نوع ارسال هدفمند می تواند باعث انفجار واقعی در فروش شود!

گزینه ای وجود دارد که به رایانه اجازه می دهد کار را برای شما انجام دهد. با استفاده از خوشه بندی k-means، می توانید بهترین گروه بندی را پیدا کنید و سپس سعی کنید بفهمید که چرا بهترین است.

مجموعه داده اصلی

سند اکسل که در این فصل به تحلیل آن خواهیم پرداخت در وب سایت کتاب قرار دارد. این شامل تمام داده های منبع در صورتی که می خواهید با آن کار کنید. یا می توانید به سادگی متن را با نگاه کردن به برگه های باقیمانده سند دنبال کنید.

برای شروع، شما دو منبع داده جالب دارید:

ابرداده برای هر سفارش در یک صفحه گسترده ذخیره می‌شود، از جمله نوع، حداقل مقدار شراب در هر سفارش، تخفیف خرده‌فروشی، اینکه سقف قیمت تصویب شده است یا خیر، و کشور مبدا. این داده ها همانطور که در شکل نشان داده شده است در برگه ای به نام OfferInformation قرار دارند. 7;
با دانستن اینکه کدام مشتریان چه چیزی را سفارش می دهند، می توانید آن اطلاعات را از MailChimp خارج کنید و آن را در یک صفحه گسترده با ابرداده های پیشنهاد در برگه تراکنش ها قرار دهید. این داده های متغیری است که در شکل نشان داده شده است. 8، بسیار ساده: خریدار و سفارش او.

برنج. 7.جزئیات آخرین 32 سفارش

برنج. 8.لیست سفارشات توسط مشتری

تعیین موضوع اندازه گیری

و تکلیف اینجاست. در مسئله رقص مدرسه، اندازه گیری فاصله بین افراد حاضر و شناسایی مراکز خوشه آسان بود، درست است؟ شما فقط باید متر نوار مناسب را پیدا کنید! اما حالا چه باید کرد؟

می دانید که در سال گذشته 32 پیشنهاد معامله وجود داشت و شما لیستی از 324 سفارش را در یک برگه جداگانه به تفکیک خریدار دارید. اما برای اندازه گیری فاصله هر خریدار تا مرکز خوشه، باید آنها را در این فضای 32 معامله قرار دهید. به عبارت دیگر، باید بفهمید که چه معاملاتی را انجام نداده‌اند و یک ماتریس معامله به مشتری ایجاد کنید که در آن هر مشتری ستون خود را با 32 سلول معامله پر از یک در صورت تکمیل معاملات و صفر در صورت تکمیل شدن آن، دریافت می‌کند. 't.

به عبارت دیگر، شما باید این جدول معاملات ردیف‌گرا را بگیرید و آن را به یک ماتریس تبدیل کنید که مشتریان به صورت عمودی و پیشنهادات به صورت افقی چیده شده‌اند. بهترین راه برای ایجاد آن با جداول محوری است.

الگوریتم اقدام: در برگه دارای داده های متغیر، ستون های A و B را انتخاب کنید و سپس جدول محوری را وارد کنید. با استفاده از PivotTable Wizard، به سادگی Deals را به عنوان سرصفحه ردیف و Customers را به عنوان سر ستون انتخاب کنید و جدول را پر کنید. اگر جفت معامله مشتری وجود داشته باشد سلول 1 خواهد بود و اگر وجود نداشته باشد 0 خواهد بود (در این حالت 0 به عنوان یک سلول خالی نشان داده می شود). نتیجه جدول نشان داده شده در شکل است. 9.

برنج. 9.جدول خلاصه معامله مشتری

اکنون که اطلاعات سفارش خود را در قالب ماتریس دارید، برگه OfferInformation را کپی کنید و نام آن را Matrix بگذارید. در این کاربرگ جدید، مقادیر را از جدول محوری (نیازی به کپی و چسباندن شماره معامله نیست، زیرا از قبل در اطلاعات سفارش وجود دارد)، با ستون H شروع کنید. با اطلاعات سفارش مانند شکل 10.

برنج. 10.توضیحات تراکنش ها و داده های سفارش در یک ماتریس ادغام شدند

استاندارد سازی داده ها

این فصل هر بعد از داده‌های شما را به همان شیوه، به عنوان اطلاعات سفارش باینری، ارائه می‌کند. اما در بسیاری از موقعیت‌های مربوط به خوشه‌بندی، ما نمی‌توانیم این کار را انجام دهیم. سناریویی را تصور کنید که در آن افراد بر اساس قد، وزن و حقوق دسته بندی می شوند. هر سه نوع داده دارای ابعاد مختلفی هستند. قد می تواند از 1.5 تا 2 متر متغیر باشد، در حالی که وزن می تواند بین 50 تا 150 کیلوگرم باشد.

در این زمینه، اندازه گیری فاصله بین مشتریان (مانند رقصندگان در سالن اجتماعات) به یک موضوع گیج کننده تبدیل می شود. بنابراین، معمول است که هر ستون از داده ها را با تفریق میانگین و سپس تقسیم به نوبه خود بر معیاری از پراکندگی به نام انحراف استاندارد، استاندارد کنیم. بنابراین، تمام ستون‌ها به یک مقدار کاهش می‌یابند که از نظر کمی در حدود ۰ تغییر می‌کند.

بیایید با چهار خوشه شروع کنیم

خوب، اکنون تمام داده های شما به یک قالب مناسب کاهش می یابد. برای شروع خوشه بندی، باید k را انتخاب کنید - تعداد خوشه ها در الگوریتم k-means. یک روش رایج برای استفاده از k-means این است که مجموعه ای از k های مختلف را بردارید و آنها را یکی یکی آزمایش کنید (چگونگی انتخاب آنها را بعداً توضیح خواهم داد)، اما ما تازه شروع کرده ایم - بنابراین فقط یکی را انتخاب می کنیم. .

شما به تعدادی خوشه نیاز دارید که تقریباً برای کاری که می خواهید انجام دهید مناسب باشد. بدیهی است که شما قصد ایجاد 50 کلاستر و ارسال 50 ایمیل تبلیغاتی هدفمند به چند نفر از هر گروه را ندارید. این بلافاصله هدف تمرین ما را شکست می دهد. در مورد ما، ما به چیزی کوچک نیاز داریم. این مثال را با 4 شروع کنید - در یک دنیای ایده آل، احتمالاً لیست مشتریان خود را به 4 گروه واضح 25 نفره تقسیم می کنید (که در واقعیت بعید است).

بنابراین، اگر باید خریداران را به 4 گروه تقسیم کنید، بهترین راه برای انتخاب آنها چیست؟

به جای خراب کردن صفحه زیبای Matrix، داده ها را در یک صفحه جدید کپی کنید و آن را 4MC بنامید. اکنون می توانید 4 ستون را بعد از قیمت بالا در ستون های H تا K قرار دهید که مراکز خوشه خواهند بود. (برای درج یک ستون، روی ستون H کلیک راست کرده و Insert را انتخاب کنید. ستون در سمت چپ ظاهر می شود.) نام این خوشه ها را از Cluster 1 تا Cluster 4 بگذارید. همچنین می توانید قالب بندی شرطی را روی آنها اعمال کنید و هر زمان که آنها را نصب کنید، می توانید آنها را انتخاب کنید. می توانید ببینید که چقدر متفاوت هستند.

ورق 4MC همانطور که در شکل نشان داده شده است ظاهر می شود. یازده

برنج. یازدهمراکز خوشه خالی روی یک صفحه 4MC قرار داده شده است

در این حالت تمام مراکز خوشه صفر هستند. اما از نظر فنی آنها می توانند هر چیزی باشند و آنچه شما بخصوص دوست دارید - مانند رقص مدرسه، به گونه ای توزیع می شوند که فاصله بین هر خریدار و مرکز خوشه او را به حداقل می رساند.

بدیهی است که این مراکز برای هر تراکنش دارای مقادیری از 0 تا 1 خواهند بود، زیرا همه بردارهای مشتری باینری هستند.

اما "اندازه گیری فاصله بین مرکز خوشه و مشتری" به چه معناست؟

فاصله اقلیدسی: اندازه گیری مستقیم فواصل

برای هر مشتری یک ستون جداگانه دارید. چگونه فاصله بین آنها را اندازه گیری کنیم؟ در هندسه این را «کوتاه ترین مسیر» و فاصله حاصل را فاصله اقلیدسی می نامند.

بیایید لحظه ای به سالن اجتماعات برگردیم و سعی کنیم بفهمیم چگونه مشکل خود را در آنجا حل کنیم.

بیایید محورهای مختصات را روی زمین قرار دهیم و در شکل. 12 خواهیم دید که در نقطه (8،2) یک رقصنده داریم، و در (4،4) یک مرکز خوشه داریم. برای محاسبه فاصله اقلیدسی بین آنها، باید قضیه فیثاغورث را که از دوران مدرسه با آن آشنا بوده اید، به خاطر بسپارید.

برنج. 12.رقصنده در (8،2) و مرکز خوشه در (4،4)

این دو نقطه به صورت عمودی 8 - 4 = 4 متر و به صورت افقی 4 - 2 = 2 متر فاصله دارند. بر اساس قضیه فیثاغورث، مجذور فاصله بین دو نقطه 4A2+2A2 = 20 متر است. از اینجا ما خود فاصله را محاسبه می کنیم که برابر با جذر 20 خواهد بود که تقریباً 4.47 متر است (مانند شکل 13).

برنج. 13.فاصله اقلیدسی برابر است با جذر مجموع فواصل در هر جهت

در زمینه مشترکان خبرنامه، شما بیش از دو بعد دارید، اما همین مفهوم صدق می کند. فاصله بین خریدار و مرکز خوشه با گرفتن تفاوت بین دو امتیاز برای هر معامله، مجذور کردن آنها، جمع کردن آنها و گرفتن جذر محاسبه می شود. به عنوان مثال، در کاربرگ 4MS، می خواهید فاصله اقلیدسی بین مرکز خوشه 1 در ستون H و سفارشات آدامز مشتری در ستون L را بدانید.

در سلول L34، تحت دستورات آدامز، می‌توانید تفاوت بین بردار آدامز و مرکز خوشه را محاسبه کنید، آن را مربع کنید، اضافه کنید و سپس با استفاده از فرمول زیر برای آرایه‌ها ریشه کنید (به پیوندهای مطلق توجه کنید، به شما امکان می‌دهد این را بکشید. فرمول به سمت راست یا پایین بدون تغییر پیوند به مرکز خوشه):

(=ROOT(SUM(L$2:L$33-$H$2:$H$33)A2)))

فرمول آرایه (فرمول را تایپ کنید و Ctrl+Shift+Enter یا Cmd+Return را در MacOS فشار دهید، همانطور که در فصل 1 بیان شد) باید استفاده شود زیرا قسمت (L2:L33-H2:H33)^2 آن نیاز به " بدانید" با کجا تماس بگیرید تا تفاوت ها را محاسبه کنید و آنها را مربع کنید، مرحله به مرحله. با این حال، نتیجه در پایان یک عدد واحد است، در مورد ما 1.732 (مانند شکل 14). به این معنی است: آدامز سه معامله انجام داد، اما از آنجایی که مراکز خوشه اولیه صفر هستند، پاسخ برابر با جذر 3 یعنی 1.732 خواهد بود.

برنج. 14.فاصله بین مرکز خوشه 1 و آدامز

در صفحه گسترده در شکل. 2-14، ردیف بالا را (به فصل 1 مراجعه کنید) بین ستون‌های G و H لنگر انداختم و ردیف 34 را در سلول G34 «فاصله تا خوشه 1» نامیدم، فقط برای اینکه بتوانم وقتی صفحه را پایین می‌روم ببینم کجاست.

فاصله ها و عضویت در خوشه برای همه!

اکنون می دانید که چگونه فاصله بین بردار ترتیب و مرکز خوشه را محاسبه کنید.

اکنون زمان آن است که با کشیدن سلول L34 به L37 و سپس تغییر دستی مرجع مرکز خوشه از ستون H به ستون I، J و K در سلول های زیر، محاسبه فاصله ها را به مراکز خوشه باقیمانده اضافه کنیم. نتیجه باید 4 فرمول زیر در L34:L37 باشد:

(=SQRT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=SQRT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2)))
(=ROOT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=ROOT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2)))

از آنجایی که از پیوندهای مطلق برای مراکز خوشه استفاده کردید (همانطور که در فصل 1 توضیح داده شد علامت $ در فرمول ها به این معنی است)، می توانید L34:L37 را به DG34:DG37 بکشید تا فاصله هر مشتری تا هر چهار مرکز خوشه را محاسبه کنید. ردیف‌های ستون G را در خانه‌های 35 تا 37 «فاصله تا خوشه 2» و غیره عنوان کنید. فواصل محاسبه‌شده جدید در شکل نشان داده شده‌اند. 15.

برنج. 15.محاسبه فاصله هر خریدار تا کلیه مراکز خوشه

اکنون فاصله هر مشتری تا هر چهار مرکز خوشه را می دانید. توزیع آنها به خوشه ها با توجه به کوتاه ترین فاصله در دو مرحله به شرح زیر انجام شد.

ابتدا اجازه دهید به آدامز در ستون L برگردیم و حداقل فاصله تا مرکز خوشه در سلول L38 را محاسبه کنیم. ساده است:

حداقل (L34:L37)
=min(L34:L37)

برای محاسبه، از فرمول match/searchpose استفاده می کنیم (جزئیات بیشتر در فصل 1). با قرار دادن آن در L39 می توانید شماره سلول را از بازه L34:L37 مشاهده کنید (من هر کدام را به ترتیب از 1 می شمارم) که در حداقل فاصله است:

Match(L38,L34:L37,0) =searchpose(L38,L34:L37,0)

در این حالت، فاصله برای هر چهار خوشه یکسان است، بنابراین فرمول اولین خوشه (L34) را انتخاب می کند و 1 را برمی گرداند (شکل 16).

برنج. 16.افزودن صحافی های خوشه ای به ورق

همچنین می توانید این دو فرمول را روی DG38 بکشید و رها کنید: DG39. برای سازماندهی بیشتر، عنوان ردیف‌های 38 و 39 را به خانه‌های 38 و 39 ستون G، «حداقل فاصله خوشه‌ای» و «خوشه اختصاص‌یافته» اضافه کنید.

یافتن راه حل برای مراکز خوشه ای

صفحه گسترده شما با محاسبات فاصله و پیوند به خوشه ها به روز شده است. حال، برای ایجاد بهترین موقعیت مراکز خوشه، باید مقادیری را در ستون‌های H تا K پیدا کنیم که فاصله کل بین خریداران و مراکز خوشه‌ای را که در خط 39 نشان داده شده است، به حداقل می‌رساند. هر خریدار

با شنیدن کلمه "به حداقل رساندن": مرحله بهینه سازی شروع می شود و بهینه سازی با استفاده از "Solution Search" انجام می شود.

برای استفاده از Find a Solution، به یک سلول نتایج نیاز دارید، بنابراین در A36 ما تمام فواصل بین مشتریان و مراکز خوشه آنها را خلاصه می کنیم:

SUM(L38:DG38)
=CUMMA(L3 8:DG3 8)

این مجموع فواصل از مشتریان تا نزدیکترین مراکز خوشه ای آنها دقیقاً همان تابع هدفی است که قبلاً در طول خوشه بندی سالن دبیرستان مککنه با آن مواجه شدیم. اما فاصله اقلیدسی، با توان ها و ریشه های مربعی اش، یک تابع غیرخطی هیولایی است، بنابراین شما باید به جای روش سیمپلکس از یک الگوریتم حل تکاملی استفاده کنید.

شما قبلا از این روش در فصل 1 استفاده کرده اید. الگوریتم سیمپلکس، اگر امکان استفاده از آن وجود داشته باشد، سریعتر از سایرین کار می کند، اما نمی توان از آن برای محاسبه ریشه، مربع و سایر توابع غیر خطی استفاده کرد. OpenSolver که از یک الگوریتم سیمپلکس استفاده می کند، حتی اگر به نظر می رسد که استروئید مصرف کرده است، به همان اندازه بی فایده است.

در مورد ما، الگوریتم تکاملی که در Solution Finder تعبیه شده است، از ترکیبی از جستجوی تصادفی و یک راه حل تلاقی عالی برای یافتن راه حل های کارآمد، مانند تکامل در زمینه بیولوژیکی استفاده می کند.

قبل از «جستجوی راه‌حل» همه چیز لازم برای تنظیم مشکل را دارید:

هدف: به حداقل رساندن کل فاصله از مشتریان تا مراکز خوشه آنها (A36).
متغیرها: بردار هر تراکنش نسبت به مرکز خوشه (H2:K33).
شرایط: مراکز خوشه باید مقادیری از 0 تا 1 داشته باشند.

توصیه می شود یک "راه حل یاب" و یک چکش داشته باشید. ما وظیفه "جستجوی راه حل" را تعیین کردیم: A36 را با تغییر مقادیر H2:K33 با شرط H2:K33 به حداقل برسانیم.<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

برنج. 17.تنظیمات "Solution Search" برای خوشه بندی 4 مرکزی

اما تنظیم یک مشکل همه چیز نیست. شما باید کمی عرق کنید و با کلیک بر روی دکمه "گزینه ها" در پنجره "جستجوی راه حل" و رفتن به پنجره تنظیمات، گزینه های لازم را برای الگوریتم تکاملی انتخاب کنید. من به شما توصیه می کنم بسته به مدت زمانی که مایلید منتظر بمانید تا "Solution Finder" با وظیفه خود کنار بیاید، حداکثر زمان را روی 30 ثانیه بیشتر تنظیم کنید. در شکل 18 من روی 600 ثانیه (10 دقیقه) تنظیم کردم. به این ترتیب می توانم Find a Solution را اجرا کنم و به ناهار بروم. و اگر می خواهید آن را زودتر قطع کنید، فقط Escape را فشار دهید و با بهترین راه حلی که توانسته است از آن خارج شوید.

برنج. 18.پارامترهای الگوریتم تکاملی

روی Run کلیک کنید و تا زمانی که الگوریتم تکاملی همگرا شود، اکسل کار خود را انجام دهد.

معنی نتایج به دست آمده

هنگامی که Solver مراکز خوشه بهینه را به شما می دهد، سرگرمی شروع می شود. بیایید به سراغ گروه های مطالعه برویم! در شکل در شکل 19، می بینیم که Solver به لطف قالب بندی شرطی، فاصله کل بهینه 140.7 و هر چهار مرکز خوشه را پیدا کرد! - کاملا متفاوت به نظر برسید

برنج. 19.چهار مرکز خوشه بهینه

به خاطر داشته باشید که مراکز خوشه شما ممکن است با مراکز ارائه شده در کتاب متفاوت باشد زیرا الگوریتم تکاملی از اعداد تصادفی استفاده می کند و پاسخ هر بار متفاوت است. خوشه ها ممکن است کاملاً متفاوت باشند یا به احتمال زیاد به ترتیب متفاوتی باشند (برای مثال، خوشه 1 من ممکن است بسیار نزدیک به خوشه 4 شما باشد و غیره).

از آنجایی که هنگام ایجاد برگه، توضیحات تراکنش را در ستون های B تا G درج کرده اید، اکنون می توانید جزئیات را در شکل 1 بخوانید. 19 که برای درک ایده مراکز خوشه ای مهم است.

برای خوشه 1، در ستون H، قالب بندی شرطی معاملات 24، 26، 17، و تا حدی کمتر، 2 را انتخاب می کند. با خواندن توضیحات این معاملات، می توانید وجه مشترک آنها را درک کنید: همه آنها بر روی پینوت ساخته شده اند. نوآر

با نگاهی به ستون I، خواهید دید که تمام سلول های سبز دارای حداقل مقادیر کم هستند. اینها خریدارانی هستند که نمی خواهند مقادیر زیادی را در طول فرآیند معامله خریداری کنند.

اما دو مرکز خوشه دیگر، صادقانه بگویم، تفسیر آنها دشوار است. به‌جای تفسیر مراکز خوشه‌ای، چطور می‌شود خریداران را در خوشه مطالعه کنیم و مشخص کنیم که آنها چه نوع معاملاتی را دوست دارند؟ این می تواند موضوع را روشن کند.

رتبه بندی معاملات با استفاده از روش خوشه ای

به جای اینکه بفهمیم کدام فواصل مرکز خوشه به 1 نزدیکتر است، بیایید بررسی کنیم که چه کسی به کدام خوشه متصل است و چه معاملاتی را ترجیح می دهد.

برای انجام این کار، با کپی کردن برگه OfferInformation شروع می کنیم. بیایید کپی را 4MC - TopDealsByCluster بنامیم. ستون های H تا K را در این صفحه جدید از 1 تا 4 شماره گذاری کنید (مانند شکل 20).

برنج. 20.ایجاد یک جدول برای محاسبه محبوبیت معامله با استفاده از خوشه ها

در برگه 4MC، صحافی های خوشه های 1 تا 4 در ردیف 39 را داشتید. تنها کاری که باید انجام دهید برای شمارش معاملات بر اساس خوشه این است که به نام ستون های H تا K در صفحه 4MC نگاه کنید - TopDealsByCluster، ببینید کدام یک از برگه ها 4MC در خط 39 به این خوشه متصل شد و سپس تعداد تراکنش‌های آن‌ها را در هر خط جمع کرد. به این ترتیب تعداد کل خریداران این خوشه که تراکنش انجام داده اند را بدست می آوریم.

بیایید با سلول H2 شروع کنیم، که تعداد خریداران را در خوشه 1 ثبت می کند که پیشنهاد شماره 1 را پذیرفته اند، یعنی Malbec ژانویه. لازم است مقادیر سلول های محدوده L2: DG2 را در صفحه 4MC اضافه کنید، اما فقط خریداران از 1 خوشه، که نمونه کلاسیک استفاده از فرمول sumif / sumif است. او شبیه این است:

SUMIF("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

این فرمول به این صورت عمل می‌کند: شما مقداری شرطی را به آن می‌دهید، که در قسمت اول "4MC" بررسی می‌کند!$L$39:$DG$39,"4MC، سپس با 1 در سر ستون مقایسه می‌شود ("4MC - TopDealsByCluster" "!H$1)، و سپس برای هر مسابقه، این مقدار را به خط 2 در بخش سوم فرمول "4MC" اضافه می کند!$L2:$DG2.

توجه داشته باشید که از ارجاعات مطلق ($ در فرمول) قبل از هر چیزی که مربوط به ارتباط خوشه‌ای، شماره ردیف در سرفصل‌های ستون و حرف ستون برای معاملات تکمیل‌شده است، استفاده کرده‌اید. با مطلق کردن این پیوندها، می‌توانید فرمول را از H2:K33 بکشید تا تعداد معاملات برای مراکز خوشه‌ای دیگر و ترکیبی از معاملات را محاسبه کنید، مانند شکل. 21. برای خوانایی بیشتر این ستون ها، می توانید قالب بندی شرطی را نیز برای آنها اعمال کنید.

برنج. 21.تعداد کل تراکنش ها برای هر پیشنهاد، تقسیم به خوشه

با برجسته کردن ستون های A تا K و اعمال فیلترینگ خودکار، می توانید این داده ها را مرتب کنید. با مرتب‌سازی ستون H از کوچک‌ترین به بزرگ‌ترین، می‌توانید ببینید که کدام معاملات در خوشه 1 محبوب‌ترین هستند (شکل 22).

برنج. 22.مرتب‌سازی خوشه‌ای 1. پینو، پینو، پینو!

همانطور که قبلاً اشاره کردم، چهار معامله بزرگ برای این خوشه پینوت هستند. این افراد به وضوح از فیلم Sideways سوء استفاده می کنند. اگر خوشه 2 را مرتب کنید، کاملاً برای شما روشن می شود که اینها خریداران عمده فروشی کوچکی هستند (شکل 23).

اما وقتی خوشه 3 را مرتب می کنید، فهمیدن هیچ چیز چندان آسان نخواهد بود. تراکنش های بزرگ را می توان روی یک دست حساب کرد و تفاوت آنها با بقیه چندان مشهود نیست. با این حال، محبوب ترین معاملات چیزی مشترک دارند - تخفیف های بسیار خوب، 5 مورد از 6 معامله بزرگ مربوط به شراب گازدار است، و فرانسه تولید کننده محصول برای 3 مورد از 4 مورد از آنها است. با این حال، این فرضیات مبهم هستند.

در مورد Cluster 4، این افراد به دلایلی به وضوح معامله شامپاین اوت را دوست داشتند. همچنین، 5 مورد از 6 معامله بزرگ مربوط به شراب فرانسوی و 9 مورد از 10 معامله بزرگ مربوط به حجم بالای کالا است. شاید این یک خوشه عمده فروشی بزرگ به سمت شراب های فرانسوی است؟ تقاطع خوشه های 3 و 4 نیز نگران کننده است.

در مرحله بعد، ما تقسیم بندی دانش آموزان را بر اساس ویژگی های ذهنی (به بخش 14.1 مراجعه کنید) و با مزایای (به بخش 14.4 مراجعه کنید) که کسب آموزش عالی در آموزش تمام وقت فراهم می کند، در نظر می گیریم. برای تقسیم بندی، تکنیکی بر اساس تجزیه و تحلیل خوشه ای با استفاده از مقیاس بندی چند بعدی برای تجزیه و تحلیل اضافی و کامل تر استفاده می شود.

متغیرهای تقسیم بندی- خواص و فواید - باید دارای امتیاز کمی باشد. برای حل یک مشکل خاص از 9 پارامتر استفاده شد. برای اعمال مقیاس لیکرت، عبارات مربوطه برای هر پارامتر فرموله می شود.

1. این بهترین راه برای کسب دانش عمیق است.
2. این فرصتی است برای ارتباط کامل و دوست یابی.
3. این یک فرصت ارزشمند برای تعامل با معلم است.
4. این یک گام مهم برای شروع یک حرفه است.
5. دوران دانشجویی دوره فوق العاده ای در زندگی است.
6. هزینه های مادی آموزش تمام وقت زیاد است.
7. زمان مورد نیاز برای تحصیل تمام وقت زیاد است.
8. تفکر را در تخصص توسعه می دهد.
9. آموزش روزانه معتبر است.

مجموعه پارامترهایی که می توان استفاده کرد می تواند بسیار گسترده تر باشد. دانشجویان در پرسشنامه های خود اغلب مزایا یا معایب تحصیل تمام وقت در دانشگاه را نشان می دهند: فرصت برای گسترش افق های خود، امکان تعویق، فرصت یادگیری خود انضباطی و خودسازماندهی، دشواری ترکیب مطالعه. و کار، دوره مهم زندگی، عدم تمرین، فرصت به دست آوردن حجم زیادی از اطلاعات، تأثیر برای پیشرفت بیشتر در کار، امکان تصمیم گیری در آینده در مورد انتخاب صحیح حرفه، مشارکت در زندگی دانشگاه

جمع آوری داده ها

جمع آوری داده ها با استفاده از روش پرسشنامه انجام می شود. سوالات با استفاده از مقیاس لیکرت فرموله می شوند (به بخش 8.3 مراجعه کنید). به عنوان مثال، از دانش آموزان در مورد میزان موافقت یا مخالفت آنها با عبارات در مقیاس پنج درجه ای سؤال شد. مقیاس هفت درجه ای به طور گسترده در ادبیات استفاده می شود، اما اغلب پاسخ دهنده برای دادن پاسخ با تعداد درجه بندی های زیاد مشکل پیدا می کند.

بخشی از پرسشنامه به نظر می رسد که در شکل 1 نشان داده شده است. 24.2.

برنج. 24.2.

پاسخ دهنده فقط باید یک "تیک" بگذارد و دیجیتالی کردن توسط پرسشنامه انجام می شود. مقیاس پنج درجه ای با سطوح 1 تا 5 (1 - کاملا مخالف، ...، 5 - کاملا موافق) استفاده شد. 19 پاسخ دهنده به پرسشنامه پاسخ دادند - همه دانش آموزان از یک گروه، که البته کافی نیست.

24.7. تقسیم بندی بر اساس ویژگی ها با استفاده از مثال یک محصول آموزشی 381

محاسبات با استفاده از روش تحلیل خوشه ای

تجزیه و تحلیل خوشه ای (به بخش 23.7 مراجعه کنید) به طور گسترده هنگام تقسیم بندی بر اساس ویژگی های محصول استفاده می شود (به بخش 24.3 مراجعه کنید). گاهی اوقات تقسیم بندی توسط تجزیه و تحلیل خوشه ای نامیده می شود بر اساس سلسله مراتب. بر اساس نمرات به دست آمده، فاصله نمرات هر دانش آموز با هر یک محاسبه می شود. بر اساس بسته برنامه های علمی آماری Statistica. ابتدا ماتریسی از فواصل اقلیدسی تدوین می شود (فاصله های اقلیدسی). برای تشکیل خوشه ها، از روش ترکیبی (آگلومره) با استفاده از روش همسایه دور استفاده شد (پیوند کامل). نتایج به صورت نمودار در شکل 1 ارائه شده است. 24.3.

برنج. 24.3. دندروگرام (DPP) آمار)

محور عمودی فاصله بین خوشه های متصل را نشان می دهد (فاصله پیوند). دانش آموزان در امتداد محور افقی با اعداد از C_1 تا C 19 فهرست می شوند. همانطور که از دندروگرام بر می آید، در مرحله اول 19 خوشه وجود دارد. در مرحله اول و دوم نقاط 3 با 5 و 9 با 11 با هم ترکیب می شوند در مرحله سوم نقاط 8 و 13 با هم ترکیب می شوند سپس روند ادغام ادامه می یابد.

هنگام انتخاب مرحله نهایی و بر این اساس، تعداد خوشه ها، از طرح تراکم استفاده می کنیم (شکل 24.4). نسخه نهایی مرحله ای است که پس از آن فاصله بین خوشه های در حال ادغام (فاصله پیوند) به شدت افزایش می یابد.

برنج. 24.4.

بیایید نتیجه پارتیشن را مطابق با توصیه های بخش فرعی انتخاب کنیم. 23.7. همانطور که از طرح تراکم نشان می دهد، افزایش نسبتاً شدیدی در فاصله بین خوشه های متصل در مراحل سیزدهم و هفدهم رخ می دهد (مرحله در شکل 24.4). بنابراین باید بین مرحله دوازدهم و شانزدهم انتخاب کرد. برای انتخاب بدون ابهام مرحله نهایی مطابق با همان توصیه های بخش. 23.7 اجازه دهید به مقیاس بندی چند بعدی بپردازیم.

نتایج تقسیم بندی با استفاده از روش مقیاس بندی چند بعدی

علاوه بر این، برای انتخاب گزینه طبقه بندی نهایی، تصویر موقعیت نسبی نقاط را با استفاده از روش مقیاس بندی چند بعدی در شکل 1 در نظر می گیریم. 24.5 که در نتیجه کار با Statistica PPP به دست آمد. دو بعد در امتداد محورها وجود دارد - بعد 1 و بعد 2.

خوشه ها فقط در مرحله شانزدهم تحلیل خوشه ای شکل محدب دارند که از نتایج ترسیم مرزهای بین گروهی بر اساس مقیاس بندی چند بعدی قابل مشاهده است. این نتایج به عنوان نهایی پذیرفته می شود. سه خوشه تشکیل شده است، و اساسا بخش. خوشه اول شامل نه نقطه، دوم - سه، سوم - هفت نقطه است.

برنج. 24.5.

ویژگی های بخش ها

بخش‌ها را می‌توان با مقادیر متوسط برای هر متغیر مشخص کرد، و نتایج تقسیم‌بندی را می‌توان به صورت بصری در قالب پروفایل‌هایی برای مقادیر متوسط برای هر متغیر ارائه کرد (شکل 24.6).

برای ارائه یک توصیف معنادار و لاکونیک از بخش، نام و شعاری به آن داده شده است. شرح کاملی از خوشه از نمایه آن آمده است. نام بخش می تواند بر اساس متغیرهایی باشد که بالاترین و کمترین امتیاز را دارند، همانطور که با مشاهده نمایه ها مشاهده می شود. مقایسه نمایه‌ها به شما امکان می‌دهد ویژگی‌های هر بخش را شناسایی کرده و آن را در برابر پس‌زمینه قسمت‌های دیگر «موقعیت» قرار دهید.

بیایید نام هر بخش دریافتی را فرموله کنیم و یک شعار بدهیم. بخش اول - پوزیتیویست ها: "هزینه ها چیز اصلی نیست"، دوم - عاشقان زندگی "به حال فکر کن. ما

برنج. 24.6.

اینجا برای اعتبار و حرفه نیست، سومی - عمدی: پرستیژ هزینه ها را می پردازد. برای به دست آوردن نام بخش از فناوری زیر استفاده شد.

در واقع، مطابق با شکل. 24.6:

برای اولین خوشه نمرات بالا برای ویژگی های (4) "دانشجویی دوره شگفت انگیزی در زندگی است" و (8) "تفکر در تخصص را توسعه می دهد" معمول است. در همان زمان، اظهارات (6) "هزینه های مواد بالا هستند" و (7) "هزینه های زمانی بالا هستند" رتبه های پایینی دریافت کردند.
خوشه دوم - نمرات بالا برای عبارات (1) "فرصت برقراری ارتباط کامل و دوست یابی" و (4) "دانشجویی دوره فوق العاده ای در زندگی است." نمرات پایین برای عبارات (3) "گام مهمی در حرفه شما" و (9) "تحصیل تمام وقت معتبر است" به دست آمد.
خوشه سوم - نمرات بالا برای عبارات (6) "هزینه های مادی بالا است" و (9) "آموزش روزانه معتبر است" با نمرات نسبتاً پایین برای (4) "دانشجویی دوره فوق العاده ای در زندگی است."

در اینجا، منافع به راحتی به عنوان انگیزه های دریافت چنین آموزشی درک می شود.
PPP بسته ای از برنامه های کاربردی است.
تئوری روش در بخش فرعی ارائه شده است. 23.6.
برای نمای آشناتر نمایه، باید آن را 90 درجه در جهت عقربه های ساعت بچرخانید.

بخش‌بندی بازار یک رویه رسمی است که مبتنی بر کاربرد روش‌های آماری تحلیل چند متغیره در نتایج تحقیقات است. چهار روش اصلی برای به دست آوردن بخش های بازار وجود دارد:

1 روش های سنتی:

پیشینی (پیشینی)؛

مبتنی بر خوشه

2 روش جدید:

تقسیم بندی انعطاف پذیر؛

تقسیم بندی ترکیبی

روش پیشینی تقسیم‌بندی بازار مصرف زمانی استفاده می‌شود که بتوان یک فرضیه تقسیم‌بندی بازار را مطرح کرد. برای انجام این کار، شناخت نیازها، خواسته ها و خواسته های مصرف کنندگان ضروری است. ویژگی های مصرف کننده مانند شدت مصرف، نیازها، عناصر کلیدی انگیزه و معانی آنها به عنوان متغیرهای مستقل عمل خواهند کرد و متغیرهای تقسیم بندی (سن، جنسیت، منطقه و غیره) به عنوان متغیرهای وابسته استفاده خواهند شد.

با استفاده از این روش، محقق ابتدا یک فرضیه تقسیم‌بندی بازار را مطرح می‌کند و سپس در طی تحقیقات بازاریابی آن را آزمایش می‌کند.

روش پیشینی تقسیم‌بندی بازار شامل هفت مرحله است:

1 انتخاب مبنای تقسیم بندی تجزیه و تحلیل نیازها، نیازها و سایر عواملی که بر انتخاب مصرف کننده تأثیر می گذارد.

2 انتخاب متغیرهای تقسیم بندی و توسعه یک شبکه تقسیم بندی بازار (فرضیه). معیارها و متغیرهای تقسیم‌بندی بازار مصرف انتخاب و توجیه می‌شوند، ارتباطات احتمالی بین مبنا و متغیرها جستجو می‌شوند و تضادها در شبکه تقسیم‌بندی بازار حذف می‌شوند.

3 نمونه برداری

4 یک نظرسنجی انجام شده و داده های کمی جمع آوری شده است.

5 بخش بر اساس تفکیک پاسخ دهندگان از میان خریداران احتمالی به دسته ها شکل می گیرد.

6 ایجاد پروفایل های بخش. بخش های بازار برای انطباق با فرضیه ارائه شده تشکیل و آزمایش می شوند.

7 توسعه استراتژی های بازاریابی برای هر بخش بازار.

روش تقسیم بندی پیشینی پر استفاده ترین روش است. این به دلیل سادگی، هزینه کم و در دسترس بودن تکنیک هایی است که اجرای آن را تضمین می کند. با این حال، در عمل، اغلب موقعیت‌هایی پیش می‌آید که ارائه یک فرضیه تقسیم‌بندی بازار بسیار دشوار است.

روش خوشه ای شبیه به روش پیشینی است، اما متغیر وابسته را تعریف نمی کند - به دنبال خوشه های طبیعی است. اول، پاسخ دهندگان از میان خریداران بالقوه با استفاده از یک روش تحلیلی در بخش های بازار گروه بندی می شوند. سپس متغیرهایی شناسایی می شوند که می توانند برای تعریف یک بخش بازار مورد استفاده قرار گیرند.

هنگام خوشه‌بندی، گروه‌های طبیعی جستجو می‌شوند و هنگام طبقه‌بندی، گروه‌ها بر اساس معیارهای مشخص شده مصنوعی تشکیل می‌شوند.

گروه بندی مصرف کنندگان با استفاده از روش AID گسترده است. هنگام استفاده از این روش، یک معیار تشکیل سیستم انتخاب می شود. پس از این، نمونه به زیر گروه ها تقسیم می شود، یعنی زیرگروه هایی با ارزش بالایی از معیار تشکیل سیستم تشکیل می شود.

نقطه ضعف این روش انتخاب بخش بازار است. این روش کار فشرده ای است و راه حل دقیقی را تضمین نمی کند.

تقسیم بندی با استفاده از روش تحلیل خوشه ای به صورت صعودی (پایین به بالا) انجام می شود. در مرحله تحقیقات بازاریابی، بسیاری از ویژگی های خریدار شناسایی می شوند. نمونه حداقل 200 واحد مورد نیاز است. نتایج در حال پردازش است. داده ها در یک مقیاس جهانی در نظر گرفته می شوند که شدت پارامتر را تعیین می کند. سپس هر مصرف کننده بررسی می شود و آنهایی که بیشتر شبیه به یکدیگر هستند مشخص می شوند. مصرف کننده های مشابه در خوشه ها ترکیب می شوند و به عنوان یک شی ترکیبی عمل می کنند. در مرحله بعد، اشیایی که بیشتر شبیه به یکدیگر هستند جستجو می شوند و در یک خوشه جدید ترکیب می شوند. این فرآیند زمانی به پایان می رسد که خوشه های مشابه را نتوان شناسایی کرد.

برای پیاده‌سازی بخش‌بندی بازار با استفاده از روش خوشه‌بندی، می‌توان از بسته‌های آماری مانند SPSS و NCSS&PASS در عمل استفاده کرد.

بخش بندی بازار انعطاف پذیر یک روش پویا است که شامل انعطاف پذیری در ساخت بخش ها بر اساس تجزیه و تحلیل ترجیحات مصرف کننده برای جایگزین های محصول است. روش تجزیه و تحلیل مشترک اساس تقسیم بندی انعطاف پذیر است. یکی از مزایای این روش این است که به شما امکان می دهد تا زمانی که یک محصول جدید وارد بازار می شود، گروه های مصرف کننده را با دقت نسبتاً مشخصی تعیین کنید. معایب روش تقسیم بندی انعطاف پذیر شامل هزینه بالا، روش پیاده سازی پیچیده و خطاهای احتمالی در سطح توسعه دهنده است.

تجزیه و تحلیل مولفه‌های تقسیم‌بندی بازار بر اساس تکنیک‌های تحلیل آماری پیچیده است. به منابع محاسباتی زیادی نیاز دارد. روش تحلیل مؤلفه‌های تقسیم‌بندی بازار توسط پی.گرین پیشنهاد شد. این روش تلاش می‌کند تا مشخص کند کدام نوع خریداران برای ویژگی‌های خاص محصول مناسب‌تر هستند.

به عقیده کارشناسان غربی، روش تقسیم بندی بازار منعطف و جزء کاملاً آکادمیک و غیرقابل اجرا در زندگی واقعی است.

به عنوان بخشی از کار بر روی فصل اول کار مقدماتی نهایی، دانش نظری در زمینه تقسیم بندی بازار مصرف به دست آمد. ویژگی های اصلی تقسیم بندی بازار مصرف در نظر گرفته شده است. روش های تقسیم بندی بازار مورد مطالعه قرار گرفته است.

رومانیوک ای. وی.

روسیه، استاوروپل، مدرک کارشناسی ارشد از دانشگاه فدرال قفقاز شمالی

بررسی روش های تحلیل خوشه ای و ارزیابی کاربرد آنها برای حل مشکل تقسیم بندی بازار مصرف

حاشیه نویسی

این مقاله مقاله ای را در مورد فرآیند تقسیم بندی بازار مصرف کننده، تعریف سیستم پشتیبانی تصمیم، و همچنین استفاده از تجزیه و تحلیل خوشه ای در زمینه های مختلف فعالیت، مجموعه ای متداول از روش های تجزیه و تحلیل خوشه ای برای حل مشکلات بازاریابی مورد بحث قرار می دهد.

کلید واژه ها:تقسیم بندی، تجزیه و تحلیل خوشه ای، داده کاوی، پشتیبانی تصمیم گیری. تقسیم بندی، تجزیه و تحلیل خوشه ای، داده کاوی، پشتیبانی تصمیم گیری.

محتوای مدرن فرآیند تقسیم‌بندی بازار نتیجه تکامل مفهوم بازاریابی است. قبل از اینکه سازنده شروع به در نظر گرفتن بازار به عنوان یک ساختار متمایز بسته به گروه های مصرف کننده و ویژگی های مصرف کننده محصول کند، دیدگاه ها و آگاهی او از روش های بازاریابی مختلفی عبور می کرد: انبوه، متمایز از محصول، هدفمند.

بخش‌بندی بازار از یک سو، روشی برای یافتن بخش‌هایی از بازار و تعیین اهدافی است که فعالیت‌های بازاریابی شرکت‌ها به سمت آنها هدایت می‌شوند. از سوی دیگر، این یک رویکرد مدیریتی به فرآیند تصمیم گیری شرکت در بازار است که مبنای انتخاب ترکیب مناسب عناصر بازاریابی است.

اشیاء تقسیم بندی، اول از همه، مصرف کنندگان هستند. آنها به روشی خاص انتخاب شده و دارای ویژگی های مشترک خاصی هستند، بخشی از بازار را تشکیل می دهند. تمرکز اصلی بازاریابی بر روی یافتن گروه های همگنی از مصرف کنندگان است که ترجیحات مشابهی دارند و به پیشنهادهای بازاریابی پاسخ مشابهی می دهند.

برای اجرای موفقیت آمیز اصول تقسیم بندی، شرایط زیر وجود دارد:

- توانایی یک شرکت (سازمان) برای متمایز ساختن ساختار بازاریابی (قیمت ها، روش های پیشبرد فروش، محل فروش، محصولات).

- بخش انتخاب شده باید به اندازه کافی پایدار، ظرفیت داشته باشد و دارای چشم انداز رشد باشد.

- شرکت باید داده هایی در مورد بخش انتخاب شده داشته باشد، ویژگی ها و الزامات آن را اندازه گیری کند.

- بخش انتخاب شده باید برای شرکت قابل دسترسی باشد، یعنی دارای کانال های فروش و توزیع مناسب، سیستم تحویل محصول باشد.

- شرکت باید با بخش تماس داشته باشد (به عنوان مثال، از طریق کانال های ارتباطی شخصی و جمعی).

- ارزیابی حفاظت از بخش انتخاب شده از رقابت، تعیین نقاط قوت و ضعف رقبا و مزایای خود در رقابت.

بنابراین، تنها پس از مطالعه کافی بخش انتخاب شده و ارزیابی پتانسیل خود، یک تولید کننده می تواند در مورد انتخاب یک بخش تصمیم گیری کند.

داده کاوی یک حوزه چند رشته ای است که بر اساس علومی مانند آمار کاربردی، تشخیص الگو، هوش مصنوعی، نظریه پایگاه داده و غیره پدید آمده و در حال توسعه است.

داده کاوی یک فرآیند پشتیبانی تصمیم است که مبتنی بر جستجوی الگوهای پنهان در داده ها است.

داده کاوی فرآیند کشف در داده های خام قبلاً ناشناخته، غیر پیش پا افتاده، عملا مفید و قابل تفسیر دانش لازم برای تصمیم گیری در زمینه های مختلف فعالیت های انسانی است.

تجزیه و تحلیل خوشه ای در زمینه های مختلف استفاده می شود. زمانی مفید است که شما نیاز به طبقه بندی حجم زیادی از اطلاعات دارید.

در بازاریابی، این می تواند وظیفه تقسیم رقبا و مصرف کنندگان باشد. در تحقیقات بازاریابی، تجزیه و تحلیل خوشه ای به طور گسترده ای مورد استفاده قرار می گیرد - هم در تحقیقات نظری و هم توسط بازاریابانی که مشکلات گروه بندی اشیاء مختلف را حل می کنند. در عین حال، سؤالات مربوط به گروه‌های مشتریان، محصولات و غیره حل می‌شوند. بنابراین، یکی از مهمترین وظایف هنگام استفاده از تحلیل خوشه‌ای در تحقیقات بازاریابی، تجزیه و تحلیل رفتار مصرف‌کننده است، یعنی: گروه‌بندی مصرف‌کنندگان در طبقات همگن برای به دست آوردن کامل ترین تصویر از رفتار مشتری از هر گروه و عوامل موثر بر رفتار آن.

یک کار مهم که تجزیه و تحلیل خوشه می تواند حل کند، موقعیت یابی است، به عنوان مثال، تعیین جایگاهی که محصول جدید ارائه شده در بازار باید در آن قرار گیرد. در نتیجه اعمال تحلیل خوشه ای، نقشه ای ساخته می شود که از روی آن می توان سطح رقابت در بخش های مختلف بازار و ویژگی های مربوط به محصول را برای امکان ورود به این بخش تعیین کرد. با تجزیه و تحلیل چنین نقشه ای می توان جایگاه های جدید و خالی از سکنه در بازار را شناسایی کرد که می توان در آن محصولات موجود را عرضه کرد و یا محصولات جدیدی را توسعه داد.

داده کاوی به طور گسترده در زمینه بازاریابی استفاده می شود.

سوالات اساسی بازاریابی "چه چیزی فروخته می شود؟"، "چگونه فروخته می شود؟"، "مصرف کننده کیست؟" سخنرانی در مورد مسائل طبقه بندی و خوشه بندی به تفصیل استفاده از تجزیه و تحلیل خوشه ای را برای حل مشکلات بازاریابی، مانند تقسیم بندی مصرف کننده، شرح می دهد.

یکی دیگر از روش‌های متداول برای حل مشکلات بازاریابی، روش‌ها و الگوریتم‌های جستجوی قوانین مرتبط هستند. جستجوی الگوهای زمانی نیز در اینجا با موفقیت استفاده می شود.

در تجارت خرده فروشی مانند بازاریابی از موارد زیر استفاده می شود:

- الگوریتم‌هایی برای جستجوی قوانین مرتبط (برای تعیین مجموعه‌های متداول محصولاتی که خریداران همزمان می‌خرند). شناسایی چنین قوانینی به قرار دادن کالا در قفسه فروشگاه ها، تدوین استراتژی برای خرید کالا و قرار دادن آن در انبارها و غیره کمک می کند.

- استفاده از توالی زمانی، به عنوان مثال، برای تعیین حجم مورد نیاز کالا در یک انبار.

- روش‌های طبقه‌بندی و خوشه‌بندی برای شناسایی گروه‌ها یا دسته‌هایی از مشتریان، که آگاهی از آنها به تبلیغ موفق کالا کمک می‌کند.

ادبیات

آلکسیف A. A. "روش شناسی برای بخش بندی مصرف کنندگان"، // "تحقیقات بازاریابی و بازاریابی در روسیه"، شماره 1، 2009.
Basovsky L. E. "بازاریابی"، مسکو، INFRA M، 2009، - 426 ص.
Goltsov A. V. "چشم انداز استفاده از بازاریابی استراتژیک در یک شرکت." // "بازاریابی"، 2008، شماره 2.، ص. 72-89.
Croft M. D. "بخش بندی بازار". سن پترزبورگ، «پیتر»، 2008 – 128 ص.
Reznichenko B. A. "تحلیل انتقادی معیارهای تقسیم بندی"، "بازاریابی در روسیه و خارج از کشور"، شماره 3، 2009.

روش های تقسیم بندی

برخی از روش های تقسیم بندی "اساسی" را می توان شناسایی کرد. مهمترین آنها تجزیه و تحلیل خوشه مصرف کننده (تاکسونومی) است. خوشه های مصرف کننده با گروه بندی کسانی که به سوالات پرسیده شده پاسخ های مشابهی می دهند، تشکیل می شوند. خریداران در صورتی که سن، درآمد، عادات و غیره مشابهی داشته باشند را می توان در یک خوشه گروه بندی کرد. شباهت بین خریداران بر اساس معیارهای مختلف است، اما اغلب از مربع وزنی تفاوت بین پاسخ های خریداران به یک سوال به عنوان معیار شباهت استفاده می شود. خروجی الگوریتم های خوشه بندی می تواند درخت های سلسله مراتبی یا گروه بندی مصرف کنندگان در گروه ها باشد. تعداد بسیار زیادی الگوریتم خوشه ای وجود دارد.

به عنوان مثال، در ایالات متحده آمریکا، تجزیه و تحلیل خوشه ای سیستم هایی به نام PRIZM گسترده است , که با کاهش مجموعه ای از 1000 شاخص اجتماعی-جمعیتی ممکن، خوشه بندی را آغاز می کند. این سیستم بخش های اجتماعی و جمعیتی را برای کل قلمرو ایالات متحده تشکیل می دهد. بنابراین، خوشه 28 شناسایی شده است - خانواده هایی که در این خوشه قرار می گیرند شامل افرادی با موفق ترین مشاغل حرفه ای یا مدیریتی هستند. این خوشه همچنین نشان دهنده درآمد بالا، تحصیلات، دارایی و تقریباً میانسالی است. اگرچه این خوشه تنها 7 درصد از جمعیت ایالات متحده را تشکیل می دهد، اما برای کارآفرینانی که کالاهای با ارزش می فروشند بسیار مهم است.

نمونه های دیگری از تقسیم بندی مصرف کننده بر اساس تحلیل خوشه ای وجود دارد. به عنوان مثال، در میان بخش‌های «روانی»، «نگرش مصرف‌کننده به تازگی محصول» جایگاه بسیار مهمی را اشغال می‌کند (شکل 3).

شکل 3

همانطور که از داده های فوق مشاهده می شود، بیشترین تعداد مصرف کنندگان را خریداران عادی تشکیل می دهند.

تقسیم بندی مصرف کننده بر اساس تحلیل خوشه ای یک روش "کلاسیک" است. در عین حال، روش‌هایی برای تقسیم‌بندی بازار بر اساس به اصطلاح «بخش‌بندی محصول» یا تقسیم‌بندی بازار بر اساس پارامترهای محصول وجود دارد. این امر به ویژه هنگام عرضه و بازاریابی محصولات جدید بسیار مهم است. تقسیم بندی محصول، بر اساس مطالعه روندهای بلندمدت بازار، از اهمیت ویژه ای برخوردار است. فرآیند توسعه و تولید محصول جدید و تکمیل برنامه های سرمایه گذاری بزرگ مستلزم یک دوره نسبتا طولانی است و صحت نتایج تحلیل بازار و ارزیابی ظرفیت آن از اهمیت ویژه ای برخوردار است. در شرایط کار در بازار سنتی محصولات استاندارد، محاسبه ظرفیت آن با استفاده از روش جمع‌بندی بازار قابل انجام است. در شرایط مدرن، برای افزایش رقابت پذیری و تعیین صحیح ظرفیت بازار، دیگر برای یک شرکت کافی نیست که بخش بندی بازار را تنها در یک جهت انجام دهد - تعریف گروه های مصرف کننده بر اساس برخی معیارها. به عنوان بخشی از بازاریابی یکپارچه، همچنین لازم است که خود محصول را بر اساس مهمترین پارامترها برای تبلیغ آن در بازار تقسیم بندی کنیم. برای این منظور روش تدوین نقشه های کاربردی- انجام نوعی تقسیم بندی دوگانه، توسط محصول و مصرف کننده.

نقشه های عملکردی می توانند تک عاملی (تقسیم بندی بر اساس یک عامل و برای یک گروه همگن از محصولات انجام می شود) و چند عاملی (تجزیه و تحلیل اینکه یک مدل محصول خاص برای کدام گروه های مصرف کننده در نظر گرفته شده است و کدام یک از پارامترهای آن برای آن مهم است. ترویج محصولات در بازار) با استفاده از نقشه های عملکردی تلفیقی می توان برای تعیین اینکه یک محصول معین برای کدام بخش بازار طراحی شده است، چه پارامترهای عملکردی با نیازهای مصرف کننده خاص مطابقت دارد، استفاده کرد.

هنگام توسعه محصولات جدید، این روش فرض می کند که همه عوامل منعکس کننده سیستم ترجیحات مصرف کننده، و در عین حال پارامترهای فنی محصول جدید، که با آن می توان نیازهای مصرف کننده را برآورده کرد، باید در نظر گرفته شود. گروه های مصرف کننده شناسایی می شوند که هر کدام مجموعه ای از درخواست ها و ترجیحات خاص خود را دارند. همه عوامل انتخاب شده به ترتیب اهمیت برای هر گروه مصرف کننده رتبه بندی می شوند.

این رویکرد به شما امکان می دهد در مرحله توسعه ببینید کدام پارامترهای محصول نیاز به بهبود طراحی دارند یا اینکه مشخص کنید آیا بازار به اندازه کافی برای این مدل وجود دارد یا خیر.

اجازه دهید مثالی از چنین تحلیل بازار را در رابطه با پروژه کامپیوتری اپل در حال توسعه ارائه کنیم (جدول 1) (به صفحه بعدی مراجعه کنید)

میز 1." تقسیم بندی بازار رایانه های شخصی و عواملی که هنگام توسعه محصولات برای آن در نظر گرفته شده است (1982) "

عوامل	بخش های بازار بر اساس گروه های مصرف کننده						مدل
عوامل	در خانه	در مدرسه	در دانشگاه	به سمت خانه. دفتر	در تجارت کوچک	در یک شرکت	آ	که در
مشخصات فنی	*	*	***	**	**	**	***	**
قیمت	***	***	**	***	***	**	0	**
کیفیت های خاص	*	*	**	*	*	*	**	*
قابلیت اطمینان	**	*	*	**	**	*	0	**
راحت برای استفاده	**	**	*	**	*	0	***	***
سازگاری	0	0	0	0	0	***	0	0
تجهیزات جانبی	0	0	0	0	0	***	0	0
نرم افزار	*	*	**	**	**	***	*	**

*** عامل بسیار مهمی است

** - عامل مهم

* - عامل بی اهمیت

0 - عامل ناچیز

این تحلیل ساده نشان می دهد که مدل A یک کامپیوتر بدون بازار است و مدل B مناسب ترین محصول برای دانشگاه ها و مشاغل کوچک است.

این شرکت یک بار روی کامپیوتر A شرط بندی کرد و شکست خورد.

به طور کلی، در عمل جهانی، از 2 رویکرد اساسی برای تقسیم بندی بازاریابی استفاده می شود - (نگاه کنید به: طرح کلی تجزیه و تحلیل بخش (شکل 4)) (صفحه بعدی)

در روش اول. ویژگی های تقسیم بندی، تعداد بخش ها، تعداد آنها، ویژگی ها و نقشه علایق قبلاً شناخته شده است. یعنی فرض بر این است که گروه های قطعه در این روش قبلاً تشکیل شده اند. روش "پیشینی" در مواردی استفاده می شود که بخش بندی بخشی از تحقیقات فعلی نیست، اما به عنوان پایه ای کمکی برای حل سایر مشکلات بازاریابی عمل می کند. گاهی اوقات از این روش زمانی استفاده می شود که بخش های بازار به وضوح تعریف شده باشند، زمانی که تنوع بخش های بازار زیاد نباشد. زمانی که یک محصول جدید با هدف یک بخش شناخته شده بازار شکل می گیرد، "پیشینه" نیز قابل قبول است.

در روش دوم که «پس‌تک (مبتنی بر خوشه‌ای)» نامیده می‌شود، عدم قطعیت ویژگی‌های تقسیم‌بندی و ماهیت خود بخش‌ها دلالت دارد. پژوهشگر ابتدا تعدادی متغیر را انتخاب می‌کند که در رابطه با پاسخ‌دهنده تعاملی هستند (روش). شامل انجام یک نظرسنجی است) و سپس بسته به نگرش بیان شده نسبت به گروه خاصی از متغیرها، پاسخ دهندگان به بخش مربوطه تعلق می گیرند و در این حالت نقشه علایق شناسایی شده در فرآیند تحلیل بعدی به عنوان ثانویه در نظر گرفته می شود. هنگام تقسیم بندی بازارهای مصرفی، که ساختار بخش آن در رابطه با محصول فروخته شده تعریف نشده است، استفاده می شود.

تقسیم بندی توسط " یک پیش خانه "

هنگام انتخاب تعداد بخش هایی که بازار باید به آنها تقسیم شود، معمولاً توسط تابع هدف هدایت می شوند - شناسایی امیدوارکننده ترین بخش. بدیهی است که هنگام تشکیل یک نمونه، گنجاندن بخش هایی که پتانسیل خرید آنها نسبت به محصول مورد مطالعه بسیار کم است، غیر ضروری است. همانطور که مطالعات نشان می‌دهد، تعداد بخش‌ها نباید از 10 تجاوز کند؛ مازاد معمولاً با جزئیات بیش از حد ویژگی‌های بخش‌بندی همراه است و منجر به «تار» غیرضروری ویژگی‌ها می‌شود.

به عنوان مثال، هنگام تقسیم بندی بر اساس سطح درآمد، توصیه می شود همه خریداران بالقوه را به بخش هایی با حجم مساوی تقسیم کنید، با در نظر گرفتن اینکه حجم هر بخش حداقل کمتر از حجم تخمینی فروش خدمات نیست، بر اساس دانش ظرفیت تولید شرکت موفق‌ترین مثالی که موارد فوق را توضیح می‌دهد و امکان تقسیم مصرف‌کنندگان بالقوه را به گروه‌های بخش پایدار نشان می‌دهد، می‌تواند تقسیم‌بندی جمعیت بر اساس درآمد باشد، زمانی که کل جمعیت به پنج گروه 20٪ تقسیم می‌شود. توزیع درآمد ارائه شده توسط پنج گروه 20 درصدی جمعیت به طور منظم در مجموعه ها و گزارش های آماری مشابه آنچه در جدول ارائه شده است ارائه می شود. 2

جدول 2 ."توزیع درآمد بر اساس گروه های جمعیتی. %"

راحتی کار با چنین گروه‌هایی به‌ویژه از نظر ردیابی ظرفیت آنها آشکار است.