خوشه بندی (Clustering)

 
 
 

خوشه بندی 

چکیده
امروزه خوشه‌بندی به عنوان یک روش یادگیری بدون ناظر در کاربردهای بسیاری توانسته است ارزش خود را نشان دهد. در این مجموعه سعی شده تا حد امکان مطالب پایه‌ایِ خوشه‌بندی و مسائل مربوط به آن بیان شود. همچنین سعی شده است تا چندین روش و تکنیک مختلف و رایجِ خوشه بندی تشریح شود و ویژگی‌های هر یک بیان گردد. برای ارزیابی، سنجش و اعتبارسنجی خوشه‌های تولید شده که خود یکی از مسائل مهم و قابل گسترش در باب خوشه‌بندی است.
 
 خوشه‌بندی را می‌توان به عنوان مهمترین مسئله در یادگیری بدون نظارت در نظر گرفت. خوشه‌بندی با یافتن یک ساختار درون یک مجموعه از داده‌های بدون برچسب درگیر است. خوشه‌ به مجموعه‌ای از داده‌ها گفته می‌شود که به هم شباهتداشته باشند. در خوشه‌بندی سعی می‌شود تا دادهها به خوشه‌هایی تقسیم شوند که شباهت بین داده‌های درون هر خوشه حداکثر و شباهت بین داده‌های درون خوشه‌های متفاوت حداقل شود.
 
 
 
 
 
کلمات کلیدی:

خوشه بندی

Clustering

یادگیری بدون ناظر

یادگیری ماشین

 
 
 
 

 روش‌های خوشه‌بندی

روش‌های خوشه‌بندی را می‌توان از چندین جنبه تقسیم‌بندی کرد:
 

1-    خوشه‌بندی انحصاری (Exclusive or Hard Clustering) وخوشه‌بندی با هم‌پوشی (Overlapping or Soft Clustering)

در روش خوشه‌بندی انحصاری پس از خوشه‌بندی هر داده دقیقأ به یک خوشه تعلق می‌گیرد مانند روش خوشه‌بندی K-Means. ولی در خوشه‌بندی با همپوشی پساز خوشه‌بندی به هر داده یک درجه تعلق بازاء هر خوشه نسبت داده می‌شود. به عبارتی یک داده می‌تواند با نسبتهای متفاوتی به چندین خوشه تعلق داشته باشد. نمونه‌ای از آن خوشه‌بندی فازی است. 
 

2-      خوشه‌بندی سلسله مراتبی (Hierarchical) و خوشه‌بندی مسطح(Flat)

در روش خوشه بندی سلسله مراتبی، به خوشه‌های نهایی بر اساس میزان عمومیت آنها  ساختاری سلسله‌ مراتبی نسبت داده می‌شود. مانند روش Single Link. ولی در خوشه‌بندی مسطح تمامی خوشه‌های نهایی دارای یک میزان عمومیت هستند مانند K-Means. به ساختار سلسله مراتبی حاصل از روشهای خوشه‌بندی سلسله مراتبی دندوگرام (Dendogram) گفته می‌شود.
با توجه با اینکه روش‌های خوشه‌بندی سلسله مراتبی اطلاعات بیشتر و دقیق‌تری تولید می‌کنند برای تحلیل داده‌های با جزئیات پیشنهاد می‌شوند ولی از طرفی چون پیچیدگی محاسباتی بالایی دارند برای مجموعه داده‌های بزرگ روش‌های خوشه‌بندی مسطح پیشنهاد می‌شوند.
 
 
 
 
 
 
 
فهرست مطالب
مقدمه‌ای بر خوشه‌بندی
خوشه‌بندی در مقابل طبقه‌‌بندی

یادگیری با نظارت در مقابل یادگیری بدون نظارت

کاربردها
مسائل درگیر با روش‌های خوشه‌بندی

خوشه‌بندی در مقابل چندی ‌سازی برداری

روش‌های خوشه‌بندی

روشهای خوشه‌بندی سلسله مراتبی

خوشه‌بندی با روش Single-Link

خوشه‌بندی با روش Complete-Link

خوشه‌بندی با روش Average-Link

دیگر روشهای خوشه بندی سلسله مراتبی
الگوریتم خوشه‌بندی پایین به بالای عمومی
روش خوشه‌بندی K-Means

خوشه‌بندی بر اساس چگالی

بررسی روشهای اعتبارسنجی خوشه‌ها
خلاصه و نتیجه‌گیری
منابع