گسترش خوشه‌بندی k-میانگین

بسمه تعالی

آگهی برگزاری جلسه حضوری دفاع از پایان نامه کارشناسی ارشد

زمان: چهار شنبه 1400/10/01 ساعت 10:30

مکان: سالن همایش

لینک ورود: https://meetbk.kntu.ac.ir/b/jj6-ndl-or7 کد دسترسی:036924

عنوان رساله:

گسترش خوشه‌بندی k-میانگین

نام دانشجو: مهشید نصیری

استاد راهنما: دکتر عبدالرضا سیاره

استاد ارزیاب داخلی: دکتر احد ملک زاده

استاد ارزیاب خارجی: دکتر صدیقه زمانی مهریان

چکیده فارسی

با گسترش روز افزون حجم داده، تحلیل و بازیابی این حجم انبوه داده ضروری است، یکی از تکنیک‌های اصلی در این زمینه، خوشه‌بندی است. خوشه‌بندی یکی از مسائل مهم داده‌کاوی در کشف الگوهای پنهان در داده‌ها است که در فصل اول توضیح داده شده است. هنگامی که تعداد متغیرها بسیار زیاد باشد و با داده‌های با بعد بالا مواجه باشیم، مسئله کاهش بعد نیز در کنار خوشه بندی، مطرح می‌شود. خوشه‌بندی، یکی از شاخه‌های یادگیری بدون نظارت می‌باشد و فرایند خودکاری است که در طی آن، نمونه‌ها به دسته‌هایی که اعضای آن مشابه یکدیگر می‌باشند تقسیم می‌شوند که به این دسته‌ها خوشه گفته می‌شود. به بیان دیگر می‌توان گفت که خوشه‌بندی قرار دادن داده‌ها در گروه‌هایی است که اعضای هر گروه شبیه به یکدیگرندکه در فصل دوم به طور کامل توضیح داده شده است. در نتیجه شباهت بین داده‌های درون هر خوشه حداکثر و شباهت بین خوشه‌های متفاوت حداقل می‌باشد. یکی از الگوریتم‌های رایج خوشه‌بندی، الگوریتم k-میانگین‌ است. علی رغم، محبوب بودن k‌-میانگین‌ دارای چند عیب است، ازجمله، وابستگی نتایج خوشه‌بندی به انتخاب سرخوشه‌های اولیه، امکان به وجود آمدن خوشه‌های خالی و همچنین تعین تعداد خوشه‌ها از قبل است. در بین این معایب، مشکل وابسته بودن نتایج خوشه‌بندی به انتخاب سرخوشه‌های اولیه، به دلیل داشتن پیامدهایی نظیر ایجاد خوشه‌های خالی و همگرایی کندتر، جدی‌تر است. همچنین، انتخاب سرخوشه‌های اولیه مناسب کاهش ناسازگاری خوشه‌ها را در پی دارد. هرچه سرخوشه‌های اولیه به سرخوشه‌های حالت بهینه نزدیک‌تر باشند، نتایج خوشه‌بندی بهتر می‌شود. سایر مشکلات k-میانگین‌ به جز تعیین تعداد خوشه‌ها از قبل، با مقداردهی مناسب سرخوشه‌های اولیه قابل حل است که در فصل سوم به طور کامل در مورد آن توضیح داده شده است. که ما در این پایان‌نامه قصد داریم روش خوشه‌بندی k-میانگین‌ را گسترش دهیم؛ همچنین در فصل چهار به اجرای شبیه سازی خوشه‌بندی k-میانگین‌، با استفاده از داده‌های کاوی Iris پرداخته شده است

تعداد بازدید:

586

تاریخ:

1400/09/22

بازگشت

پیوندهای مرتبط