توسعه یک الگوریتم خوشه بندی با ناظر افزایشی برای داده های جریانی
|
|
|
DOR
|
20.1001.2.9920083628.1399.1.1.38.2
|
نویسنده
|
اسدی شاهرخ ,نیک پور سهیلا
|
منبع
|
كنفرانس سيستم هاي هوشمند و محاسبات سريع - 1399 - دوره : 1 - کنفرانس سیستم های هوشمند و محاسبات سریع - کد همایش: 9920083628
|
چکیده
|
امروزه با توجه به حجم زیاد و سرعت بالای داده های جریانی در حال تولید، نیاز به ذخیره و مدیریت این داده ها بیشتر احساس می شود. خوشه بندی داده های جریانی به دلیل ماهیت غیرثابت و نامحدود آن ها، با چالش های بسیاری مواجه است. داده های جریانی دارای ترتیب زمانی، تغییرات سریع، حجم عظیم و به طور بالقوه از داده های بی نهایت تشکیل شده اند. الگوریتم های زیادی در زمینه خوشه بندی داده های جریانی ارائه شده است. با این حال الگوریتم های بسیار محدودی در زمینه داده های جریانی باناظر ارائه شده است. در این مقاله، یک الگوریتم دومرحله ای خوشه بندی پویای داده های جریانی (dcds) که یک روش خوشه بندی باناظر افزایشی است، توسعه داده شده است. در این الگوریتم، داده های جریانی به صورت اتوماتیک و بدون نیاز به دریافت هیچ پارامتری از کاربر، خوشه بندی می شوند. علاوه بر این، از خوشه های تولید شده، جهت کلاس بندی داده های بدون برچسب می توان استفاده کرد. نتایج تجربی روش پیشنهادی بر روی شش مجموعه داده از uci نشان می دهد که روش ارائه شده نسبت به روش های موجود با توجه به معیارهای ارائه شده دارای برتری می باشد.
|
کلیدواژه
|
خوشه بندی باناظر ,داده های جریانی ,یادگیری افزایشی ,کلاس بندی ,خوشه بندی سلسله مراتبی.
|
آدرس
|
پردیس فارابی، دانشگاه تهران, ایران, دانشگاه آزاد، واحد تهران شمال, ایران
|
|
|
|
|
|
|