خوشه بندی فازی چند هسته ای کلان داده ها در چارچوب نگاشت کاهش هدوپ

Fa | Ar | En

خوشه بندی فازی چند هسته ای کلان داده ها در چارچوب نگاشت کاهش هدوپ


نویسنده	آذرکسب امید ,خواسته حسین ,امیری مصطفی
منبع	فناوري اطلاعات و ارتباطات ايران - 1402 - دوره : 15 - شماره : 55-56 - صفحه:85 -103
چکیده	یک راه حل منطقی برای لحاظکردن همپوشانی خوشه ها، انتساب مجموعه ای از درجه عضویت به هر داده است. به دلیل کمشدن افرازها و کوچک شدن فضای جستجو، خوشه بندی فازی عموما دارای سربار محاسباتی کمتری بوده، تشخیص و مدیریت داده های مبهم، نویزدار و داده های پرت نیز در آن به سهولت انجام میگیرد. ازاینرو خوشه بندی فازی از نوع پیشرفته روش های خوشه بندی به شمار می رود. اما روش های خوشه بندی فازی در مواجه با روابط غیرخطی داده ها ناتوانند. روش پیشنهادی این مقاله می کوشد تا مبتنی بر ایده های امکان پذیری، از یادگیری چند هسته ای در چارچوب نگاشت کاهش هدوپ برای تشخیص خوشه های خطی جدایی ناپذیر با ساختار کلان داده های پیچیده، استفاده کند. مدل یادگیری چند هسته ای قادر به کشف روابط پیچیده بین دادهای بوده و در عین حال هدوپ ما را قادر خواهد ساخت تا به جای تعامل با سیستم عامل و پردازنده، با یک کلاستر منطقی از پردازش ها و گره های انباره داده تعامل داشته باشیم و عمده کار را بر عهده فریمورک بیندازیم. به طور خلاصه مدل سازی روابط غیرخطی داده ها با استفاده از مدل یادگیری چند هسته ای، تعیین مقادیر مناسب برای پارامترهای فازیسازی و امکانپذیری، و ارائه الگوریتم در مدل نگاشت کاهش هدوپ از دستاوردهای کلیدی مقاله حاضر می باشد. آزمایش ها برروی یکی از مجموعه داده های پر استفاده مخزن یادگیری uci و همچنین برروی دیتاست شبیه ساز cloudsim پیاده سازی شده است و نتایج قابل قبولی به دست آمده است. طبق مطالعات منتشر شده، مخزن یادگیری uci برای مقاصد رگرسیون و خوشه بندی کلان داده، و مجموعه داده cloudsim برای شبیه سازی موارد مربوط به رایانش ابری، محاسبه تاخیرهای زمانی و زمان بندی انجام وظایف معرفی شده اند.
کلیدواژه	داده های کلان، خوشه بندی، منطق فازی، یادگیری چند هسته ای، هدوپ، نگاشت کاهش
آدرس	دانشگاه خواجه نصیرالدین طوسی, ایران, دانشگاه صنعتی خواجه نصیرالدین طوسی, ایران, دانشگاه خواجه نصیرالدین طوسی, ایران
پست الکترونیکی	mostafa.amiri@email.kntu.ac.i

fuzzy multicore clustering of big data in the hadoop map reduce framework

Authors	azarkasb omid ,khasteh hossein ,amiri mostafa
Abstract	a logical solution to consider the overlap of clusters is assigning a set of membership degrees to each data point. fuzzy clustering, due to its reduced partitions and decreased search space, generally incurs lower computational overhead and easily handles ambiguous, noisy, and outlier data. thus, fuzzy clustering is considered an advanced clustering method. however, fuzzy clustering methods often struggle with non-linear data relationships. this paper proposes a method based on feasible ideas that utilizes multicore learning within the hadoop map reduce framework to identify inseparable linear clusters in complex big data structures. the multicore learning model is capable of capturing complex relationships among data, while hadoop enables us to interact with a logical cluster of processing and data storage nodes instead of interacting with individual operating systems and processors. in summary, the paper presents the modeling of non-linear data relationships using multicore learning, determination of appropriate values for fuzzy parameterization and feasibility, and the provision of an algorithm within the hadoop map reduce model. the experiments were conducted on one of the commonly used datasets from the uci machine learning repository, as well as on the implemented cloudsim dataset simulator, and satisfactory results were obtained.according to published studies, the uci machine learning repository is suitable for regression and clustering purposes in analyzing large-scale datasets, while the cloudsim dataset is specifically designed for simulating cloud computing scenarios, calculating time delays, and task scheduling.
Keywords	big data clustering ,fuzzy multicore learning ,hadoop map reduce ,task scheduling ,cloud computing ,pattern recognition