|
|
استفاده از الگوریتم بهینهسازی گرگ خاکستری در خوشهیابی کلاندادهها
|
|
|
|
|
نویسنده
|
بهروان ایمان ,ظهیری حمید ,رضوی محمّد ,ترازارتی روبرتو
|
منبع
|
مهندسي برق دانشگاه تبريز - 1399 - دوره : 50 - شماره : 1 - صفحه:41 -62
|
چکیده
|
امروزه حجم بسیار زیادی از اطلاعات و دادهها از منابع مختلف نظیر گوشیهای هوشمند، شبکههای اجتماعی، تکنولوژیهای عکاسی و سایر منابع تولید میشود. بررسی و پردازش این حجم عظیم از اطلاعات چالش دهههای اخیر است که به آن کلانداده گفته میشود. یکی از روشهای پرکاربرد استخراج اطلاعات، خوشهیابی است. خوشهیابیِ کلاندادهها چالش بزرگی است که توجه بسیاری از محققین را به خود جلب کرده است. در این پژوهش ابتدا یک روش خوشهیابی غیر خودکار (برای حالتی که تعداد خوشهها از قبل مشخص است) و سپس یک روش خوشهیابی خودکار (قادر به یافتن تعداد خوشهها) با استفاده از الگوریتم بهینهسازی گرگ خاکستری برای خوشهیابی کلاندادهها ارائه شده است. روش خوشهیابی خودکار یک روش دو مرحلهایست که در مرحلهی اول یک ساختار درخت گونه از الگوریتم مورد نظر برای یافتن تعداد خوشهها اجرا میشود و در مرحلهی دوم الگوریتم اصلی فضا را برای یافتن موقعیت مراکز خوشهها جستوجو میکند. عملکرد روش ارائه شده بر روی 13 مجموعه دادهی مصنوعی و 2 مجموعه کلاندادهی واقعی مربوط به مسیرهای طی شده توسط خودروها در سطح شهر پیزا مورد ارزیابی قرار گرفته و نتایج آن بررسی شده است. نتایج به دست آمده نشان از دقت بالای این الگوریتم در خوشهیابی دادههای بزرگ و حجیم دارد.
|
کلیدواژه
|
کلانداده، خوشهیابی خودکار، روشهای هوش جمعی، الگوریتم بهینهسازی گرگ خاکستری
|
آدرس
|
دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, موسسه علوم و فناوری اطلاعات, آزمایشگاه استخراج اطلاعات و دادهکاوی, ایتالیا
|
پست الکترونیکی
|
roberto.trasarti@isti.cnr.it
|
|
|
|
|
|
|
|
|
Using Grey Wolf Optimization Algorithm in Big Data Clustering
|
|
|
Authors
|
ظهیری حمید
|
Abstract
|
The huge amount of data created constantly with increasing rate from different sources such as smart phones, social media, imaging technologies and etc. becomes difficult to be analyzed by conventional data analytic tools. For this reason a new field of research called Big Data Analytics is growing faster in the research and industrial communities. Clustering big datasets is one of the important challenges which attracts more and more attentions among researchers. In this paper first a method for nonautomatic big data clustering (when the number of clusters is known) and then a twostage method for big data automatic clustering (able in finding the number of clusters) based on grey wolf optimization algorithm are introduced. In the first stage the algorithm tries to find the number of clusters using a tree structure and in the second stage the main algorithm searches the solution space to find the position of centroids. The methodology is tested on 13 synthetics and 2 real big mobility datasets. The achieved results show its effectiveness in big data clustering.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|