>
Fa   |   Ar   |   En
   استفاده از الگوریتم بهینه‌سازی گرگ خاکستری در خوشه‌یابی کلان‌داده‌ها  
   
نویسنده بهروان ایمان ,ظهیری حمید ,رضوی محمّد ,ترازارتی روبرتو
منبع مهندسي برق دانشگاه تبريز - 1399 - دوره : 50 - شماره : 1 - صفحه:41 -62
چکیده    امروزه حجم بسیار زیادی از اطلاعات و داده‌ها از منابع مختلف نظیر گوشی‌های هوشمند، شبکه‌های اجتماعی، تکنولوژی‌های عکاسی و سایر منابع تولید می‌شود. بررسی و پردازش این حجم عظیم از اطلاعات چالش دهه‌های اخیر است که به آن کلان‌داده گفته می‌شود. یکی از روش‌های پرکاربرد استخراج اطلاعات، خوشه‌یابی است. خوشه‌یابیِ کلان‌داده‌ها چالش بزرگی است که توجه بسیاری از محققین را به خود جلب کرده است. در این پژوهش ابتدا یک روش خوشه‌یابی غیر خودکار (برای حالتی که تعداد خوشه‌ها از قبل مشخص است) و سپس یک روش خوشه‌یابی خودکار (قادر به یافتن تعداد خوشه‌ها) با استفاده از الگوریتم بهینه‌سازی گرگ خاکستری برای خوشه‌یابی کلان‌داده‌ها ارائه شده است. روش خوشه‌یابی خودکار یک روش دو مرحله‌ایست که در مرحله‌ی اول یک ساختار درخت گونه از الگوریتم مورد نظر برای یافتن تعداد خوشه‌ها اجرا می‌شود و در مرحله‌ی دوم الگوریتم اصلی فضا را برای یافتن موقعیت مراکز خوشه‌ها جست‌وجو می‌کند. عملکرد روش ارائه شده بر روی 13 مجموعه داده‌ی مصنوعی و 2 مجموعه کلان‌داده‌ی واقعی مربوط به مسیرهای طی شده  توسط خودروها در سطح شهر پیزا مورد ارزیابی قرار گرفته و نتایج آن بررسی شده است. نتایج به دست آمده نشان از دقت بالای این الگوریتم در خوشه‌یابی داده‌های بزرگ و حجیم دارد.
کلیدواژه کلان‌داده، خوشه‌یابی خودکار، روش‌های هوش جمعی، الگوریتم بهینه‌سازی گرگ خاکستری
آدرس دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, موسسه علوم و فناوری اطلاعات, آزمایشگاه استخراج اطلاعات و داده‌کاوی, ایتالیا
پست الکترونیکی roberto.trasarti@isti.cnr.it
 
   Using Grey Wolf Optimization Algorithm in Big Data Clustering  
   
Authors ظهیری حمید
Abstract    The huge amount of data created constantly with increasing rate from different sources such as smart phones, social media, imaging technologies and etc. becomes difficult to be analyzed by conventional data analytic tools. For this reason a new field of research called Big Data Analytics is growing faster in the research and industrial communities. Clustering big datasets is one of the important challenges which attracts more and more attentions among researchers. In this paper first a method for nonautomatic big data clustering (when the number of clusters is known) and then a twostage method for big data automatic clustering (able in finding the number of clusters) based on grey wolf optimization algorithm are introduced.  In the first stage the algorithm tries to find the number of clusters using a tree structure and in the second stage the main algorithm searches the solution space to find the position of centroids. The methodology is tested on 13 synthetics and 2 real big mobility datasets. The achieved results show its effectiveness in big data clustering.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved