>
Fa   |   Ar   |   En
   مقایسۀ عملکرد شبکه‌های عصبی خود‌سازماندۀ مکانی و غیرمکانی در خوشه‌بندی داده‌های اجتماعی - اقتصادی بلوک‌ های آماری شهر اصفهان  
   
نویسنده تاریقلی زاده هادی ,میرباقری بابک ,متکان علی اکبر
منبع جغرافيا و برنامه ريزي محيطي - 1402 - دوره : 34 - شماره : 4 - صفحه:111 -132
چکیده    امروزه با افزایش حجم و ابعاد داده‌های مکانی و نیاز به درک کامل داده‌ها، شبکه‌های عصبی خودسازمانده به ابزاری استاندارد برای کار با داده‌های بزرگ و چند‌بُعدی تبدیل شده‌اند که می‌توانند در خوشه‌بندی، بصری‌سازی و انتقال داده‌های چند‌بُعدی در فضایی با ابعاد کمتر استفاده شوند. هدف از پژوهش حاضر، خوشه‌بندی داده‌های بلوک‌های آماری (شامل ده متغیر منتخب اجتماعی-اقتصادی مرتبط با رویکرد توسعۀ پایدار شهری) با شبکه‌های عصبی خودسازمانده بدون استفاده از پارامترهای مکانی و به‌کارگیری مختصات جغرافیایی بلوک‌های آماری به‌عنوان پارامتر مکانی در روند خوشه‌بندی و مقایسۀ نتایج حاصل‌شده، است. الگوریتم som رایج‌ترین شبکۀ عصبی خودسازمانده و الگوریتم  geo-somمکانی‌شدۀ الگوریتم som است. روند خوشه‌بندی هر دو الگوریتم یکسان است و تنها تفاوت این دو الگوریتم به‌کا‌رگیری پارامترهای مکانی در روند اجرای الگوریتم geo-som است. در پژوهش حاضر داده‌ها با الگوریتم som و geo-som خوشه‌بندی شده است. نتایج نشان داد که خوشه‌های حاصل از دو الگوریتم به‌طور کامل، متفاوت است. خوشه‌بندی بلوک‌های آماری بدون توجه به خصوصیات مکانی و تنها با استفاده از معیار شباهت، منجر به خوشه‌های ناهمگن می‌شود و برعکس. با اعمال پارامترهای مکانی نه‌تنها از معیار شباهت، از ویژگی‌های مکانی داده‌ها نیز در فرآیند خوشه‌بندی استفاده می‌شود که این مسئله منجر به تولید خوشه‌های همگن می‌شود. ارزیابی نتایج با استفاده از ضریب سیلهوته بیانگر خوشه‌بندی مناسب‌تر الگوریتم geo-som است؛ به‌طوری که میانگین ضریب سیلهونه برای الگوریتم som برابر 0/02- و برای الگوریتم geo-som برابر 27/ 0است. مقایسۀ نتایج نشان‌دهندۀ تاثیر مثبت پارامترهای مکانی در خوشه‌بندی داده‌های اجتماعی و اقتصادی است.
کلیدواژه شبکه‌های عصبی خودسازمانده، خوشه‌بندی، داده‌های مکانی، بلوک‌های آماری، شهر اصفهان، geo-som
آدرس دانشگاه شهید بهشتی, دانشکدۀ علوم زمین، مرکز مطالعات سنجش از دور و gis, ایران, دانشگاه شهید بهشتی, دانشکدۀ علوم زمین، مرکز مطالعات سنجش از دور و gis, ایران, دانشگاه شهید بهشتی, دانشکدۀ علوم زمین، مرکز مطالعات سنجش از دور و gis, ایران
پست الکترونیکی a-matkan@sbu.ac.ir
 
   comparing the performance of spatial and non-spatial self-organizing neural networks in clustering socio-economic data of isfahan census blocks  
   
Authors tarigholizadeh hadi ,mirbagheri babak ,matkan ali akbar
Abstract    the increasing volume and dimensions of spatial data have made self-organizing neural networks a prominent tool for analyzing large and multi-dimensional datasets. clustering, an approach for extracting knowledge from big data, aims to group similar data into clusters. this research focused on clustering socio-economic data of census blocks associated with urban sustainable development using self-organizing neural networks with and without spatial parameters referred to as som and geo-som, respectively. both algorithms employ the same clustering process but differ in the inclusion of spatial parameters, specifically the geographic coordinates of block centroids, in the geo-som algorithm. the som and geo-som algorithms were trained and applied to cluster the data. the resulting clusters exhibited distinct dissimilarities, demonstrating that clustering census block data solely based on non-spatial attributes leads to heterogeneous and incongruent clusters, whereas incorporating spatial parameters yields homogeneous and congruent clusters. evaluation of the results using silhouette coefficient indicated that geo-som outperformed som in clustering the data with average silhouette coefficients of -0.02 and 0.27 for som and geo-som, respectively. comparison of the outcomes highlighted the positive impact of incorporating spatial parameters on clustering socio-economic data.keywords: self-organizing neural networks, som, geo-som, clustering, spatial data, census blocks, isfahan cityintroductionin recent years, there has been a significant increase in the volume of spatial data available. to gain a comprehensive understanding of spatial data, it is crucial to extract meaningful knowledge from it by considering its unique characteristics. this process, known as &knowledge discovery in databases& (kdds), utilizes methods, such as artificial neural networks (anns) to extract useful information and knowledge. clustering, a widely used technique for large-scale data analysis, aims to group similar data into clusters while reducing the data size and ensuring that the internal differences within clusters are significantly smaller than the differences between clusters. however, clustering algorithms for spatial data differ from those for non-spatial data. therefore, this research focused on using self-organizing neural networks to cluster socio-economic data related to sustainable urban development while comparing the performance of two algorithms, som and geo-som, for this task. methodologythis research utilized socio-economic data of isfahan census blocks (2015) obtained from iranian statistics center. the dataset consisted of 13,362 statistical blocks, each characterized by socio-economic variables. the som and geo-som algorithms were employed to cluster the socio-economic data of census blocks and their results were compared. the self-organizing map is a single-layer feed-forward neural network that organizes output neurons in a low-dimensional topological structure. the som effectively maps high-dimensional data onto two-dimensional feature maps, forming networks of units or neurons. on the other hand, the geo-som algorithm is an adaptation of the self-organizing map that incorporates a competitive learning process, focusing more on spatial aspects by restricting the search for the best matching unit (bmu) to the geographical proximity of input patterns. visualization tools, such as the u-matrix, component plane, and hits maps are employed to analyze the output of som and geo-som algorithms. the network topology in this study was set to 7 x 7 after assessing multiple u-matrix sizes to identify clusters, resulting in a network with 49 neurons. evaluation of the clustering results was performed using silhouette coefficient, which measured similarity of the data within clusters and their dissimilarity between clusters. 
Keywords self-organizing neural networks ,som ,geo-som ,clustering ,spatial data ,census blocks ,isfahan city
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved