|
|
مقایسۀ عملکرد شبکههای عصبی خودسازماندۀ مکانی و غیرمکانی در خوشهبندی دادههای اجتماعی - اقتصادی بلوک های آماری شهر اصفهان
|
|
|
|
|
نویسنده
|
تاریقلی زاده هادی ,میرباقری بابک ,متکان علی اکبر
|
منبع
|
جغرافيا و برنامه ريزي محيطي - 1402 - دوره : 34 - شماره : 4 - صفحه:111 -132
|
چکیده
|
امروزه با افزایش حجم و ابعاد دادههای مکانی و نیاز به درک کامل دادهها، شبکههای عصبی خودسازمانده به ابزاری استاندارد برای کار با دادههای بزرگ و چندبُعدی تبدیل شدهاند که میتوانند در خوشهبندی، بصریسازی و انتقال دادههای چندبُعدی در فضایی با ابعاد کمتر استفاده شوند. هدف از پژوهش حاضر، خوشهبندی دادههای بلوکهای آماری (شامل ده متغیر منتخب اجتماعی-اقتصادی مرتبط با رویکرد توسعۀ پایدار شهری) با شبکههای عصبی خودسازمانده بدون استفاده از پارامترهای مکانی و بهکارگیری مختصات جغرافیایی بلوکهای آماری بهعنوان پارامتر مکانی در روند خوشهبندی و مقایسۀ نتایج حاصلشده، است. الگوریتم som رایجترین شبکۀ عصبی خودسازمانده و الگوریتم geo-somمکانیشدۀ الگوریتم som است. روند خوشهبندی هر دو الگوریتم یکسان است و تنها تفاوت این دو الگوریتم بهکارگیری پارامترهای مکانی در روند اجرای الگوریتم geo-som است. در پژوهش حاضر دادهها با الگوریتم som و geo-som خوشهبندی شده است. نتایج نشان داد که خوشههای حاصل از دو الگوریتم بهطور کامل، متفاوت است. خوشهبندی بلوکهای آماری بدون توجه به خصوصیات مکانی و تنها با استفاده از معیار شباهت، منجر به خوشههای ناهمگن میشود و برعکس. با اعمال پارامترهای مکانی نهتنها از معیار شباهت، از ویژگیهای مکانی دادهها نیز در فرآیند خوشهبندی استفاده میشود که این مسئله منجر به تولید خوشههای همگن میشود. ارزیابی نتایج با استفاده از ضریب سیلهوته بیانگر خوشهبندی مناسبتر الگوریتم geo-som است؛ بهطوری که میانگین ضریب سیلهونه برای الگوریتم som برابر 0/02- و برای الگوریتم geo-som برابر 27/ 0است. مقایسۀ نتایج نشاندهندۀ تاثیر مثبت پارامترهای مکانی در خوشهبندی دادههای اجتماعی و اقتصادی است.
|
کلیدواژه
|
شبکههای عصبی خودسازمانده، خوشهبندی، دادههای مکانی، بلوکهای آماری، شهر اصفهان، geo-som
|
آدرس
|
دانشگاه شهید بهشتی, دانشکدۀ علوم زمین، مرکز مطالعات سنجش از دور و gis, ایران, دانشگاه شهید بهشتی, دانشکدۀ علوم زمین، مرکز مطالعات سنجش از دور و gis, ایران, دانشگاه شهید بهشتی, دانشکدۀ علوم زمین، مرکز مطالعات سنجش از دور و gis, ایران
|
پست الکترونیکی
|
a-matkan@sbu.ac.ir
|
|
|
|
|
|
|
|
|
comparing the performance of spatial and non-spatial self-organizing neural networks in clustering socio-economic data of isfahan census blocks
|
|
|
Authors
|
tarigholizadeh hadi ,mirbagheri babak ,matkan ali akbar
|
Abstract
|
the increasing volume and dimensions of spatial data have made self-organizing neural networks a prominent tool for analyzing large and multi-dimensional datasets. clustering, an approach for extracting knowledge from big data, aims to group similar data into clusters. this research focused on clustering socio-economic data of census blocks associated with urban sustainable development using self-organizing neural networks with and without spatial parameters referred to as som and geo-som, respectively. both algorithms employ the same clustering process but differ in the inclusion of spatial parameters, specifically the geographic coordinates of block centroids, in the geo-som algorithm. the som and geo-som algorithms were trained and applied to cluster the data. the resulting clusters exhibited distinct dissimilarities, demonstrating that clustering census block data solely based on non-spatial attributes leads to heterogeneous and incongruent clusters, whereas incorporating spatial parameters yields homogeneous and congruent clusters. evaluation of the results using silhouette coefficient indicated that geo-som outperformed som in clustering the data with average silhouette coefficients of -0.02 and 0.27 for som and geo-som, respectively. comparison of the outcomes highlighted the positive impact of incorporating spatial parameters on clustering socio-economic data.keywords: self-organizing neural networks, som, geo-som, clustering, spatial data, census blocks, isfahan cityintroductionin recent years, there has been a significant increase in the volume of spatial data available. to gain a comprehensive understanding of spatial data, it is crucial to extract meaningful knowledge from it by considering its unique characteristics. this process, known as &knowledge discovery in databases& (kdds), utilizes methods, such as artificial neural networks (anns) to extract useful information and knowledge. clustering, a widely used technique for large-scale data analysis, aims to group similar data into clusters while reducing the data size and ensuring that the internal differences within clusters are significantly smaller than the differences between clusters. however, clustering algorithms for spatial data differ from those for non-spatial data. therefore, this research focused on using self-organizing neural networks to cluster socio-economic data related to sustainable urban development while comparing the performance of two algorithms, som and geo-som, for this task. methodologythis research utilized socio-economic data of isfahan census blocks (2015) obtained from iranian statistics center. the dataset consisted of 13,362 statistical blocks, each characterized by socio-economic variables. the som and geo-som algorithms were employed to cluster the socio-economic data of census blocks and their results were compared. the self-organizing map is a single-layer feed-forward neural network that organizes output neurons in a low-dimensional topological structure. the som effectively maps high-dimensional data onto two-dimensional feature maps, forming networks of units or neurons. on the other hand, the geo-som algorithm is an adaptation of the self-organizing map that incorporates a competitive learning process, focusing more on spatial aspects by restricting the search for the best matching unit (bmu) to the geographical proximity of input patterns. visualization tools, such as the u-matrix, component plane, and hits maps are employed to analyze the output of som and geo-som algorithms. the network topology in this study was set to 7 x 7 after assessing multiple u-matrix sizes to identify clusters, resulting in a network with 49 neurons. evaluation of the clustering results was performed using silhouette coefficient, which measured similarity of the data within clusters and their dissimilarity between clusters.
|
Keywords
|
self-organizing neural networks ,som ,geo-som ,clustering ,spatial data ,census blocks ,isfahan city
|
|
|
|
|
|
|
|
|
|
|