>
Fa   |   Ar   |   En
   تلفیق الگوریتم‌های یادگیری عمیق و فیلترهای دوطرفه با هدف استخراج ساختمان از تک‌تصویر نوری هوایی  
   
نویسنده خوش برش ماسوله مهدی ,شاه حسینی رضا ,صفری عبدالرضا
منبع مهندسي فناوري اطلاعات مكاني - 1398 - دوره : 7 - شماره : 2 - صفحه:241 -263
چکیده    مسئله استخراج ساختمان از تک‌تصویر نوری هوایی با قدرت تفکیک مکانی بالا، همواره به‌عنوان یکی از چالش‌های مهم در تهیه نقشه به‌شمار می‌آید. هدف از پژوهش حاضر، بهره‌گیری از قطعه‌بندی معنایی تک‌تصویر نوری هوایی بر پایه تلفیق شبکه‌های عصبی کانوولوشنی عمیق و فیلترهای دوطرفه جهت استخراج ساختمان می‌باشد. به‌همین‌منظور، پس از انتخاب یک مجموعه داده مناسب از تصاویر نوری سه‌باندی، با در نظر گرفتن این‌که برای آموزش شبکه‌های عصبی عمیق نیاز است تا داده‌های آموزشی با تعداد زیاد انتخاب شوند و باتوجه به محدودیت‌های سخت‌افزاری در این پژوهش، پس از چندین بار آزمایش، حداقل داده‌ای که بالاترین نرخ دقت آموزش را به دست می‌دهد انتخاب گردید؛ تا نتایج به‌دست آمده، از کمبود داده‌های آموزشی تاثیر منفی نپذیرد. در این پژوهش، با بهینه‌سازی شبکه عصبی عمیق سِگنت که از نوع شبکه‌های کدگذارکدگشا می‌باشد، با استفاده از تابع بهینه‌سازی برآورد لحظه تطبیقی و به‌کارگیری فیلترهای دوطرفه با کرنل گوسین، فرآیند پردازش و استخراج ساختمان از تصاویر نوری صورت گرفته است. نتایج تحقیق بر روی مجموعه داده مربوط به تصاویر نوری هوایی از مناطق شهری واقع در شهر پوتسدام آلمان از مجموعه داده‌های دو بعدی برچسب‌دار انجمن بین‌المللی فتوگرامتری و سنجش‌ازدور نشان داد؛ به‌کارگیری تلفیقی شبکه عصبی عمیق بهینه‌سازی شده سِگنت و فیلترهای دو طرفه با کرنل گوسین قابلیت‌های بسیار مناسبی از نظر بهبود شناسایی مرز ساختمان در مقایسه با روش‌های مشابه از تصاویر نوری با قدرت تفکیک مکانی بالا دارد. همچنین نتایج حاصل از روش پیشنهادی تحقیق با معیارهای تمامیّت و صحّت برای سه منطقه تست به ترتیب 95.14 و 92.37 درصد برای منطقه تست شماره یک، 91.67 و 90.20 برای منطقه تست شماره دو، 96.14 و 93.98 برای منطقه تست شماره سه می‌باشد.
کلیدواژه استخراج ساختمان، تک‌تصویر نوری هوایی، قطعه‌بندی معنایی، شبکه‌های عصبی کانوولوشنی عمیق، فیلترهای دوطرفه
آدرس دانشگاه تهران, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, ایران, دانشگاه تهران, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, گروه فتوگرامتری و سنجش از دور, ایران, دانشگاه تهران, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, ایران
 
   Integration of Deep Learning Algorithms and Bilateral Filters with the Purpose of Building Extraction from Mono Optical Aerial Imagery  
   
Authors Khoshboresh Masouleh Mahdi ,Shah-Hosseini Reza ,Safari Abdol Reza
Abstract    The problem of extracting the building from mono optical aerial imagery with high spatial resolution is always considered as an important challenge to prepare the maps. The goal of the current research is to take advantage of the semantic segmentation of mono optical aerial imagery to extract the building which is realized based on the combination of deep convolutional neural networks (DCNN) and bilateral filters (BF). For this purpose, considering the hardware limitations of the current research and the fact that it is necessary to select a large number of training data to train deep convolutional neural networks, after selecting an appropriate dataset from threeband optical images, the minimum data that obtains the highest training accuracy was selected to avoid getting weak results due to the lack of training data. In this research, by optimizing the SegNet deep neural network which is an encoderdecoder network, the processing task and therefore extracting the building from optical images are done using the adaptive moment estimation (ADAM) optimization and BF with a Gaussian kernel. This method is implemented on a dataset related to the mono optical aerial imagery of urban regions located in Potsdam, Germany, the twodimensional tagged datasets of international society for photogrammetry and remote sensing (ISPRS). The results show that compared to similar methods, the combinational use of the SegNet optimized deep neural network and BF with a Gaussian kernel provides very appropriate capabilities to improve the detection of building boundary in the optical images with high spatial resolution. Also, the results of the proposed method show that the values of the integrity and validity criteria are 95.14 and 92.37 respectively for the test area 1, 91.67 and 90.2 respectively for the test area 2, and 96.14 and 93.98 respectively for the test area 3.
Keywords building extraction ,mono optical aerial imagery ,semantic segmentation ,deep convolutional neural networks ,bilateral filters
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved