|
|
تلفیق الگوریتمهای یادگیری عمیق و فیلترهای دوطرفه با هدف استخراج ساختمان از تکتصویر نوری هوایی
|
|
|
|
|
نویسنده
|
خوش برش ماسوله مهدی ,شاه حسینی رضا ,صفری عبدالرضا
|
منبع
|
مهندسي فناوري اطلاعات مكاني - 1398 - دوره : 7 - شماره : 2 - صفحه:241 -263
|
چکیده
|
مسئله استخراج ساختمان از تکتصویر نوری هوایی با قدرت تفکیک مکانی بالا، همواره بهعنوان یکی از چالشهای مهم در تهیه نقشه بهشمار میآید. هدف از پژوهش حاضر، بهرهگیری از قطعهبندی معنایی تکتصویر نوری هوایی بر پایه تلفیق شبکههای عصبی کانوولوشنی عمیق و فیلترهای دوطرفه جهت استخراج ساختمان میباشد. بههمینمنظور، پس از انتخاب یک مجموعه داده مناسب از تصاویر نوری سهباندی، با در نظر گرفتن اینکه برای آموزش شبکههای عصبی عمیق نیاز است تا دادههای آموزشی با تعداد زیاد انتخاب شوند و باتوجه به محدودیتهای سختافزاری در این پژوهش، پس از چندین بار آزمایش، حداقل دادهای که بالاترین نرخ دقت آموزش را به دست میدهد انتخاب گردید؛ تا نتایج بهدست آمده، از کمبود دادههای آموزشی تاثیر منفی نپذیرد. در این پژوهش، با بهینهسازی شبکه عصبی عمیق سِگنت که از نوع شبکههای کدگذارکدگشا میباشد، با استفاده از تابع بهینهسازی برآورد لحظه تطبیقی و بهکارگیری فیلترهای دوطرفه با کرنل گوسین، فرآیند پردازش و استخراج ساختمان از تصاویر نوری صورت گرفته است. نتایج تحقیق بر روی مجموعه داده مربوط به تصاویر نوری هوایی از مناطق شهری واقع در شهر پوتسدام آلمان از مجموعه دادههای دو بعدی برچسبدار انجمن بینالمللی فتوگرامتری و سنجشازدور نشان داد؛ بهکارگیری تلفیقی شبکه عصبی عمیق بهینهسازی شده سِگنت و فیلترهای دو طرفه با کرنل گوسین قابلیتهای بسیار مناسبی از نظر بهبود شناسایی مرز ساختمان در مقایسه با روشهای مشابه از تصاویر نوری با قدرت تفکیک مکانی بالا دارد. همچنین نتایج حاصل از روش پیشنهادی تحقیق با معیارهای تمامیّت و صحّت برای سه منطقه تست به ترتیب 95.14 و 92.37 درصد برای منطقه تست شماره یک، 91.67 و 90.20 برای منطقه تست شماره دو، 96.14 و 93.98 برای منطقه تست شماره سه میباشد.
|
کلیدواژه
|
استخراج ساختمان، تکتصویر نوری هوایی، قطعهبندی معنایی، شبکههای عصبی کانوولوشنی عمیق، فیلترهای دوطرفه
|
آدرس
|
دانشگاه تهران, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, ایران, دانشگاه تهران, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, گروه فتوگرامتری و سنجش از دور, ایران, دانشگاه تهران, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, ایران
|
|
|
|
|
|
|
|
|
|
|
Integration of Deep Learning Algorithms and Bilateral Filters with the Purpose of Building Extraction from Mono Optical Aerial Imagery
|
|
|
Authors
|
Khoshboresh Masouleh Mahdi ,Shah-Hosseini Reza ,Safari Abdol Reza
|
Abstract
|
The problem of extracting the building from mono optical aerial imagery with high spatial resolution is always considered as an important challenge to prepare the maps. The goal of the current research is to take advantage of the semantic segmentation of mono optical aerial imagery to extract the building which is realized based on the combination of deep convolutional neural networks (DCNN) and bilateral filters (BF). For this purpose, considering the hardware limitations of the current research and the fact that it is necessary to select a large number of training data to train deep convolutional neural networks, after selecting an appropriate dataset from threeband optical images, the minimum data that obtains the highest training accuracy was selected to avoid getting weak results due to the lack of training data. In this research, by optimizing the SegNet deep neural network which is an encoderdecoder network, the processing task and therefore extracting the building from optical images are done using the adaptive moment estimation (ADAM) optimization and BF with a Gaussian kernel. This method is implemented on a dataset related to the mono optical aerial imagery of urban regions located in Potsdam, Germany, the twodimensional tagged datasets of international society for photogrammetry and remote sensing (ISPRS). The results show that compared to similar methods, the combinational use of the SegNet optimized deep neural network and BF with a Gaussian kernel provides very appropriate capabilities to improve the detection of building boundary in the optical images with high spatial resolution. Also, the results of the proposed method show that the values of the integrity and validity criteria are 95.14 and 92.37 respectively for the test area 1, 91.67 and 90.2 respectively for the test area 2, and 96.14 and 93.98 respectively for the test area 3.
|
Keywords
|
building extraction ,mono optical aerial imagery ,semantic segmentation ,deep convolutional neural networks ,bilateral filters
|
|
|
|
|
|
|
|
|
|
|