>
Fa   |   Ar   |   En
   بازیابی تصویر مبتنی بر محتوا با استفاده از همجوشی نتایج چندسطحی  
   
نویسنده مقیمیان اکبر ,منصوری زاده محرم ,دزفولیان حسین
منبع مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 3 - صفحه:1345 -1357
چکیده    بازیابی تصویر مبتنی بر محتوا استفاده از روش‌های بینایی ماشین برای بازیابی تصاویری از یک مجموعه است که به تصویر پرس‌وجو شبیه باشند. چالش اصلی این سیستم‌ها کاهش شکاف معنایی بین ویژگی‌های سطح‌پایین مستخرج از پیکسل و قطعه تصویر و مفاهیم سطح‌بالای موجود در آن است. یکی از روش‌های کاهش این فاصله استفاده از ویژگی‌های سطح‌بالای مستخرج از نواحی و اشیا برای بازیابی است. از طرفی ویژگی‌های سطح‌پایین نیز تمایز خوبی بین خود تصاویر اعمال می‌کنند. بر این اساس انتظار می‌رود استفاده از هر دو دسته ویژگی به نتایج بهتری منجر شود. در این پژوهش بازیابی تصویر در چهار سطح پیکسل، ناحیه، شیء و مفهوم انجام‌شده است و از همجوشی نتایج این سطوح به‌منظور کاهش شکاف معنایی استفاده‌شده است. در سطح پیکسل، از ویژگی‌های sift و lbp استفاده‌شده است. در سطح ناحیه، ابتدا تصویر به چند ناحیه افراز و سپس ویژگی‌های رنگ و بافت با استفاده از توصیفگر hue و فیلتر گابور از هر یک از نواحی تصویر استخراج‌شده است. در سطح شیء از شبکه عصبی کانولوشنی alexnet برای بازشناسی اشیاء و صحنه‌های درون تصویر و در سطح مفهوم از شبکه عصبی word2vec برای سنجش شباهت معنایی تصاویر استفاده‌شده است. نتایج بازیابی روی دو پایگاه داده wang و ghim نشان‌دهنده بهبود دقت و فراخوانی در بازیابی تصویر است.
کلیدواژه بازیابی تصویر مبتنی بر محتوا، همجوشی اطلاعات، ترکیب طبقه‌بندها، alexnet ,word2vec
آدرس دانشگاه بوعلی, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران, دانشگاه بوعلی, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران, دانشگاه بوعلی, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران
پست الکترونیکی dezfoulian@basu.ac.ir
 
   Content Based Image Retrieval by Fusion of Multilevel Results  
   
Authors Moghimian A. ,Mansoorizadeh M. ,Dezfoulian M. H.
Abstract    Content based image retrieval (CBIR) applies machine vision techniques to extract similar images for a given query image. The main challenge of CBIR is the semantic gap between low level pixel and segment based features and highlevel concepts in the image. An approach towards reducing this gaps is to use high level region and object based features. However, the lowlevel features describe image details and enforce between image discriminations. Accordingly, it is expected that the use of both feature types will lead to better results. This paper tries to reduce the mentioned gap by combining decision results at four granularities, namely pixel, region, object, and concept levels. Pixel level retrieval adopts SIFT features and local binary patterns. Region level subsystem partitions the image into a set of segments and extracts their color and texture features using hue descriptor and Gabor filters for subsequent processing. AlexNet convolutional neural network is employed for object based retrieval. Word2vec embedding is used for concept level retrieval that exploits conceptual relations between objects to enhance the retrieval results. Experiments over Wang and GHIM datasets confirm the feasibility of the proposed combination and conclude that it improves overall performance of the retrieval system.
Keywords AlexNet ,Word2vec
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved