>
Fa   |   Ar   |   En
   پالایش شرح گذاری مجموعه تصاویر با مقیاس بزرگ با یادگیری انتقالی در شبکه عصبی کانولوشنال عمیق  
   
نویسنده جوانمردی شیما ,زارع چاهوکی محمد علی
منبع ماشين بينايي و پردازش تصوير - 1397 - دوره : 5 - شماره : 1 - صفحه:39 -52
چکیده    فرآیند پالایش شرح گذاری تصاویر، رویکردی موثر در بهبود بازیابی تصاویر مبتنی بر برچسب می‌باشد. در شبکه های اجتماعی و موتورهای جستجو بسیاری از تصاویر دارای تگ های مبهم، ناقص و بی ارتباط با محتوا هستند. وجود این تگ های غیرقابل اعتماد، موجب کاهش دقت بازیابی تصاویر می شود. از این رو در دهه اخیر، الگوریتم هایی با عنوان پالایش تگ (tr) مطرح شده‌اند که به رفع نویز و غنی‌سازی برچسب‌های تصاویر می‌پردازند. به منظور دستیابی به نتایج بهینه در tr، استخراج ویژگی هایی از تصویر که توصیف مناسبی از محتوای دیداری تصویر داشته باشند، تاثیر مستقیمی بر دقت فرآیند tr دارد. از جمله چالش های عمده در فرآیند پالایش شرح گذاری تصاویر، رسیدن به توصیفی مناسب و مرتبط با محتوای تصاویر می باشد. بدین منظور با توجه به کارآمدی فرآیند یادگیری عمیق در بسیاری از حوزه های پژوهشی، در این مقاله نیز به منظور استخراج ویژگی های کارآمد در تشابه دیداری تصاویر و ارتباط معنایی تصاویر با هم، از شبکه های عصبی کانولوشنال عمیق (dcnn) استفاده شده است. بهره گیری از فرآیند یادگیری انتقالی استفاده شده در dcnn مبتنی بر تصاویر imagenet در توصیف و ایجاد ارتباط معنایی در مجموعه تصاویر با مقیاس بزرگ nuswide، بیانگر موثر بودن این رویکرد در کاربرد پالایش تگ تصاویر است.
کلیدواژه پالایش شرح گذاری تصاویر، شبکه عصبی کانولوشنال عمیق، پالایش تگ، بازیابی تصاویر، یادگیری انتقالی
آدرس دانشگاه یزد, دانشکده برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی iranpour@pnu.ac.ir
 
 

Copyright 2015
Islamic World Science Citation Center
All Rights Reserved