>
Fa   |   Ar   |   En
   دسته‌بندی و حاشیه‌نویسی همزمان تصویر با استفاده از مدل‌های احتمالاتی موضوع و کدگذاری llc کلمات بصری  
   
نویسنده محمدی فومنی نوید ,نیک آبادی احمد
منبع علوم رايانش و فناوري اطلاعات - 1395 - دوره : 14 - شماره : 2 - صفحه:1 -11
چکیده    تا‌کنون تلاش‌های زیادی به منظور استفاده از مدل‌های موضوعی نظیر مدل احتمالاتی lda جهت دسته‌بندی و حاشیه‌نویسی همزمان تصاویر صورت گرفته ‌است. اخیراً مدل‌های موضوع دیگری بر مبنای شبکه‌های عصبی احتمالاتی نظیر supdocnade معرفی شده‌اند که نتایج خوبی در مدل‌کردن داده‌های چند‌مقداری ارائه ‌داده‌اند. در این مدل‌ها کلمات حاشیه‌نویسی نیز در کنار کلمات بصری تعبیه شده‌ و به عنوان بردار ویژگی برای شبکه در‌ نظر گرفته می‌شود. عدم‌تعادل در تعداد کلمات بصری و حاشیه‌نویسی سبب می‌شود تا سهم کلمات حاشیه‌نویسی برای بازنمایی در لایه پنهان شبکه‌عصبی مورد استفاده در این مدل، بسیار کمتر از کلمات بصری باشد. برای حل این مشکل در این مقاله، کلمات حاشیه‌نویسی در هیستوگرام بردار ویژگی وزن‌دهی می‌شوند. با افزودن قابلیت وزن‌دهی ورودی‌ها می‌توان از کدگذار llc که چندین کلمه مشابه در فرهنگ لغت را بصورت وزن‌دار در ساخت بردار ویژگی دخیل می‌کند، برای تولید کلمات بصری استفاده نمود. با آزمایش مدل پیشنهادی بر روی پایگاه داده‌های uiuc_sports و labelme، بهبود 5 درصدی در معیار f در کلمات حاشیه‌نویسی و بهبود 1 درصدی در دقت دسته‌بندی نسبت به مدل‌های موجود مشاهده می‌شود.
کلیدواژه دسته بندی و حاشیه نویسی تصویر، مدل های موضوع، مدل احتمالاتی، شبکه عصبی، کدگذار llc
آدرس داﻧﺸﮕﺎه ﺻﻨﻌﺘﻲ اﻣﻴﺮﻛﺒﻴﺮ, داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﻛﺎﻣﭙﻴﻮﺗﺮ و ﻓﻨﺎوری اﻃﻼﻋﺎت, ایران, داﻧﺸﮕﺎه ﺻﻨﻌﺘﻲ اﻣﻴﺮﻛﺒﻴﺮ, داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﻛﺎﻣﭙﻴﻮﺗﺮ و ﻓﻨﺎوری اﻃﻼﻋﺎت, ایران
پست الکترونیکی nickabadi@aut.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved