دستهبندی و حاشیهنویسی همزمان تصویر با استفاده از مدلهای احتمالاتی موضوع و کدگذاری llc کلمات بصری
|
|
|
|
|
نویسنده
|
محمدی فومنی نوید ,نیک آبادی احمد
|
منبع
|
علوم رايانش و فناوري اطلاعات - 1395 - دوره : 14 - شماره : 2 - صفحه:1 -11
|
چکیده
|
تاکنون تلاشهای زیادی به منظور استفاده از مدلهای موضوعی نظیر مدل احتمالاتی lda جهت دستهبندی و حاشیهنویسی همزمان تصاویر صورت گرفته است. اخیراً مدلهای موضوع دیگری بر مبنای شبکههای عصبی احتمالاتی نظیر supdocnade معرفی شدهاند که نتایج خوبی در مدلکردن دادههای چندمقداری ارائه دادهاند. در این مدلها کلمات حاشیهنویسی نیز در کنار کلمات بصری تعبیه شده و به عنوان بردار ویژگی برای شبکه در نظر گرفته میشود. عدمتعادل در تعداد کلمات بصری و حاشیهنویسی سبب میشود تا سهم کلمات حاشیهنویسی برای بازنمایی در لایه پنهان شبکهعصبی مورد استفاده در این مدل، بسیار کمتر از کلمات بصری باشد. برای حل این مشکل در این مقاله، کلمات حاشیهنویسی در هیستوگرام بردار ویژگی وزندهی میشوند. با افزودن قابلیت وزندهی ورودیها میتوان از کدگذار llc که چندین کلمه مشابه در فرهنگ لغت را بصورت وزندار در ساخت بردار ویژگی دخیل میکند، برای تولید کلمات بصری استفاده نمود. با آزمایش مدل پیشنهادی بر روی پایگاه دادههای uiuc_sports و labelme، بهبود 5 درصدی در معیار f در کلمات حاشیهنویسی و بهبود 1 درصدی در دقت دستهبندی نسبت به مدلهای موجود مشاهده میشود.
|
کلیدواژه
|
دسته بندی و حاشیه نویسی تصویر، مدل های موضوع، مدل احتمالاتی، شبکه عصبی، کدگذار llc
|
آدرس
|
داﻧﺸﮕﺎه ﺻﻨﻌﺘﻲ اﻣﻴﺮﻛﺒﻴﺮ, داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﻛﺎﻣﭙﻴﻮﺗﺮ و ﻓﻨﺎوری اﻃﻼﻋﺎت, ایران, داﻧﺸﮕﺎه ﺻﻨﻌﺘﻲ اﻣﻴﺮﻛﺒﻴﺮ, داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﻛﺎﻣﭙﻴﻮﺗﺮ و ﻓﻨﺎوری اﻃﻼﻋﺎت, ایران
|
پست الکترونیکی
|
nickabadi@aut.ac.ir
|
|
|
|
|