|
|
محلیسازی ویدیو در زبان فارسی با استفاده از شبکه مجاور زمانی و تشخیص اشیا
|
|
|
|
|
نویسنده
|
پورزارع سرخی معصومه ,کوچاری عباس ,محمدزاده جواد
|
منبع
|
دهمين كنفرانس بين المللي هوش مصنوعي و رباتيك - 1402 - دوره : 10 - دهمین کنفرانس بین المللی هوش مصنوعی و رباتیک - کد همایش: 02230-23861 - صفحه:0 -0
|
چکیده
|
محلیسازی ویدیو با زبان طبیعی، به عنوان یک روش بازیابی لحظهای ویدیو شناخته میشود که هدف آن مکانیابی لحظههای هدف در یک ویدیو است بطوریکه از نظر معنایی با جمله متنی مورد جستجو، که به آن جستار می گویند، مطابقت دارد. با توجه به اینکه روشهای موجود معمولا لحظههای زمانی را به صورت جداگانه در نظر میگیرند و از وابستگی زمانی غفلت میکنند، هنوز نتوانستهاند به خوبی بر چالشهای محلی سازی ویدیو فائق آیند. در این تحقیق، روشی برای محلیسازی لحظههای ویدیویی در زبان فارسی، با استفاده از شبکه مجاور زمانی و تشخیصاشیا، با هدف افزایش دقت و سرعت بازیابی ویدیو پیشنهاد میشود. روش پیشنهادی، روابط زمانی بین لحظات ویدئویی را با یک نقشه دو بعدی مدل میکند که میتواند لحظات ویدئویی متنوعی را با طولهای زمانی مختلف پوشش دهد و تشخیص اشیا را به بعد دوم اضافه میکند تا حجم پردازش برروی ویدئو کاهش یابد و فقط بخشی از ویدئو که شامل اشیای ذکر شده در جستار است، مورد پردازش قرار گیرد. نتایج ارزیابی نشان می دهد که ویژگی های استخراج شده بهترین کارایی را دارند و مدل پیشنهادی با 2درصد بهبود در دقت، به دقت 74. 48 در رتبه 5 و دقت 46. 92 در رتبه 1 می رسد.
|
کلیدواژه
|
بازیابی لحظه ویدیویی، پردازش متنی، محلیسازی لحظهای ویدیویی
|
آدرس
|
, iran, , iran, , iran
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|