|
|
رهگیری بصری طولانی مدت اهداف دلخواه بر اساس راهگزین بین دو روش رهگیری سنتی و فن یادگیری ژرف
|
|
|
|
|
نویسنده
|
باقرزاده محمدامین ,سیدعربی میرهادی ,رضوی ناصر
|
منبع
|
مهندسي برق دانشگاه تبريز - 1403 - دوره : 54 - شماره : 4 - صفحه:391 -402
|
چکیده
|
رهگیری بصری شی دلخواه یک موضوع اساسی و چالش برانگیز در حوزه بینایی ماشین است که بهطور سنتی توسط در نظر گرفتن یک مدل برای هدف و با استفاده از دادههای آموزشی همان ویدیو انجام شده است. اکثر رهگیرها بهسختی میتوانند با در نظر گرفتن ویژگیهای برخط و بیدرنگ در صدر مقایسه نتایج مشهورترین روشها قرار گیرند. در این مقاله یک چارچوب رهگیری بر اساس شبکه سیامی ارائه شده که یادگیری رهگیر بهصورت برخط و فرآیند رهگیری بیدرنگ بوده و نام آن std-siam است. از آنجا که شبکه سیامی دارای محدودیت آموزش برخط است و مدت طولانی نمیتواند چالشهای موجود در رهگیری را مدیریت کند، هدف std-siam از راهگزین بین رهگیر سنتی و رهگیر بر مبنای یادگیری ژرف، تعلیم هر دو رهگیر با هدف رفع ابهام بین هدف و پسزمینه در هر فرنامه دلخواه است. ابتدا از طریق رهگیر سنتی دادههای آموزشی تولید شده، سپس این دادهها با فن برافزایی گسترش داده میشوند تا شبکه ژرف به خوبی آموزش بیند. این روش میتواند با سرعت 66 فریمدرثانیه اجرا شود و نسبت به الگوریتمهای مشابه فعلی با وجود سادگی آن نتایج خوبی را بهدست آورد و بهصورت طولانی مدت هدف را رهگیری کند. این سرعت رهگیری فراتر از بیدرنگ ( بیش از 30 فریم در ثانیه) بهواسطه آشکارساز برجستگی در حوزه فرکانس است که نامزدهای انتخابی هدف بهطور دقیق محاسبه شده و از روبش کل تصویر بهصورت کورکورانه جلوگیری میشود تا بار محاسباتی کاهش یابد.
|
کلیدواژه
|
رهگیری بصری طولانی مدت، شبکه پیچشی سیامی، یادگیری ژرف
|
آدرس
|
دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
n.razavi@tabrizu.ac.ir
|
|
|
|
|
|
|
|
|
long-term visual object tracking of arbitrary objects based on switching between traditional method and deep learning technique
|
|
|
Authors
|
bagherzadeh m. a. ,seyedarabi h. ,razavi n.
|
Abstract
|
visual tracking of the arbitrary object is a fundamental and challenging topic in the field of machine vision, which has traditionally been done by considering a model for the target and using the training data of the same video. most trackers can hardly top the results of the most popular methods when considering real-time and online performance. in this article, a tracker framework based on the siamese network is presented, which is an online tracker learning and a real-time tracking process, and its name is std-siam. since the siamese network has limited online training and cannot handle the challenges of tracking for the long term, std-siam aims to switch between traditional tracking and deep learning, training both trackers to eliminate the ambiguity between the target and the background in each scenario. first, the training data is generated through the traditional tracker, then these data are expanded with the augmentation technique so that the deep network can be trained well. this method can be executed at a speed of 66 fps, and compared to the current similar algorithms, despite its simplicity, it can achieve good results and track the target for the long term. this tracking speed is beyond real-time due to the spike detector in the frequency domain, which accurately calculates the selected target candidates and avoids blindly scanning the entire image to reduce the computational burden.
|
Keywords
|
long-term visual tracking ,siamese neural network ,deep learning
|
|
|
|
|
|
|
|
|
|
|