|
|
تشخیص رفتارهای خشونت آمیز فیلم های نظارتی بااستفاده از کانولوشن زمانی مکانی و آتروس کانولوشن
|
|
|
DOR
|
20.1001.2.0020193782.1400.1.1.5.3
|
نویسنده
|
لک بهزاد ,پاک عقیده طیبه
|
منبع
|
وب پژوهي - 1400 - دوره : 7 - هفتمین کنفرانس بین المللی وب پژوهی - کد همایش: 00201-93782
|
چکیده
|
تشخیص اشیای متحرک در هر فریم گامی اساسی در تحلیل ویدئو و تشخیص خشونت است.در این مقاله روشی جدید برای جداسازی فریم های حاوی اطلاعات حرکتی و تشخیص خشونت در آنها ارائه شده است.در روش پیشنهادی جداسازی فریم های حاوی اطلاعات حرکتی و تشخیص خشن بودن آنها در دو سطح شبکه صورت می گیرد.در سطح یک آتروس کانولوشن ویدئوهای ورودی به شبکه را دریافت می کند و با اعمال تقسیم بندی معنایی روی فریم های ورود به شبکه فریم های حاوی اطلاعات حرکتی را جداسازی می کند سپس آنها را جهت تشخیص خشن بودن رفتار های صورت گرفته به سطح دو شبکه یعنی کانولوشن زمانی مکانی انتقال می دهد.در انتها جهت اطمینان از صحت عملکرد شبکه واحد رگرسیون پس از بررسی خروجی شبکه اطلاعات را در دو کلاس خشن و غیرخشن دسته بندی می کند و برای آنها نمره در نظر میگیرد.هرچقدر نمره به دست آمده نزدیک 0 باشد یعنی خشونت تشخیص داده نشده و هرچقدر این نمره نزدیک1 باشد یعنی خشونت تشخیص داده شده است.برای نمایش میزان دقت الگوریتم پیشنهادی دو مجموعه دادگان مورد بررسی قرار گرفته اند که مجموع دقت به دست آمده از آنها برابر با 96% در مجموعه داده ucf-crime و همچنین %93 از مجموعه داده surveillance video است.
|
کلیدواژه
|
کانولوشن زمانی – مکانی ,آتروس کانولوشن ,تقسیم بندی معنایی ویدئو ,شبکه ی جریان ,فریم کلیدی انطباقی
|
آدرس
|
دانشگاه علوم انتظامی امین, ایران, دانشگاه علوم انتظامی امین, ایران
|
پست الکترونیکی
|
t.pakaghideh72@yahoo.com
|
|
|
|
|
|
|
|
|
Behaviors Violence Detection of Surveillance Video Using Spatial-Temporal Convolution and Atrous Convolutional
|
|
|
Authors
|
|
Abstract
|
Detecting moving objects in each frame is an essential step in video analysis and violence detection. In this paper, a new method for separating frames containing motion information and detecting violence in them is presented. In the proposed method, frames containing motion information are separated and their roughness is detected at two levels of the network. At level one, Atrose Convolution receives input video to the network and Separates frames containing motion information by applying semantic segmentation to network entry frames then transfers them to the level of the two networks, spatial-temporal convolution, for violence detection. Finally, in order to ensure the correct operation of the network, the regression unit, after checking the output of the information, classifies it into two classes, rough and non-rough, and considers a score for them. The closer the score is to 0, the less violence is detected, and the closer the score is to 1, the more violence is detected. To show the accuracy of the proposed algorithm, two sets of data have been examined, the total accuracy obtained from them is equal to 96% in the ucf-crime data set and also 93% of the surveillance video data set.
|
Keywords
|
کانولوشن زمانی – مکانی ,آتروس کانولوشن ,تقسیم بندی معنایی ویدئو ,شبکه ی جریان ,فریم کلیدی انطباقی
|
|
|
|
|
|
|
|
|
|
|