|
|
پیاده سازی و بهینه سازی الگوریتم akaze در پردازنده arm و ارزیابی افزایش سرعت الگوریتم با استفاده از واحد neon
|
|
|
|
|
نویسنده
|
سهرابی زهرا ,بیباک روح الله
|
منبع
|
فناوري اطلاعات و ارتباطات انتظامي - 1400 - دوره : 2 - شماره : 3 - صفحه:103 -114
|
چکیده
|
در این مقاله الگوریتم تشخیص ویژگی akaze برای بر روی یک پردازنده arm نسل هفتم پیاده سازی میشود و سعی میشود سرعت اجرای آن افزایش یابد. در این راستا ابتدا بخش هایی از الگوریتم akaze که زمان زیادی صرف اجرای آن ها میشود و به نوعی گلوگاه های الگوریتم به حساب می آیند، شناسایی شده و با استفاده از زبان برنامه نویسی c++ بازنویسی میشوند تا سرعت اجرای الگوریتم افزایش یابد در ادامه استفاده از واحد neon در پردازنده arm جهت بهبود سرعت اجرای الگوریتم مورد بررسی قرار خواهد گرفت و بخش هایی از برنامه که امکان اجرای همزمان را دارند با استفاده از دستورات اختصاصی این واحد پیاده سازی خواهند شد. بررسی انجام شده نشان میدهد که بازنویسی بخشهایی که گلوگاه سرعت هستند تاثیر چشمگیری در افزایش سرعت اجرای الگوریتم خواهند داشت و زمان اجرای الگوریتم با روش پیشنهادی تا 60 برابر نسبت به کدهای موجود کاهش می یابد. همچنین استفاده از واحد neon و برداری سازی در برخی از بخشهای الگوریتم، باعث بهبود سرعت اجرای آن بخش ها میشود. این افزایش سرعت در کاربردهایی که نیاز به پردازش تصاویر ویدئویی بصورت بلادرنگ دارند بسیار حائز اهمیت است.
|
کلیدواژه
|
الگوریتم تشخیص ویژگی akaze، پردازش تصویر، پردازش بلادرنگ، پردازنده های arm، واحد neon
|
آدرس
|
دانشگاه بوعلی سینا, دانشکده مهندسی, ایران, دانشگاه تربیت مدرس, دانشکده مهندسی برق, ایران
|
پست الکترونیکی
|
r.bibak@modares.ac.ir
|
|
|
|
|
|
|
|
|
Implementation and optimization of AKAZE algorithm in ARM processors and studying the algorithm acceleration using NEON
|
|
|
Authors
|
Sohrabi zahra ,Bibak Ruhollah
|
Abstract
|
In this paper, AKAZE feature detection algorithm is implemented on a 7th generation ARM processor while it is tried to optimize the execution speed. As a first step, parts of AKAZE algorithm that are timeconsuming and considered as bottleneck, are identified and rewritten using the C++ to increase the speed of the algorithm. Next, use of the NEON instructions in the ARM processor will be studied in the improvement of the execution speed of the algorithm, and parts of the program that can run simultaneously will be implemented using the specific commands of NEON. This study shows that rewriting time consuming parts of the algorithm will be very effective in terms of speed and the execution time of the algorithm with the proposed method is reduced up to 60 times compared to the existing codes. In addition, use of the NEON instructions in specific parts of the algorithm will be effective in improving the speed of program. The speed increase is very important in applications that need to process real time video images, and therefore can be useful in security systems and fast processing of camera images such as face recognition, license plate recognition, etc. required in FAVA operations.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|