>
Fa   |   Ar   |   En
   پیاده سازی و بهینه سازی الگوریتم akaze در پردازنده arm و ارزیابی افزایش سرعت الگوریتم با استفاده از واحد neon  
   
نویسنده سهرابی زهرا ,بیباک روح الله
منبع فناوري اطلاعات و ارتباطات انتظامي - 1400 - دوره : 2 - شماره : 3 - صفحه:103 -114
چکیده    در این مقاله الگوریتم تشخیص ویژگی akaze برای بر روی یک پردازنده arm نسل هفتم پیاده سازی می‌شود و سعی می‌شود سرعت اجرای آن افزایش یابد. در این راستا ابتدا بخش هایی از الگوریتم akaze که زمان زیادی صرف اجرای آن ها می‌شود و به نوعی گلوگاه های الگوریتم به حساب می آیند، شناسایی شده و با استفاده از زبان برنامه نویسی c++ بازنویسی می‌شوند تا سرعت اجرای الگوریتم افزایش یابد در ادامه استفاده از واحد neon در پردازنده arm جهت بهبود سرعت اجرای الگوریتم مورد بررسی قرار خواهد گرفت و بخش هایی از برنامه که امکان اجرای همزمان را دارند با استفاده از دستورات اختصاصی این واحد پیاده سازی خواهند شد. بررسی انجام شده نشان می‌دهد که بازنویسی بخش‌هایی که گلوگاه سرعت هستند تاثیر چشمگیری در افزایش سرعت اجرای الگوریتم خواهند داشت و زمان اجرای الگوریتم با روش پیشنهادی تا 60 برابر نسبت به کدهای موجود کاهش می یابد. همچنین استفاده از واحد neon و برداری سازی در برخی از بخش‌های الگوریتم، باعث بهبود سرعت اجرای آن بخش ها می‌شود. این افزایش سرعت در کاربردهایی که نیاز به پردازش تصاویر ویدئویی بصورت بلادرنگ دارند بسیار حائز اهمیت است.
کلیدواژه الگوریتم تشخیص ویژگی akaze، پردازش تصویر، پردازش بلادرنگ، پردازنده های arm، واحد neon
آدرس دانشگاه بوعلی سینا, دانشکده مهندسی, ایران, دانشگاه تربیت مدرس, دانشکده مهندسی برق, ایران
پست الکترونیکی r.bibak@modares.ac.ir
 
   Implementation and optimization of AKAZE algorithm in ARM processors and studying the algorithm acceleration using NEON  
   
Authors Sohrabi zahra ,Bibak Ruhollah
Abstract    In this paper, AKAZE feature detection algorithm is implemented on a 7th generation ARM processor while it is tried to optimize the execution speed. As a first step, parts of AKAZE algorithm that are timeconsuming and considered as bottleneck, are identified and rewritten using the C++ to increase the speed of the algorithm. Next, use of the NEON instructions in the ARM processor will be studied in the improvement of the execution speed of the algorithm, and parts of the program that can run simultaneously will be implemented using the specific commands of NEON. This study shows that rewriting time consuming parts of the algorithm will be very effective in terms of speed and the execution time of the algorithm with the proposed method is reduced up to 60 times compared to the existing codes. In addition, use of the NEON instructions in specific parts of the algorithm will be effective in improving the speed of program. The speed increase is very important in applications that need to process real time video images, and therefore can be useful in security systems and fast processing of camera images such as face recognition, license plate recognition, etc. required in FAVA operations.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved