شماره ركورد :
1284892
عنوان مقاله :
پياده سازي و بهينه سازي الگوريتم AKAZE در پردازنده ARM و ارزيابي افزايش سرعت الگوريتم با استفاده از واحد NEON
عنوان به زبان ديگر :
Implementation and optimization of AKAZE algorithm in ARM processors and studying the algorithm acceleration using NEON
پديد آورندگان :
سهرابي، زهرا دانشگاه بوعلي سينا - دانشكده مهندسي، همدان، ايران , بيباك، روح الله دانشگاه تربيت مدرس - دانشكده مهندسي برق، تهران، ايران
تعداد صفحه :
12
از صفحه :
103
از صفحه (ادامه) :
0
تا صفحه :
114
تا صفحه(ادامه) :
0
كليدواژه :
الگوريتم تشخيص ويژگي AKAZE , پردازش تصوير , پردازش بلادرنگ , پردازنده هاي ARM , واحد NEON
چكيده فارسي :
در اين مقاله الگوريتم تشخيص ويژگي AKAZE براي بر روي يك پردازنده ARM نسل هفتم پياده سازي مي‌شود و سعي مي‌شود سرعت اجراي آن افزايش يابد. در اين راستا ابتدا بخش هايي از الگوريتم AKAZE كه زمان زيادي صرف اجراي آن ها مي‌شود و به نوعي گلوگاه هاي الگوريتم به حساب مي آيند، شناسايي شده و با استفاده از زبان برنامه نويسي C++ بازنويسي مي‌شوند تا سرعت اجراي الگوريتم افزايش يابد در ادامه استفاده از واحد NEON در پردازنده ARM جهت بهبود سرعت اجراي الگوريتم مورد بررسي قرار خواهد گرفت و بخش هايي از برنامه كه امكان اجراي همزمان را دارند با استفاده از دستورات اختصاصي اين واحد پياده سازي خواهند شد. بررسي انجام شده نشان مي‌دهد كه بازنويسي بخش‌هايي كه گلوگاه سرعت هستند تاثير چشمگيري در افزايش سرعت اجراي الگوريتم خواهند داشت و زمان اجراي الگوريتم با روش پيشنهادي تا 60 برابر نسبت به كدهاي موجود كاهش مي يابد. همچنين استفاده از واحد NEON و برداري سازي در برخي از بخش‌هاي الگوريتم، باعث بهبود سرعت اجراي آن بخش ها مي‌شود. اين افزايش سرعت در كاربردهايي كه نياز به پردازش تصاوير ويدئويي بصورت بلادرنگ دارند بسيار حائز اهميت است.
چكيده لاتين :
In this paper, AKAZE feature detection algorithm is implemented on a 7th generation ARM processor while it is tried to optimize the execution speed. As a first step, parts of AKAZE algorithm that are time-consuming and considered as bottleneck, are identified and rewritten using the C++ to increase the speed of the algorithm. Next, use of the NEON instructions in the ARM processor will be studied in the improvement of the execution speed of the algorithm, and parts of the program that can run simultaneously will be implemented using the specific commands of NEON. This study shows that rewriting time consuming parts of the algorithm will be very effective in terms of speed and the execution time of the algorithm with the proposed method is reduced up to 60 times compared to the existing codes. In addition, use of the NEON instructions in specific parts of the algorithm will be effective in improving the speed of program. The speed increase is very important in applications that need to process real time video images, and therefore can be useful in security systems and fast processing of camera images such as face recognition, license plate recognition, etc. required in FAVA operations.
سال انتشار :
1400
عنوان نشريه :
فناوري اطلاعات و ارتباطات انتظامي
فايل PDF :
8676286
لينک به اين مدرک :
بازگشت