>
Fa   |   Ar   |   En
   بهبود کارایی تبدیل موجک گسسته دوبعدی با استفاده از تکنیک موازی‌سازی در سطح داده  
   
نویسنده تیباش عبدالبصیر ,شاه بهرامی اسدالله
منبع مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 4 - صفحه:1547 -1558
چکیده    تبدیل موجک گسسته دوبعدی (2ddwt) به‌صورت گسترده‌ای در کاربردهای مختلف پردازش داده‌های چندرسانه‌ای ازجمله استانداردهای فشرده‌سازی تصاویر و ویدئو مورداستفاده قرار می‌گیرد. بااین‌وجود، این تبدیل دارای پیچیدگی محاسباتی بالاتری نسبت به تبدیل‌های مرسوم مانند تبدیل گسسته کسینوسی و دیگر توابع موجود در استانداردهای فشرده‌سازی است و بیشترین درصد از زمان اجرا را به خود اختصاص می‌دهد. در این مقاله، برای بهبود کارایی 2ddwt از مجموع دستورات فنّاوری‌های توسعه برداری پیشرفته avx/avx2 و جمع ضرب ترکیبی (fma) که قابلیت پردازش 256 بیت داده با استفاده از معماری یک دستورالعمل و چندین داده (simd) که توسط اکثر پردازشگرهای همه‌منظوره (gpp) پشتیبانی می‌گردد، پیشنهادشده است. با استفاده از این فنّاوری‌ها قابلیت پردازش هشت داده 32 بیتی برای اعداد اعشاری و شانزده داده 16 بیتی برای اعداد صحیح شانزده بیتی در ثبات‌های simd یک gpp فراهم می‌گردد. بعلاوه نحوی نگاشت تبدیل‌های مختلف موجک به روش پردازش‌های سطریستونی که پردازش‌های سطری و ستونی را جداگانه انجام می‌دهد و مبتنی بر خط که هر دو، سطرها و ستون‌های تصویر را در یک حلقه پردازش می‌کند، استفاده‌شده است. نتایج پیاده‌سازی موازی‌سازی تبدیل‌های مختلف بر روی یک پلتفرم gpp نشان داد که کارایی، 2ddwt به ازای اندازه تصاویر مختلف را می‌توان تا 28.8 برابر نسبت به پیاده‌سازی سریال بالا برد. همچنین نگاشت مبتنی بر خط که باعث استفاده بهتر از ساختار سلسله مراتبی حافظه می‌گردد، کارایی را نسبت به نگاشت سطری – ستونی بیشتر بهبود می‌دهد.
کلیدواژه پردازشگرهای همه‌منظوره، پردازش موازی، تبدیل موجک گسسته دوبعدی، موازی‌سازی سطح داده، یک دستورالعمل چندین داده
آدرس دانشگاه گیلان, دانشکده فنی, گروه مهندسی کامپیوتر, ایران, دانشگاه گیلان, دانشکده فنی, گروه مهندسی کامپیوتر, ایران
پست الکترونیکی shahbahrami@guilan.ac.ir
 
   Performance Improvement of 2D Discrete Wavelet Transform using Data-Level Parallelism Technique  
   
Authors تیباش عبدالبصیر
Abstract    The twoDimensional Discrete Wavelet Transform (2DDWT) is widely used in various applications for multimedia data processing, including image and video compression standards. However, this transform is computational intensive than conventional conversions, such as the discrete cosine transform. In this paper, in order to improve the performance of 2DDWT,  we use Single Instruction, Multiple Data (SIMD) set instructions including Advanced Vector Extensions (AVX), Fused MultiplyAdd (FMA), and AVX2 supported by most GeneralPurpose Processors (GPP). These technologies capable to process 256bit data located in SIMD registers. The AVX technology can process eight 32bit floating point numbers, while AVX2 processes sixteen 16bit fixedpoint numbers. In other words, it is possible to exploit 8 and 16way datalevel parallelism. In addition, two different way of parallelism, Row Column Wavelet Transform (RCWT) which processes rows and columns separately and LineBased Wavelet Transform (LBWT) that processes both rows and columns in a single loop are used. Experimental results of different wavelet transform with different image sizes on a GPP show that the speedups of up to 28.8x yield. Furthermore, LBWT approach improves performance more than RCWT. This is because it uses memory hierarchy structure more efficiently than RCWT approach.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved