|
|
بهبود کارایی تبدیل موجک گسسته دوبعدی با استفاده از تکنیک موازیسازی در سطح داده
|
|
|
|
|
نویسنده
|
تیباش عبدالبصیر ,شاه بهرامی اسدالله
|
منبع
|
مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 4 - صفحه:1547 -1558
|
چکیده
|
تبدیل موجک گسسته دوبعدی (2ddwt) بهصورت گستردهای در کاربردهای مختلف پردازش دادههای چندرسانهای ازجمله استانداردهای فشردهسازی تصاویر و ویدئو مورداستفاده قرار میگیرد. بااینوجود، این تبدیل دارای پیچیدگی محاسباتی بالاتری نسبت به تبدیلهای مرسوم مانند تبدیل گسسته کسینوسی و دیگر توابع موجود در استانداردهای فشردهسازی است و بیشترین درصد از زمان اجرا را به خود اختصاص میدهد. در این مقاله، برای بهبود کارایی 2ddwt از مجموع دستورات فنّاوریهای توسعه برداری پیشرفته avx/avx2 و جمع ضرب ترکیبی (fma) که قابلیت پردازش 256 بیت داده با استفاده از معماری یک دستورالعمل و چندین داده (simd) که توسط اکثر پردازشگرهای همهمنظوره (gpp) پشتیبانی میگردد، پیشنهادشده است. با استفاده از این فنّاوریها قابلیت پردازش هشت داده 32 بیتی برای اعداد اعشاری و شانزده داده 16 بیتی برای اعداد صحیح شانزده بیتی در ثباتهای simd یک gpp فراهم میگردد. بعلاوه نحوی نگاشت تبدیلهای مختلف موجک به روش پردازشهای سطریستونی که پردازشهای سطری و ستونی را جداگانه انجام میدهد و مبتنی بر خط که هر دو، سطرها و ستونهای تصویر را در یک حلقه پردازش میکند، استفادهشده است. نتایج پیادهسازی موازیسازی تبدیلهای مختلف بر روی یک پلتفرم gpp نشان داد که کارایی، 2ddwt به ازای اندازه تصاویر مختلف را میتوان تا 28.8 برابر نسبت به پیادهسازی سریال بالا برد. همچنین نگاشت مبتنی بر خط که باعث استفاده بهتر از ساختار سلسله مراتبی حافظه میگردد، کارایی را نسبت به نگاشت سطری – ستونی بیشتر بهبود میدهد.
|
کلیدواژه
|
پردازشگرهای همهمنظوره، پردازش موازی، تبدیل موجک گسسته دوبعدی، موازیسازی سطح داده، یک دستورالعمل چندین داده
|
آدرس
|
دانشگاه گیلان, دانشکده فنی, گروه مهندسی کامپیوتر, ایران, دانشگاه گیلان, دانشکده فنی, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
shahbahrami@guilan.ac.ir
|
|
|
|
|
|
|
|
|
Performance Improvement of 2D Discrete Wavelet Transform using Data-Level Parallelism Technique
|
|
|
Authors
|
تیباش عبدالبصیر
|
Abstract
|
The twoDimensional Discrete Wavelet Transform (2DDWT) is widely used in various applications for multimedia data processing, including image and video compression standards. However, this transform is computational intensive than conventional conversions, such as the discrete cosine transform. In this paper, in order to improve the performance of 2DDWT, we use Single Instruction, Multiple Data (SIMD) set instructions including Advanced Vector Extensions (AVX), Fused MultiplyAdd (FMA), and AVX2 supported by most GeneralPurpose Processors (GPP). These technologies capable to process 256bit data located in SIMD registers. The AVX technology can process eight 32bit floating point numbers, while AVX2 processes sixteen 16bit fixedpoint numbers. In other words, it is possible to exploit 8 and 16way datalevel parallelism. In addition, two different way of parallelism, Row Column Wavelet Transform (RCWT) which processes rows and columns separately and LineBased Wavelet Transform (LBWT) that processes both rows and columns in a single loop are used. Experimental results of different wavelet transform with different image sizes on a GPP show that the speedups of up to 28.8x yield. Furthermore, LBWT approach improves performance more than RCWT. This is because it uses memory hierarchy structure more efficiently than RCWT approach.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|