|
|
ارائه یک الگوریتم زمانبندی جدید برای کاهش زمان محاسبات در محیط هادوپ
|
|
|
|
|
نویسنده
|
پاکیزه رضا ,عارفی نژاد مجید
|
منبع
|
پدافند الكترونيكي و سايبري - 1399 - دوره : 8 - شماره : 2 - صفحه:51 -59
|
چکیده
|
امروزه پروژه متنباز هادوپ بههمراه چهارچوب نگاشت کاهش در بین موسسات، سازمانها و محققین محبوبیت زیادی دارد که برای پردازش حجم انبوهی از دادهها بهصورت موازی بر روی خوشهای از کامپیوترها بسیار مناسب است. نگاشتکاهش برای حل مشکلات محاسبات دادههای حجیم معرفی شده است که از قاعده تقسیمغلبه پیروی میکند. مانند هر جای دیگر، مبحث زمان و زمانبندی در نگاشت کاهش از اهمیت بسیار بالایی برخوردار است. بههمین دلیل در دهه اخیر الگوریتمهای زمانبندی متعددی در این زمینه تدارک یافته است. ایده اصلی این الگوریتمها افزایش نرخ محلیسازی داده، هم زمانسازی، کاهش زمان پاسخ و زمان اتمام وظایف میباشد. اکثر این الگوریتمها تک هدفه میباشند و فقط یکی از موارد ذکر شده را مورد هدف قرار میدهند. الگوریتم های چند هدفه موجود فقط بر روی یکی از فازهای اول یا دوم نگاشتکاهش تمرکز دارند. در این مقاله، یک الگوریتم زمان بندی ترکیبی مبتنی بر اولویتبندی پویا کارها و محلیسازی داده در محیط نگاشتکاهش به نام hsmrpl ارائه میشود که هدف اصلی آن افزایش نرخ محلیسازی داده و کاهش زمان محاسبات میباشد. در این الگوریتم از دو روش اولویتبندی پویا و شناسه محلیسازی استفاده میشود. برای ارزیابی الگوریتم پیشنهادی، آن را با الگوریتمهای پیشفرض هادوپ و به کمک محکهای استاندارد مقایسه کردیم. نتایج حاصله نشان میدهد که الگوریتم پیشنهادی ما نرخ محلیسازی را نسبت به الگوریتم 18/51، fifo،، درصد و نسبت به الگوریتم fair، 10/4 درصد افزایش داده است. همچنین، الگوریتم پیشنهادی ما نسبت به الگوریتم fifo، 3/8 درصد و نسبت به fair، 13/4 درصد سریعتر است.
|
کلیدواژه
|
زمانبندی نگاشتکاهش، الگوریتم ترکیبی، محلیسازی داده، اولویتبندی پویا، زمانبندی هادوپ
|
آدرس
|
دانشگاه علمی– کاربردی, گروه کامپیوتر, ایران, دانشگاه افسری و تربیت پاسداری امام حسین(ع), ایران
|
|
|
|
|
|
|
|
|
|
|
A New Scheduling Algorithm to Reduce Computation Time in Hadoop Environment
|
|
|
Authors
|
عارفی نژاد مجید
|
Abstract
|
Nowadays, the Hadoop opensource project with the MapReduce framework has become very popular as it processes vast amounts of data in parallel on large clusters of commodity hardware in a reliable and faulttolerant manner. MapReduce was introduced to solve largedata computational problems, and is dependent on the divide and conquer principle. Time and scheduling are always the most important aspects, hence in the past decades in the MapReduce environment, many scheduling algorithms have been proposed. The main ideas of these algorithms are increasing data locality rate, and decreasing response time and completion time. In this research we have proposed a new hybrid scheduling algorithm (HSMRPL) which uses dynamic job priority and identity localization techniques, and focuses on increasing data locality rate and decreasing completion time. We have evaluated and compared our algorithm with hadoop default schedulers by running concurrent workloads consisting of the WordCount and Terasort benchmarks. The results show that our proposed algorithm has increased the localization rate by 10.4% and 18.5% and the speed by 3.14% and 3.3% compared to the FIFO algorithm and the Fair algorithm respectively.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|