Title of article :
Stability Assessment Metamorphic Approach (SAMA) for Effective Scheduling based on Fault Tolerance in Computational Grid
Author/Authors :
Shamila Ebenezer, A Department of Computer Science and Engineering - Karunya University , Baskaran, K Department of Computer Science and Engineering - Government College of Technology
Abstract :
Grid Computing allows coordinated and controlled resource sharing and problem solving in multi-institutional, dynamic virtual organizations. Moreover, fault tolerance and task scheduling is an important issue for large scale computational grid because of its unreliable nature of grid resources. Commonly exploited techniques to realize fault tolerance is periodic Checkpointing that periodically saves the job’s state. But an inappropriate checkpointing interval prevails to delay in the job execution, and reduces the throughput. With that concern, this paper endeavors to ensure better performance on computational grid with more effective and reliable fault tolerant system using a novel Stability Assessment Metamorphic Approach (SAMA). Here, the strategy used to attain fault tolerance is by adapting the checkpoints depending on the current status and past failure information of the resources dynamically, which is being maintained in the information server. Effective scheduling process can be achieved by fault tolerance based scheduling that involves in determination of deviation rate of all nodes using some high-stability assessment constraints. This evinces the job to be accomplished within the deadline with improved throughput and paves a way for making the grid environment trust worthy.
Farsi abstract :
محاسبات شبكه اي اجازه به اشتراك گذاري هماهنگ و كنترل شده منابع و حل مساله در چند موسسه و سازمان هاي مجازي پويا را مي دهد. علاوه بر اين، به دليل ماهيت غير قابل اعتماد منابع شبكه، تحمل خطا و وظيفه برنامه ريزي، يك مسئله مهم براي شبكه محاسباتي در مقياس بزرگ است. روش معمول بهره برداري براي تحقق بخشيدن به تحمل خطا، محركه تناوبي است كه به صورت دوره اي موجب صرفه جويي در كار مي شود. اما فاصله زماني نقطه بررسي نامناسب موجب تاخير و كاهش توان عملياتي در اين كار مي گردد. با توجه به اين مسأله، اين مقاله براي اطمينان از عملكرد بهتر در شبكه هاي محاسباتي با سيستم قابل تحمل خطاي موثر و قابل اعتماد، با استفاده از روش جديد ثبات ارزيابي دگرگوني (SAMA) تلاش مي كند. در اينجا، از استراتژي كه با تغييراتي اندك در نقاط بررسي و با توجه به وضعيت فعلي و اطلاعات مربوط به خرابي گذشته در مورد منابع به صورت پويا، كه در سرور اطلاعات وجود داشت، براي رسيدن به تحمل خطا استفاده شده است. فرايند برنامه ريزي موثر را مي توان با اغماض بر اساس برنامه ريزي خطا كه شامل تعيين ميزان انحراف از تمام گره ها با استفاده از برخي محدوديت هاي ارزيابي با ثبات بالا به دست آورد. اين روش به روشني نشان داد كه كار در طول زمان مقرر و با توان بهبود يافته انجام مي شود و راهي قابل اعتماد براي ساخت محيط شبكه است.
Keywords :
Checkpointing , grid computing , fault tolerance , recovery rate , scheduling
Journal title :
Astroparticle Physics