شماره ركورد كنفرانس :
5421
عنوان مقاله :
كنترل بهينه ربات تك لينكي غيرخطي به روش يادگيري تقويتي Q-Learning
عنوان به زبان ديگر :
Optimal Control of Nonlinear Single-Link Robot by Q-Learning Reinforcement Learning Method
پديدآورندگان :
صابري سجاد sajadsaberi31@gmail.com دانشگاه آزاد اسلامي واحد نجف آباد , چترايي عباس abbas.chatraei@gmail.com دانشگاه آزاد اسلامي واحد نجف آباد , شجاعي خوشنام khoshnam.shojaee@gmail.com دانشگاه آزاد اسلامي واحد نجف آباد
كليدواژه :
تكرار سياست , ربات تك لينكي غيرخطي , روش Q , Learning , كنترل بهينه , يادگيري تقويتي
عنوان كنفرانس :
اولين كنفرانس بين المللي و هفتمين كنفرانس ملي مهندسي برق و سيستمهاي هوشمند
چكيده فارسي :
در اين مقاله، كنترل بهينه سيستم هاي رباتيك با ديناميك نامعلوم با استفاده از روش يادگيري تقويتي ارائه شده است. از بين روش هاي مختلف يادگيري تقويتي، در اينجا از الگوريتم Q-Learning مبتني بر تكنيك تكرار سياست استفاده شده است. در اين الگوريتم از ساختار بازيگر-منتقد بهره گرفته مي شود، كه بر اساس آن معادله غيرخطي هميلتون-ياكوبي-بلمن بطور بر خط و با استفاده از شبكه هاي عصبي حل شده است. در ضمن با وجود ديناميك نامعلوم پلنت، مسئله كنترل بهينه با مينيمايز كردن تابع هزينه حل مي گردد. روش ارائه شده بر روي ربات تك لينكي به كار رفته و در نرم افزار متلب شبيه سازي شده است.