شماره ركورد كنفرانس :
4360
عنوان مقاله :
رهيافت جديدي براي تبديل محيط هاي غير ماركوف به ماركوف و كاربرد آن در مسيريابي ربات هاي متحرك خودگردان
پديدآورندگان :
ايماني مهدي دانشجوي كارشناسي ارشد مهندسي برق , قريشي سيده فاطمه دانشجوي كارشناسي ارشد مهندسي مكانيك , شريعت پناهي مسعود دانشگاه تهران , ايماني فرهاد دانشجوي كارشناس ارشد مهندسي صنايع
كليدواژه :
يادگيري تقويتي , محيطهاي غيرماركوفي , رباتهاي متحرك خودگردان
عنوان كنفرانس :
نهمين كنفرانس بين المللي مهندسي صنايع
چكيده فارسي :
روشهاي يادگيري ماشين به ويژه روشهاي مبتني بريادگيري تقويتي Reinforcement Learning كه كاربرد گسترده اي درحوزههايي همچون داده كاوي و كنترل سيستم هاي الكترومكانيكي يافته اند عموما برايكاردرمحيطهاي ماركوفي Markovian) طراحي شده اند و باحذف اين ويژگي ازمحيط كارايي اين روش ها بشدت كاهش مي يابد دراين مقاله رهيافت جديدي براي تبديل محيطهاي غيرماركوفي Non-Markovian بهمحيطهاي ماركوفي ارايه گرديدها ست دراين رهيافت وضعيت هاي STATE جديد با برقراري شرط استقلال وضعيت ها به صورت لايه اي به وضعيت هاي پيشين اضافه شده و درنتيجه هركنش action درهروضعيت بهصورت كاملا مجزا ازوضعيتهاي ديگر اعمال ميگردد براي نشان دادنكارايي رهيافت پيشنهادي اين روش درحل دو مساله كنترل حركت يك ربات متحرك خودگردان درمحيطهاي غيرماركوفي به كارگرفته شده است دراين مسائل پس از اعمال روش پيشنهادي استفاده ازروش هاي كلاسيك يادگيري تقويتي همچون Q-Learning ، SARSA ، TD(0) R-Learning را ممكن ساخته است.