طراحي يك عامل يادگيري تقويتي براي نگاشت يادگيري مبتني بر بازخورد محيط

عنوان به زبان ديگر

Design a Reinforcement learner agent for mapping based on environmental feedback

پديدآورندگان

بادنوا بابك babak_badnava@comp.iust.ac.ir دانشجوي مقطع كارشناسي ارشد رشته هوش مصنوعي و رباتيكز دانشكده مهندسي كامپيوتر در دانشگاه علم و صنعت ايران , مزيني ناصر mozayani@iust.ac.ir عضو هيئت علمي گروه هوش مصنوعي و رباتيكز دانشكده مهندسي كامپيوتر دانشگاه علم و صنعت ايران

تعداد صفحه

كليدواژه

انتقال يادگيري , يادگيري تقويتي , نگاشت , شكل دهي تابع پاداش

سال انتشار

1396

عنوان كنفرانس

نخستين كنفرانس ملي تحقيقات بازي هاي ديجيتال: گرايش ها، فناوري ها و كاربردها

زبان مدرك

فارسي

چكيده فارسي

در بسياري از وظايف محوله به يك عامل شباهت هايي موجود مي باشد كه عامل مي تواند از اين شباهت ها استفاده نموده تا نياز به يادگيري مجدد اين مهارت ها نداشته باشد، از طرفي ديگر عامل در فرآيند يادگيري يك وظيفه دانشي را نيز كسب مي نمايد كه مي تواند از آن در انجام وظايف ديگر استفاده نمايد. در اين مقاله ما به ارايه روشي براي آموزش يك نگاشت به عامل يادگيري تقويتي با استفاده از بازخوردهاي محيطي مي پردازيم و نشان خواهيم داد كه با شكل دهي به تابع پاداش يك عامل يادگير تقويتي مي توان به عامل، نگاشت از فضاي حالتي به فضاي حالت ديگر را آموزش داده و از اين نتيجه نيز در انتقال يادگيري تقويتي استفاده نمود. پس از ارايه روش ما به پياده سازي و آزمون روش ارايه شده بر روي بازي Breakout نموده ايم و مشاهده مي كنيم كه اين عامل به خوبي توانسته است نگاشت اعمال يك عامل را آموزش ببيند.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=263651