شماره ركورد كنفرانس :
4448
عنوان مقاله :
طراحي يك عامل يادگيري تقويتي براي نگاشت يادگيري مبتني بر بازخورد محيط
عنوان به زبان ديگر :
Design a Reinforcement learner agent for mapping based on environmental feedback
پديدآورندگان :
بادنوا بابك babak_badnava@comp.iust.ac.ir دانشجوي مقطع كارشناسي ارشد رشته هوش مصنوعي و رباتيكز دانشكده مهندسي كامپيوتر در دانشگاه علم و صنعت ايران , مزيني ناصر mozayani@iust.ac.ir عضو هيئت علمي گروه هوش مصنوعي و رباتيكز دانشكده مهندسي كامپيوتر دانشگاه علم و صنعت ايران
كليدواژه :
انتقال يادگيري , يادگيري تقويتي , نگاشت , شكل دهي تابع پاداش
عنوان كنفرانس :
نخستين كنفرانس ملي تحقيقات بازي هاي ديجيتال: گرايش ها، فناوري ها و كاربردها
چكيده فارسي :
در بسياري از وظايف محوله به يك عامل شباهت هايي موجود مي باشد كه عامل مي تواند از اين شباهت ها استفاده نموده تا نياز به يادگيري مجدد اين مهارت ها نداشته باشد، از طرفي ديگر عامل در فرآيند يادگيري يك وظيفه دانشي را نيز كسب مي نمايد كه مي تواند از آن در انجام وظايف ديگر استفاده نمايد. در اين مقاله ما به ارايه روشي براي آموزش يك نگاشت به عامل يادگيري تقويتي با استفاده از بازخوردهاي محيطي مي پردازيم و نشان خواهيم داد كه با شكل دهي به تابع پاداش يك عامل يادگير تقويتي مي توان به عامل، نگاشت از فضاي حالتي به فضاي حالت ديگر را آموزش داده و از اين نتيجه نيز در انتقال يادگيري تقويتي استفاده نمود. پس از ارايه روش ما به پياده سازي و آزمون روش ارايه شده بر روي بازي Breakout نموده ايم و مشاهده مي كنيم كه اين عامل به خوبي توانسته است نگاشت اعمال يك عامل را آموزش ببيند.