شماره ركورد كنفرانس :
5399
عنوان مقاله :
بررسي عملكرد الگوريتم يادگيري تقليدي در آموزش شبكه عصبي كاملا متصل براي حل مسئله مسيريابي در محيطهاي چندعامله
پديدآورندگان :
روغني محمد m.roghani1212@gmail.com دانشگاه صنعتي اصفهان، اصفهان، ايران , حسيني سمناني سمانه samaneh.hoseini@cc.iut.ac.ir دانشگاه صنعتي اصفهان، اصفهان، ايران
كليدواژه :
مسيريابي , يادگيري تقليدي , الگوريتمهاي نامتمركز
عنوان كنفرانس :
سي و يكمين كنفرانس بين المللي مهندسي برق
چكيده فارسي :
در سالهاي اخير مدلهاي يادگيري ماشين در انواع و اقسام مسائل و كاربردها استفاده شدهاند. يكي از اين مسائل مسيريابي رباتها در محيطهاي چند عامله بوده است. علي رغم پيشرفت اين مدلها در حل اين مسئله، به جهت اين كه هرگونه خطا در كنترل رباتها ميتواند هزينههاي سنگين مالي و جاني داشته باشد هنوز راه بسياري تا استفاده تجاري از اين مدلها باقي مانده است. تحقيقات بسياري براي حل مسئله مسيريابي رباتها در محيطهاي چند عامله انجام شده است. اكثر اين تحقيقات از روشهاي يادگيري تقويتي مانند Actor Critic، Proximal Policy Optimization و ... براي آموزش مدلهاي خود استفاده كردهاند. زماني كه ما دسترسي به مدلهايي داشته باشيم كه بتوانيم از آنها تقليد كنيم، يادگيري تقويتي لزوما بهينهترين راه براي يادگيري نيست. در اين مقاله ما روشي را براي آموزش يك شبكه عصبي كاملا متصل با استفاده از يادگيري تقليدي ارائه كردهايم و عملكرد مدل تعليم ديده شده بررسي شده است. الگوريتم يادگيري تقليدي توانست با افت قابل قبولي نسبت به عامل خبره خود شبكه عصبي را آموزش دهد و انتظار ميرود اگر از يك الگوريتم بهينه يا نزديك به بهينه به عنوان عامل خبره استفاده شود در نهايت نتيجه بسيار قابل قبولي حاصل شود.