شماره ركورد كنفرانس :
5514
عنوان مقاله :
ارائه روشي تركيبي براي مسيريابي ربات خودمختار
پديدآورندگان :
خليلي علي دانشگاه افسري امام علي /ع /-نزاجا , شجاعيان افشين دانشگاه افسري امام علي /ع /-نزاجا
كليدواژه :
فازي , يادگيريQ , شبكه عصبيRBF , رباتKhepera
عنوان كنفرانس :
اولين همايش ملي فرماندهي و مديريت در جنگ هاي آينده
چكيده فارسي :
امروزه با پيشرفت هوش مصنوعي و استفاده از آن در ربات ها روش هاي جنگ از گذشته تاكنون دستخوش تغييرات شده است لذا جنگ هاي آينده با تصويري كه در ذهن ما است متفاوت خواهد بود. ربات ها با توجه به ويژگي هايي كه دارند، مي توانند در بيشتر مواقع عملكردي بهتري از انسان ها داشته باشند. هدف از انجام اين تحقيق ارائه روشي تركيبي براي مسيريابي ربات خودمختار است. براي انجام اين كار، از تركيب ويژگيهاي سيستمهاي فازي، يادگيري تقويتيQ و شبكه ي عصبيRBF ، جهت برآورده كردن نيازمندي مسيريابي ربات خودمختار متحرك زميني استفاده شده است. ساختار سيستم فازي و قواعد اگر-آنگاه آن، در حاليكه تصميم گيري در محيط هاي ناشناخته را فراهم مي كند، امكان به كارگيري دانش اكتشافي به دست آمده از بررسي محيط توسط فرد خبره را نيز ميسر مي كند. در عين حال، مي توان الگوريتم يادگيريQ ، به عنوان يك الگوريتم يادگيري تقويتي، را زماني كه شناخت كمي از محيط وجود دارد، ابزاري مناسبي براي تنظيم فرآيند استنتاج سيستم فازي دانست. در اين الگوريتم محيط به صورت زوجي از حالت-اقدام مدلسازي مي شود. به منظور كنترل ربات توسط ابزارهاي ذكر شده، هر حالت ابتدا فازي سازي شده و سپس براي هر يك از اين حالات فازي سازي شده تعدادي اقدام متناظر در نظر گرفته مي شود. اين نگاشت بين حالات و اقدامات توسط مجموعه قواعد اگر-آنگاه فازي، كه حاصل استدلال انساني است، انجام مي شود. سپس ربات اقدامي با بيشتر مقدار پاداش را انتخاب و اعمال مي نمايد. در عين حال شبكه عصبيRBF ، به عنوان يك تخمين زننده عمومي، جهت تعيين پارامترهاي توابع عضويت فازي و آستانه جريمه براي تابع جريمه الگوريتم يادگيريQ ، به كار گرفته مي شود.