شماره ركورد كنفرانس :
3752
عنوان مقاله :
مروري بر راهكارهاي بهبود الگوريتم يادگيري تقويتي
پديدآورندگان :
شهرياري فولادي مريم mry_sh@yahoo.com دانشكده مهندسي كامپيوتر، واحد نجف آباد، دانشگاه آزاد اسلامي، نجف آباد، ايران. , نورافزا نسيم noorafza@iaun.ac.ir دانشكده مهندسي كامپيوتر، واحد نجف آباد، دانشگاه آزاد اسلامي، نجف آباد، ايران.
كليدواژه :
الگوريتم يادگيري تقويتي Q , ماژولاريتي , سيستمهاي فازي , شبكه عصبي
عنوان كنفرانس :
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
چكيده فارسي :
رباتها و يا عوامل هوشمند به جهت يافتن راهكار و روشي جهت حل مسائل دشوار و كنترل كردن سيستمهاي پيچيده و توزيعشده مورد استفاده قرار ميگيرند. تعامل صحيح بين عوامل و يا محيط پيرامون آنها منجر ميشود تا بتوان در دنياي واقعي از آنها بهره بهتر برد. هر ربات براي بهبود رفتار خود ميتواند از راهكارهاي يادگيري ماشين استفاده كند كه روشهاي بدون مدل براي محيطهاي غيرقابلپيشبيني مناسب به نظر ميرسد. از بين روشهاي يادگيري بدون مدل نيز، روش يادگيري تقويتي Q، محبوبيت بسيار زيادي در طراحي و ساخت رباتها يافته است. به همين جهت در اين مقاله سعي بر آن شده تا علاوه بر معرفي اين روش، كاربردهاي آن در انواع رباتهاي زيرآبي، انساننما، وزنهبردار، بازيكن فوتبال و مسيرياب بررسي گردد. بسياري از محققين راهكارهايي براي ارتقا كيفيت يادگيري نسبت به روش اوليه يادگيري تقويتي Q ارائه دادهاند كه به اجمال به آنها پرداخته خواهد شد.