مروري بر راهكارهاي بهبود الگوريتم يادگيري تقويتي

پديدآورندگان

شهرياري فولادي مريم mry_sh@yahoo.com دانشكده مهندسي كامپيوتر، واحد نجف آباد، دانشگاه آزاد اسلامي، نجف آباد، ايران. , نورافزا نسيم noorafza@iaun.ac.ir دانشكده مهندسي كامپيوتر، واحد نجف آباد، دانشگاه آزاد اسلامي، نجف آباد، ايران.

تعداد صفحه

كليدواژه

الگوريتم يادگيري تقويتي Q , ماژولاريتي , سيستم‌هاي فازي , شبكه عصبي

سال انتشار

1395

عنوان كنفرانس

اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر

زبان مدرك

فارسي

چكيده فارسي

ربات‌ها و يا عوامل هوشمند به جهت يافتن راهكار و روشي جهت حل مسائل دشوار و كنترل كردن سيستم‌هاي پيچيده و توزيع‌شده مورد استفاده قرار مي‌گيرند. تعامل صحيح بين عوامل و يا محيط پيرامون آن‌ها منجر مي‌شود تا بتوان در دنياي واقعي از آن‌ها بهره بهتر برد. هر ربات براي بهبود رفتار خود مي‌تواند از راهكارهاي يادگيري ماشين استفاده كند كه روش‌هاي بدون مدل براي محيط‌هاي غيرقابل‌پيش‌بيني مناسب به نظر مي‌رسد. از بين روش‌هاي يادگيري بدون مدل نيز، روش يادگيري تقويتي Q، محبوبيت بسيار زيادي در طراحي و ساخت ربات‌ها يافته است. به همين جهت در اين مقاله سعي بر آن شده تا علاوه بر معرفي اين روش، كاربردهاي آن در انواع ربات‌هاي زيرآبي، انسان‌نما، وزنه‌بردار، بازيكن فوتبال و مسيرياب بررسي گردد. بسياري از محققين راهكارهايي براي ارتقا كيفيت يادگيري نسبت به روش اوليه يادگيري تقويتي Q ارائه داده‌اند كه به اجمال به آن‌ها پرداخته خواهد شد.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=189269