شماره ركورد كنفرانس :
4418
عنوان مقاله :
روشي يادگير براي تركيب وظايف در يادگيري تقويتي پيمانه اي
پديدآورندگان :
ميرهاشمي سيد محمد حسين دانشگاه علم و صنعت ايران , مزيني ناصر دانشگاه علم و صنعت ايران , جاهد مطلق محمدرضا دانشگاه علم و صنعت ايران
تعداد صفحه :
۷
كليدواژه :
تركيب پيمانه ها , يادگيري تقويتي پيمانه اي , يادگيري تقويتي
سال انتشار :
۱۳۹۱
عنوان كنفرانس :
يازدهمين كنفرانس سراسري سيستم هاي هوشمند
زبان مدرك :
فارسي
چكيده فارسي :
دسته اي از روش هاي يادگيري تقويتي سعي مي كنند مسائل پيچيده را با تجزيه به مسائل كوچكتر حل كنند. به اين صورت كه هدف اصلي را به تعدادي زيرهدف يا وظيفه مي شكنند و هريك را توسط يك يادگير فرا مي گيرند، سپس به تركيب اين وظايف يادگرفته شده مي پردازند. بيشتر اين روش ها به علت عدم استفاده مناسب از دانش موجود در اين پيمانه هاي فراگرفته شده، در تركيب آن ها با مشكل روبرو مي شوند، و در نتيجه نمي توانند به خوبي به هدف اصلي دست بيابند. در اين مقاله روشي يادگير براي تركيب وظايف ارائه شده است كه به علت راهكار مناسبي كه براي تركيب پيمانه ها ارائه مي كند، به جواب مناسبي براي مسئله ي اصلي مي رسد. پياده سازي اين روش در يك مسئله كه از منظر يادگيري تقويتي بسيار بزرگ و پيچيده است، عملكرد بسيار مناسبي از خود نشان داده و به كارايي بسيار بالايي مي رسد
كشور :
ايران
لينک به اين مدرک :
بازگشت