شماره ركورد :
66851
عنوان :
طراحي و پياده سازي يك عامل هوشمند بر اساس يادگيري تقويتي سلسله مراتبي
پديدآورندگان :
كاتبي سراج الدين نويسنده , صلاحي اكرم نويسنده
نام دانشگاه :
دانشگاه شيراز
رشته :
فوق ليسانس
تعداد صفحه :
0
سال انتشار :
1385
كليدواژه زبان طبيعي :
طراحي و پياده سازي عامل هوشمند يادگيري تقويتي سلسه مراتبي مهندسي رايانه رده مهندسي
چكيده :
يادگيري تقويتي با مشكل سختي بعد مواجه است فتعداد پارامترهايي كه بايد ياد گرفته شود به صورت نمايي با بزرگ شدن فضاي حالت سيستم ، رشد مي كند. جستجوهاي فعلي براي مبارزه با سختي بعد، منجر به گسترش راه هاي اصولي در شيوه خلاصه سازي موقتي شده است فجايي كه تصميم گيري در هر گام لازم نيست بلكه رفتارهاي تمديد شده موقتي تمايل دارند كه سياست هاي شخصي خود را تا تمام نشدن دنبال كنند. بطور طبيعي ، خلاصه سازي موقتي مار را به سمت پياده سازي ساختارهاي كنترلي سلسه مراتبي و الگوريتم هاي مربوط به آن رهنمون مي سازد. اين پايان نامه ، شيوه هاي مختلف خلاصه سازي موقتي و ساختارهاي سلسله مراتبي كه اخيرا محققين يادگيري ماشين طراحي نموده اند را مرور مي كند. سپس بكارگيري سلسله مراتبي را براي مساله تاكسي بررسي نموده و كارايي الگوريتم هاي يادگيري تقويتي و يادگيري تقويتي سلسله مراتبي مرسوم را آزمايش مي كند. اين آزمايش شامل يك مقايسه جامع بين يادگيري مسطح و يادگيري سلسله مراتبي است . نكات پيشنهادي در مورد مشكلات ناشي از توسعه آينده يادگيري تقويتي در حالت سلسله مراتبي مي باشد.
يادداشت :
دانشگاه شيراز
زبان :
فارسي
لينک به اين مدرک :
بازگشت