شماره ركورد :
1001253
عنوان مقاله :
استخراج گذرگاه‌ها با استفاده از تشخيص اشيا در يادگيري تقويتي
پديد آورندگان :
غضنفري، بهزاد دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , مزيني، ناصر دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , جاهد مطلق، محمدرضا دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر
تعداد صفحه :
8
از صفحه :
55
تا صفحه :
62
كليدواژه :
يادگيري تقويتي , خوشه‌بندي اشيا , يادگيري تقويتي سلسله مراتبي , اقدامات گسترش‌يافته زماني
چكيده فارسي :
اين مقاله روش جديدي را مطرح مي‌كند كه قادر به استخراج گذرگاه‌ها به‌صورت اتوماتيك براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستم‌هاي بيولوژيكي، رفتار و مسيريابي حيوانات الهام گرفته شده است و به‌ واسطه تعاملات عامل با محيط پيراموني‌اش عمل مي‌كند. عامل با استفاده از خوشه‌بندي و تشخيص اشيا به‌صورت سلسله مراتبي، نشانه‌هايي را پيدا مي‌كند. اگر اين نشانه‌ها در فضاي اقدام به هم نزديك باشند، گذرگاه‌ها با استفاده از حالت‌هاي بين آنها استخراج مي‌شوند. نتايج آزمايش‌ها بهبود قابل ملاحظه‌اي را در فرايند يادگيري تقويتي در مقايسه با ساير روش‌هاي مشابه نشان مي‌دهد.
سال انتشار :
1391
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
فايل PDF :
7430386
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
لينک به اين مدرک :
بازگشت