عنوان مقاله :
برنامهريزي بهرهبرداري ريزشبكهها مبتني بر الگوريتم يادگيري تقويتي عميق
پديد آورندگان :
اسمعيلي ، سعيد دانشگاه علم و صنعت ايران , ناطقي ، عليرضا دانشگاه علوم و فنون هوايي شهيد ستاري , زارع ، حسن دانشگاه فني و حرفهاي - گروه مهندسي برق , اصغرپورعلمداري ، حسين دانشگاه فني و حرفهاي - گروه مهندسي برق
كليدواژه :
ريزشبكه , گراديان استراتژي قطعي عميق , فرايند تصميمگيري ماركوف , برنامهريزي بهرهبرداري
چكيده فارسي :
در اين مقاله، برنامهريزي بهرهبرداري ريزشبكهها مشتمل بر منابع توليد انرژي و سيستمهاي ذخيره انرژي مبتني بر يادگيري تقويتي عميق ارائه شده است. با توجه به خاصيت پويايي مسئله، ابتدا در قالب يك فرايند تصميمگيري ماركوف متشكل از چهارتايي (حالت، اقدام، تابع احتمال انتقال و پاداش) فرمولبندي شده است. سپس، الگوريتم گراديان استراتژي قطعي عميق بهمنظور يادگيري استراتژي بهينۀ برنامهريزي بهرهبرداري ريزشبكه با هدف كمينه كردن هزينههاي بهرهبرداري ارائه شده است. اين الگوريتم يك روش بينياز از مدل، مستقل از استراتژي و بر مبناي معماري عامل -نقاد است كه ميتواند بهخوبي فضاي حالت و اقدام مسئله را بهصورت پيوسته مدلسازي و بر چالش بزرگ بودن ابعاد مسئله غلبه كند. بهمنظور ارزيابي الگوريتم ارائهشده، نتايج با الگوريتم يادگيري Q عميق و روش تحليلي مقايسه شد. نتايج حاصل از شبيهسازي، كارايي الگوريتم گراديان استراتژي قطعي عميق ارائهشده را از جهت همگرايي، زمان اجرا و هزينۀ كل نشان دادند.
عنوان نشريه :
مهندسي و مديريت انرژي
عنوان نشريه :
مهندسي و مديريت انرژي