شماره ركورد كنفرانس :
4605
عنوان مقاله :
بهينه سازي جريان هاي ترافيكي در يك تقاطع توسط الگوريتم يادگيري تقويتي با حذف جدول حالت و عمل
پديدآورندگان :
عربي عليرضا Alireza.arabi1@sadjad.ac.ir دانشگاه صنعتي سجاد، مشهد، ايران؛ , نوري امين Amin.noori@sadjad.ac.ir دانشگاه صنعتي سجاد، مشهد، ايران؛
كليدواژه :
كنترل سيگنال ترافيك , يادگيري تقويتي , شبكه عصبي
عنوان كنفرانس :
بيست و ششمين كنفرانس مهندسي برق ايران
چكيده فارسي :
رشد جمعيت و افزايش وسايل نقليه در شهرها، موجب افزايش مدت زمان سفرهاي داخلي، افزايش مصرف سوخت، افزايش آلودگي هاي محيط زيستي و مسدود شدن تقاطع ها شده است. براي مقابله با اين مشكلات و افزايش كارايي زير ساختهاي فعلي، از سيستم هاي هوشمند كنترل ترافيك استفاده مي شود. ترافيك داراي ماهيت پويا و تصادفي است، به همين دليل استفاده از يادگيري تقويتي به عنوان يك سيستم هوشمند براي كنترل ترافيك حائز اهميت مي باشد، اما ساختار داخلي اين كنترل كننده (جدول حالت-عمل) موجب كاهش سرعت يادگيري در محيط هاي ترافيكي با پويايي بالا (تعداد حالت و عمل زياد) مي شود و در مواردي عامل يادگيرنده به علت بزرگي اين جدول درگير نفرين ابعاد مي شود و عمل يادگيري اتفاق نمي افتد. در اين مقاله براي اولين بار، با ارائه يك روش جديد بر پايه تركيب شبكه عصبي و يادگيري تقويتي موجب حذف جدول حالت و عمل و ارزش دهي اعمال و سياست شده است. همچنين اين روش، سرعت همگرايي عامل يادگيرنده را به نسبت به روش يادگيري تقويتي بدون شبكه عصبي تا 97 درصد افزايش و با تعداد كم آموزش، عملكرد مطلوب را ارايه داده است.