عنوان مقاله :
دستيابي به همكاري از طريق يادگيري تقويتي چند عاملي در معماي زنداني تكرارشونده
پديد آورندگان :
فرزانه ، سميرا دانشگاه كاشان - دانشكده مهندسي برق و كامپيوتر , زندي ، فرشته دانشگاه كاشان - دانشكده مهندسي برق و كامپيوتر , سليمي سرتختي ، جواد دانشگاه كاشان - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
عدم همكاري متقابل , معماي زنداني تكرارشونده , يادگيري تقويتي , همكاري متقابل , LSTM
چكيده فارسي :
امروزه معماي زنداني يكي از مسائل اوليه و مهم در نظريه بازي ها است. در اين معما نقطه تعادل نشي وجود دارد و چنانچه عامل ها منطقي رفتار كنند در آن نقطه بازي مي كنند؛ بدين منظور عامل ها بر اي دستيابي به سود بيشتر از بين دو عمل همكاري و عدم همكاري، عدم همكاري را انتخاب ميكنند. در حاليكه براي عامل ها نقطه بهتري نسبت به نقطه نش وجود دارد و آن هم اين است كه هر دو عامل همكاري را انتخاب كنند. بنابراين، در جهت افزايش ميزان همكاري عامل ها معماي زنداني به صورت معماي زنداني تكرارشونده با يك رويكرد يادگيري تقويتي در نظر گرفته شده است. نتايج مقاله نشان دهنده اين است كه رويكرد مورد نظر سبب افزايش ميزان همكاري عامل ها شده است و اگر عاملي همكاري را پيشه كند عامل ديگر نيز همكاري را انتخاب مي كند و بالعكس.
عنوان نشريه :
محاسبات و سامانه هاي توزيع شده
عنوان نشريه :
محاسبات و سامانه هاي توزيع شده