شماره ركورد :
847435
عنوان مقاله :
طراحي سازوكار تداركات براساس يادگيري Q و با سياست انتخاب عمل مبتني بر الگوريتم ازدحام ذرات
پديد آورندگان :
كاهه، زهره نويسنده كارشناس ارشد مهندسي صنايع، دانشگاه تربيت مدرس، تهران , , برادران كاظم زاده، رضا نويسنده دانشيار گروه مهندسي صنايع ,
اطلاعات موجودي :
فصلنامه سال 1395 شماره 51
رتبه نشريه :
علمي ترويجي
تعداد صفحه :
9
از صفحه :
40
تا صفحه :
48
كليدواژه :
تداركات , يادگيري تقويتي , الگوريتم يادگيري Q , سياست انتخاب عمل
چكيده فارسي :
در اين مقاله، مسئله مناقصه در يك شركت خودروسازي براي تدارك قطعات مورد نياز از تامين كنندگان بالقوه از طريق الگوريتم يادگيري Q حل شده است. در اين مسئله، خريدار با توجه به پيشنهادات دريافتي از تامين كنندگان بالقوه كه شامل قيمت و زمان تحويل پيشنهادي است، سفارش قطعات مورد نياز خود را به تامين كنندگان تخصيص مي دهد. هدف خريدار كمينه سازي هزينه هاي تداركات از طريق يادگيري از مناقصات پيشين است. اين مسئله به صورت يك مسئله تصميم گيري ماركوفي تعريف شده است كه در آن هر عمل وابسته به عمل و وضعيت قبلي است. براي حل اين مسئله يك الگوريتم يادگيري تقويتي به نام الگوريتم يادگيري Q توسعه داده شده است كه در آن از الگوريتم بهينه سازي ازدحام ذرات به عنوان راهكاري براي يافتن و انتخاب سياست بهينه براي انتخاب عمل در الگوريتم يادگيري Q استفاده شده است. در مقايسه اين الگوريتم با حالتي كه در آن سياست انتخاب عمل مطابق با يك الگوريتم حريصانه است، اين الگوريتم بسيار كارآمدتر است.
سال انتشار :
1395
عنوان نشريه :
مديريت زنجيره تامين
عنوان نشريه :
مديريت زنجيره تامين
اطلاعات موجودي :
فصلنامه با شماره پیاپی 51 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت