شماره ركورد كنفرانس :
5490
عنوان مقاله :
طراحي يك سامانه گفتگوگر وظيفه‌گرا مشترك مبتني بر يادگيري تقويتي عميق
پديدآورندگان :
نصري ‌لوشاني محمدجواد mohammad.j.nasri@gmail.com گروه مهندسي كامپيوتر، دانشكده مهندسي برق و كامپيوتر، دانشگاه كاشان، كاشان، ايران , سليمي ‌سرتختي جواد salimi@kashanu.ac.ir گروه مهندسي كامپيوتر، دانشكده مهندسي برق و كامپيوتر، دانشگاه كاشان، كاشان، ايران , ابراهيم‌پور كومله حسين ebrahimpour@kashanu.ac.ir گروه مهندسي كامپيوتر، دانشكده مهندسي برق و كامپيوتر، دانشگاه كاشان، كاشان، ايران
تعداد صفحه :
6
كليدواژه :
نمايش جمله , حوزه رستوران , مديريت گفتگو , DQL
سال انتشار :
1401
عنوان كنفرانس :
ششمين كنفرانس بين‌المللي بازشناسي الگو و تحليل تصوير
زبان مدرك :
فارسي
چكيده فارسي :
ساخت سامانه‌هاي گفتگوگر در سال‌هاي اخير توجه زيادي به خود جلب‌ كرده است. دسته‌اي از اين سامانه‌ها، سامانه‌هاي گفتگوگر وظيفه‌گرا هستند كه هدفشان رساندن انسان به مقصودش با انجام گفتگو در يك حوزه خاص مي‌باشد؛ مثلاً رستوران. اين سامانه‌ها از بخش‌هاي مختلفي تشكيل مي‌شوند كه اگر دو يا چند بخش، همزمان توسعه‌ داده شوند، سامانه‌ي مشترك (Joint) ناميده مي‌شود. يكي از روش‌هايي كه براي توسعه اين سامانه‌ها استفاده مي‌شود، روش يادگيري تقويتي عميق است. در يادگيري تقويتي عميق، عامل كه شبكه عصبي است با تعامل با محيط (كنش) در حالت‌هاي مختلف و دريافت پاداش از آن، آموزش مي‌بيند. همچنين، در شروع يادگيري، عامل تعدادي كنش بصورت تصادفي انجام مي‌دهد و به مرور زمان از دانشي كه بدست آورده، استفاده مي‌كند. در اين مقاله، براي اينكه حالت مناسبي از محيط گفتگو ايجاد شود، از چسباندن نمايش جمله آخرين پيام ربات و انسان، استفاده‌شده است. همچنين، تابعي جديد براي كاهش احتمال انجام كنش تصادفي، بكارگرفته ‌شده است. براي ارزيابي و مقايسه عملكرد روش ارائه‌شده با دو سامانه گفتگوگر ديگر، از شبيه‌ساز گفتگو در حوزه رستوران استفاده شده‌است. روش ارائه‌شده، بيشينه پاداش 0.29937 را در 27900 گام گفتگو بدست مي‌آورد كه نسبت به دو روش ديگر، با تعداد گفتگوهاي كمتر، پاداش بيشتري بدست آورده است.
كشور :
ايران
لينک به اين مدرک :
بازگشت