شماره ركورد كنفرانس :
5490
عنوان مقاله :
طراحي يك سامانه گفتگوگر وظيفهگرا مشترك مبتني بر يادگيري تقويتي عميق
پديدآورندگان :
نصري لوشاني محمدجواد mohammad.j.nasri@gmail.com گروه مهندسي كامپيوتر، دانشكده مهندسي برق و كامپيوتر، دانشگاه كاشان، كاشان، ايران , سليمي سرتختي جواد salimi@kashanu.ac.ir گروه مهندسي كامپيوتر، دانشكده مهندسي برق و كامپيوتر، دانشگاه كاشان، كاشان، ايران , ابراهيمپور كومله حسين ebrahimpour@kashanu.ac.ir گروه مهندسي كامپيوتر، دانشكده مهندسي برق و كامپيوتر، دانشگاه كاشان، كاشان، ايران
كليدواژه :
نمايش جمله , حوزه رستوران , مديريت گفتگو , DQL
عنوان كنفرانس :
ششمين كنفرانس بينالمللي بازشناسي الگو و تحليل تصوير
چكيده فارسي :
ساخت سامانههاي گفتگوگر در سالهاي اخير توجه زيادي به خود جلب كرده است. دستهاي از اين سامانهها، سامانههاي گفتگوگر وظيفهگرا هستند كه هدفشان رساندن انسان به مقصودش با انجام گفتگو در يك حوزه خاص ميباشد؛ مثلاً رستوران. اين سامانهها از بخشهاي مختلفي تشكيل ميشوند كه اگر دو يا چند بخش، همزمان توسعه داده شوند، سامانهي مشترك (Joint) ناميده ميشود. يكي از روشهايي كه براي توسعه اين سامانهها استفاده ميشود، روش يادگيري تقويتي عميق است. در يادگيري تقويتي عميق، عامل كه شبكه عصبي است با تعامل با محيط (كنش) در حالتهاي مختلف و دريافت پاداش از آن، آموزش ميبيند. همچنين، در شروع يادگيري، عامل تعدادي كنش بصورت تصادفي انجام ميدهد و به مرور زمان از دانشي كه بدست آورده، استفاده ميكند. در اين مقاله، براي اينكه حالت مناسبي از محيط گفتگو ايجاد شود، از چسباندن نمايش جمله آخرين پيام ربات و انسان، استفادهشده است. همچنين، تابعي جديد براي كاهش احتمال انجام كنش تصادفي، بكارگرفته شده است. براي ارزيابي و مقايسه عملكرد روش ارائهشده با دو سامانه گفتگوگر ديگر، از شبيهساز گفتگو در حوزه رستوران استفاده شدهاست. روش ارائهشده، بيشينه پاداش 0.29937 را در 27900 گام گفتگو بدست ميآورد كه نسبت به دو روش ديگر، با تعداد گفتگوهاي كمتر، پاداش بيشتري بدست آورده است.