شماره ركورد كنفرانس :
5455
عنوان مقاله :
توليد متن فارسي بر اساس كلمات كليدي با استفاده از مدل هاي احتمالاتي و يادگيري عميق
پديدآورندگان :
پوردولت مجيد Majid.pourdolat@Gmail.com ، موسسه آموزش عالي اشراق بجنورد، بجنورد، ايران , جعفري احسان ehsannjafarii@gmail.com ، موسسه آموزش عالي اشراق بجنورد، بجنورد، ايران , لنگري شادي shadilangari@gmail.com ، موسسه آموزش عالي اشراق بجنورد، بجنورد، ايران
كليدواژه :
توليد متن فارسي , يادگيري ماشين , يادگيري عميق , مدل ELMO , مدلهاي احتمالاتي
عنوان كنفرانس :
اولين كنفرانس ملي كسب و كار نوين در مهندسي برق و كامپيوتر
چكيده فارسي :
توليد زبان طبيعي (NLG) از پردازش زبان طبيعي (NLP) حاصل ميشود. زبان طبيعي از يك سيستم ارائهي ماشيني مانند پايگاه دانش توليد ميشود. سيستمهاي NLG از مدتها پيش وجود داشته اما تكنولوژي آن به صورت ابزار تجاري اخيراً به صورت گسترده به وجود آمده است. در NLG، سيستم نياز به تصميمگيري در مورد چگونگي قراردادن يك مفهوم در كلمات دارد. توانايي ايجاد متن معني دار نقش كليدي در بسياري از كاربردهاي پردازش زبان طبيعي مانند ترجمه ماشين، گفتار و تبديل عكس به متن دارد. براي تمامي مسائلي كه از متن به متن، تصوير به متن و گفتار به متن مطرح است، توليد متن نقش كليدي دارد. توليد متن در روش هاي مختلف بخصوص روش هاي يادگيري عميق در سالهاي اخير مورد بررسي قرار گرفته است. با توجه به اين كه توليد محتوا به خصوص متن توسط دانشمندان حوزه هوش مصنوعي در حال تحقيق و بررسي است، هنوز كار خاصي بر روي زبان فارسي صورت نگرفته است. توليد محتواي مناسب در هر حوزه يك چالش بزرگ و نگران كننده است و حتي در بعضي زمينه ها تهديد و فرصت جهت پيشبرد اهداف اجتماعي، اقتصادي و سياسي است. هدف اين پايان نامه توليد متن با استفاده از روش هاي هوش مصنوعي در زبان فارسي با ساختار درست و آغازي براي توليد متن فارسي است. جهت پيشبرد توليد متن سعي شده است از تركيب روش-هاي يادگيري ماشين و يادگيري عميق با مدل هاي احتمالاتي، استفاده شود. در مدل پيشنهادي از مدل هاي احتمالاتي براي استخراج قوانين و از شبكه ي عصبي و شبكه هاي يادگيري عميق براي برداري سازي متن استفاده شده است. نتايج بهترين مدل كه از مدل يادگيري عميق پيشآموزش ديده ي Elmo استفاده مي كند بيانگر اين است كه اين روش نسبت به ساير روش ها متون پايدارتر، مفهومي تر و با ساختار بهتر توليد مي كنند. مدل Elmo يك مدل يادگيري عميق با استفاده از شبكه هاي LSTM و CNN بوده كه بر اساس بافتارهاي مختلف آموزش ديده و براي يك كلمه در زمينه و بافتارهاي مختلف، بردارهاي تعبيه مختلف ارائه ميدهد. به همين دليل مدل پيشنهادي از ساير مدلها عملكرد بهتري را دارد.