توليد متن فارسي بر اساس كلمات كليدي با استفاده از مدل هاي احتمالاتي و يادگيري عميق

پديدآورندگان

پوردولت مجيد Majid.pourdolat@Gmail.com ، موسسه آموزش عالي اشراق بجنورد، بجنورد، ايران , جعفري احسان ehsannjafarii@gmail.com ، موسسه آموزش عالي اشراق بجنورد، بجنورد، ايران , لنگري شادي shadilangari@gmail.com ، موسسه آموزش عالي اشراق بجنورد، بجنورد، ايران

تعداد صفحه

كليدواژه

توليد متن فارسي , يادگيري ماشين , يادگيري عميق , مدل ELMO , مدلهاي احتمالاتي

سال انتشار

1398

عنوان كنفرانس

اولين كنفرانس ملي كسب و كار نوين در مهندسي برق و كامپيوتر

زبان مدرك

فارسي

چكيده فارسي

توليد زبان طبيعي (NLG) از پردازش زبان طبيعي (NLP) حاصل مي‏شود. زبان طبيعي از يك سيستم ارائه‏ي ماشيني مانند پايگاه دانش توليد مي‏شود. سيستم‏هاي NLG از مدت‏ها پيش وجود داشته اما تكنولوژي آن به صورت ابزار تجاري اخيراً به صورت گسترده به وجود آمده است. در NLG، سيستم نياز به تصميم‏گيري در مورد چگونگي قرار‏دادن يك مفهوم در كلمات دارد. توانايي ايجاد متن معني دار نقش كليدي در بسياري از كاربردهاي پردازش زبان طبيعي مانند ترجمه ماشين، گفتار و تبديل عكس به متن دارد. براي تمامي مسائلي كه از متن به متن، تصوير به متن و گفتار به متن مطرح است، توليد متن نقش كليدي دارد. توليد متن در روش هاي مختلف بخصوص روش هاي يادگيري عميق در سال‌هاي اخير مورد بررسي قرار گرفته است. با توجه به اين كه توليد محتوا به خصوص متن توسط دانشمندان حوزه هوش مصنوعي در حال تحقيق و بررسي است، هنوز كار خاصي بر روي زبان فارسي صورت نگرفته است. توليد محتواي مناسب در هر حوزه يك چالش بزرگ و نگران كننده است و حتي در بعضي زمينه ها تهديد و فرصت جهت پيشبرد اهداف اجتماعي، اقتصادي و سياسي است. هدف اين پايان نامه توليد متن با استفاده از روش هاي هوش مصنوعي در زبان فارسي با ساختار درست و آغازي براي توليد متن فارسي است. جهت پيشبرد توليد متن سعي شده است از تركيب روش-هاي يادگيري ماشين و يادگيري عميق با مدل هاي احتمالاتي، استفاده شود. در مدل پيشنهادي از مدل هاي احتمالاتي براي استخراج قوانين و از شبكه ي عصبي و شبكه هاي يادگيري عميق براي برداري سازي متن استفاده شده است. نتايج بهترين مدل كه از مدل يادگيري عميق پيش‌آموزش ديده ي Elmo استفاده مي كند بيانگر اين است كه اين روش نسبت به ساير روش ها متون پايدارتر، مفهومي تر و با ساختار بهتر توليد مي كنند. مدل Elmo يك مدل يادگيري عميق با استفاده از شبكه هاي LSTM و CNN بوده كه بر اساس بافتارهاي مختلف آموزش ديده و براي يك كلمه در زمينه و بافتارهاي مختلف، بردارهاي تعبيه مختلف ارائه مي‌دهد. به همين دليل مدل پيشنهادي از ساير مدلها عملكرد بهتري را دارد.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=361619