شماره ركورد كنفرانس :
4330
عنوان مقاله :
خوشهبندي متنكوتاه با استفاده از الگوريتم شبكه عصبي بازگشتي و تجزيه و تحليل معنايي نهفته
پديدآورندگان :
حسيني رحيم rahim.hosseini@eng.uk.ac.ir دانشگاه شهيد باهنر كرمان , ميروزيري حميد hmirvaziri@uk.ac.ir دانشگاه شهيد باهنر كرمان , قاسمعليزاده حسين ghasemalizadeh@uk.ac.ir دانشگاه شهيد باهنر كرمان
كليدواژه :
خوشهبندي متن , شبكه عصبي بازگشتي , تجزيه و تحليل معنايي نهفته , متنكوتاه , پردازش زبان طبيعي
عنوان كنفرانس :
هفدهمين كنفررانس ملي سيستم هاي فازي، پانزدهمين كنفرانس ملي سيستم هاي هوشمند و ششمين كنگره ملي مشترك سيستم هاي فازي و هوشمند ايران
چكيده فارسي :
با رشد روز افزون اطلاعات و ارتباطات آنلاين، توليد متن به طور چشمگيري در حال افزايش ميباشد و پردازش اين متنها با روشهاي دستي كاري مشكل و وقتگير است، به همين دليل پردازش متن، موضوعي چالش بر انگير در پردازش زبان طبيعي است. در اين مقاله يك روش خوشه بندي متن كوتاه با شبكه عصبي بازگشتي(RecNN) و تجزيه و تحليل معنايي نهفته (LSA) پيشنهاد شده است. در اين روش ابتدا متنهاي ورودي وارد شبكه عصبي ميشود، در شبكه ابتدا كدگذار خودكار در حالت بدون نظارت، پيشبيني تقريبي بر اساس ساختار درختي به دست ميآورد و سپس در حالت نيمه نظارتي، ارتباط معنايي بين كلمات را پيشبيني ميكند و پس از آموزش شبكه، متنها وارد الگوريتم تجزيه و تحليل معنايي نهفته ميشود تا ارتباطي بين كلمات به وجود آورد و در نهايت با الگوريتم K-means عمليات خوشه بندي را انجام ميدهد. نتايج ارزيابي، نشان دهنده دقت 44.77 اين الگوريتم بر روي ديتاست Stack Over Flow است. بنابراين ميتوان گفت كه اين روش، عملكرد بهتري نسبت به روشهاي پايه در خوشه بندي متنكوتاه به دست آورده است.