شماره ركورد كنفرانس :
4214
عنوان مقاله :
بكارگيري الگوريتم هاي تكاملي در انتخاب ويژگي چندگانه درحوزه متن كاوي
پديدآورندگان :
طاهري سيد حسن دانشگاه خيام , قاسمي پور سميه دانشگاه خيام
كليدواژه :
متنكاوي , طبقهبندي , انتخاب ويژگي , بهينهسازي چندهدفه , الگوريتم تكاملي
عنوان كنفرانس :
دهمين كنفرانس بين المللي تحقيق در عمليات
چكيده فارسي :
در انتخاب ويژگي يكي از مهمترين بخشهاي پيش پردازش در حوزهي متنكاوي و طبقه بندي متن ميباشد. معيارهاي فراواني براي انتخاب ويژگي وجود دارد كه اين معيارها ميتواند در قالب يك مساله بهينه سازي ارائه شود. در اين تحقيق، مدلي براي انتخاب ويژگي در قالب بهينه سازي همزمان چند هدفه به صورت تكاملي پيشنهاد شده است. اهداف مورد بررسي در اين مدل شامل دو هدف با رابطه اي متقابل است كه به صورت همزمان مينيمم سازي ميشود. اولين هدف انتخاب زيرمجموعهاي از كلمات با كمترين طول و دومين هدف انتخاب زيرمجموعهاي از كلمات با بيشترين حجم اطلاعاتي است. در تحقيقي ديگر، دومين هدف يعني هدف بيشترين حجم اطلاهاتي را با معيار ديگري به نام CHI جايگزين كرده و عملكرد آن را نيز در مدل پيشنهادي، بررسي مي نماييم. مدل پيشنهادي با نام MOFS را با ديتاست شامل 20000 سند در 20 كلاس بررسي نموده ايم. در نهايت به منظور ارزيابي مدل پيشنهادي بعد از اينكه داده ها را به دو بخش آموزشي و تست تقسيم كرده و الگوريتم انتخاب ويژگي را براي داده اي آموزشي اعمال مي نماييم، از داده هاي تست براي بدست آوردن ميزان دقت در طبقه بندي استفاده نموده ايم. در آزمايشات انجام شده، از سه مدل طبقه بند مختلف ماشين بردار پشتيبان خطي، درخت تصميم و شبكه بيزين، براي ارزيابي عملكرد مدل بهره برده ايم. بررسيها حاكي از ميزان دقت بالاتر و بدست آوردن تعداد زيادي زيرمجموعه با طول هاي مختلف در يك تكرار اجرا است.