شماره ركورد كنفرانس :
5286
عنوان مقاله :
انتخاب ويژگي گروهي با رويكرد تصميمگيري چندمعياره به منظور دستهبندي متون
عنوان به زبان ديگر :
Ensemble Feature Selection using Multi-Attribute Decision Making for Text Classification
پديدآورندگان :
زريسفي كرماني فاطمه fzarisfi.k@gmail.com دانشگاه جيرفت
كليدواژه :
دستهبندي متن , انتخاب ويژگي گروهي , تصميمگيري چندمعياره , دستهبند بيزين ساده چندجملهاي , دستهبند k , همسايه نزديك
عنوان كنفرانس :
پنجمين كنفرانس بينالمللي محاسبات نرم
چكيده فارسي :
دستهبندي متن از ابعاد بالا و پراكندگي زياد فضاي ويژگي رنج ميبرد. به همين دليل، انتخاب ويژگي به عنوان مرحله مهمي از پيش پردازش در حوزه متن كاوي و بهويژه دستهبندي متن شناخته ميشود. اخيراً رويكرد جديدي به نام انتخاب ويژگي گروهي معرفي شدهاست كه در آن، خروجي چندين روش انتخاب ويژگي براي به دست آوردن زيرمجموعهي نهايي از ويژگيها تجميع ميشوند. ادعا ميشود كه اصل خرد جمعي در بحث انتخاب ويژگي نيز ميتواند منجربه انتخاب ويژگي قويتر و پايدارتر هنگام برخورد با داده هايي با ابعاد بالا گردد. بنابراين در اينكار، براي اولين بار از رويكرد انتخاب ويژگي گروهي در فاز آمادهسازي دادههاي متني، بهمنظور دستهبندي دقيقتر اسناد استفاده شدهاست. بطوريكه ابتدا مجموعهي ويژگيها با استفاده از 4 روش انتخاب ويژگي مبتني بر فيلتر بصورت جداگانه رتبهبندي شده، سپس فرآيند تجميع نتايج حاصله و رتبهبندي نهايي ويژگيها بعنوان يك مسئلهي تصميمگيري چندمعياره فرموله و به كمك تكنيك بيشترين بيشترينها حل ميشود. به منظور اثبات ادعا، كارآمدي روش انتخاب ويژگي پيشنهادي در دستهبندي موضوعي مجموعه داده متني رويترز، با استفاده از الگوريتمهاي دستهبندي بيزين ساده چندجملهاي و k-همسايه نزديك براساس معيارهاي دقت و F-score مورد ارزيابي قرار گرفتهاست. مقايسهي نتايج، نشاندهندهي افزايش حداقل 1درصدي و حداكثر 10 درصدي دقت دستهبندي نسبت به 4روش انتخاب ويژگي مبتني بر فيلتر و 3 روش ساده تجميع در استراتژي ناهمگن ميباشد.