شماره ركورد كنفرانس :
5286
عنوان مقاله :
انتخاب ويژگي گروهي با رويكرد تصميم‌گيري چندمعياره به منظور دسته‌بندي متون
عنوان به زبان ديگر :
Ensemble Feature Selection using Multi-Attribute Decision Making for Text Classification
پديدآورندگان :
زريسفي كرماني فاطمه fzarisfi.k@gmail.com دانشگاه جيرفت
تعداد صفحه :
10
كليدواژه :
دسته‌بندي متن , انتخاب ويژگي گروهي , تصميم‌گيري چندمعياره , دسته‌بند بيزين ساده چندجمله‌اي , دسته‌بند k , همسايه نزديك
سال انتشار :
1402
عنوان كنفرانس :
پنجمين كنفرانس بين‌المللي محاسبات نرم
زبان مدرك :
فارسي
چكيده فارسي :
دسته‌بندي متن از ابعاد بالا و پراكندگي زياد فضاي ويژگي رنج مي‌برد. به همين دليل، انتخاب ويژگي به عنوان مرحله مهمي از پيش پردازش در حوزه متن كاوي و به‌ويژه دسته‌بندي متن شناخته مي‌شود. اخيراً رويكرد جديدي به نام انتخاب ويژگي گروهي معرفي شده‌است كه در آن، خروجي چندين روش انتخاب ويژگي براي به دست آوردن زيرمجموعه‌ي نهايي از ويژگي‌ها تجميع مي‌شوند. ادعا مي‌شود كه اصل خرد جمعي در بحث انتخاب ويژگي نيز مي‌تواند منجربه انتخاب ويژگي قوي‌تر و پايدارتر هنگام برخورد با داده هايي با ابعاد بالا گردد. بنابراين در اين‌كار، براي اولين بار از رويكرد انتخاب ويژگي گروهي در فاز آماده‌سازي داده‌هاي متني، به‌منظور دسته‌بندي دقيق‌تر اسناد استفاده شده‌است. بطوريكه ابتدا مجموعه‌ي ويژگي‌ها با استفاده از 4 روش انتخاب ويژگي مبتني بر فيلتر بصورت جداگانه رتبه‌بندي شده، سپس فرآيند تجميع نتايج حاصله و رتبه‌بندي نهايي ويژگي‌ها بعنوان يك مسئله‌ي تصميم‌گيري چندمعياره فرموله و به كمك تكنيك بيشترين بيشترين‌ها حل مي‌شود. به منظور اثبات ادعا، كارآمدي روش انتخاب ويژگي پيشنهادي در دسته‌بندي موضوعي مجموعه داده متني رويترز، با استفاده از الگوريتم‌هاي دسته‌بندي بيزين ساده چندجمله‌اي و k-همسايه نزديك براساس معيارهاي دقت و F-score مورد ارزيابي قرار گرفته‌است. مقايسه‌ي نتايج، نشان‌دهنده‌ي افزايش حداقل 1درصدي و حداكثر 10 درصدي دقت دسته‌بندي نسبت به 4روش‌ انتخاب ويژگي مبتني بر فيلتر و 3 روش ساده تجميع در استراتژي ناهمگن مي‌باشد.
كشور :
ايران
لينک به اين مدرک :
بازگشت