عنوان مقاله :
بهبود الگوريتم فازي C-Means با الگوريتم ژنتيك براي انتخاب ويژگيها در دسته بندي اسناد متني
پديد آورندگان :
محمودي جاريحان، ندا دانشگاه آزاد اسلامي، اروميه - گروه مهندسي كامپيوتر , سليمانيان قره چپق، فرهاد دانشگاه آزاد اسلامي، اروميه - گروه مهندسي كامپيوتر
كليدواژه :
دسته بندي اسناد متني , بهينه سازي , انتخاب ويژگي , الگوريتم فازي C-Means , الگوريتم ژنتيك
چكيده فارسي :
افزايش روزافزون مستندات الكترونيكي در وب، لزوم دستهبندي آنان در دستههاي مختلف را نشان ميدهد. با توجه به حجم و دامنه وسيع اسناد متني كه بهطور قابل توجهي از طريق محيطهاي برخط و ساير منابع قابل دسترسي ميباشند، در صورت عدم دستهبندي مناسب، عمل بازيابي و پردازش اسناد متني دستهبندي نشده با مشكلات زيادي مواجه ميگردد. اين نياز منجر به ايجاد روشهاي نوين براي دستهبندي اطلاعات شده است. دستهبندي، تخصيص اسناد متني يا ويژگيها به يك يا چندين دسته است، بهطوري كه اسناد متني با توجه به موضوعات يا ميزان مشابهت ويژگيها ميتوانند دستهبندي گردند. در ارائه روشهاي دستهبندي، استخراج و انتخاب ويژگيهاي كليدي اسناد متني از اهميت بالايي برخودار ميباشد. در اين مقاله روشي براساس بهبود الگوريتم فازي C-Means با الگوريتم ژنتيك براي انتخاب ويژگيها در دسته بندي اسناد متني ارائه شده است كه در روش پيشنهادي انتخاب ويژگيهاي كليدي متون از طريق الگوريتم فازي C-Means انجام ميشود و اين ويژگيها به الگوريتم ژنتيك جهت بهبود در دسته بندي ارسال ميگردند. روش پيشنهادي بر روي سه مجموعه دادهي مختلف Reuters21578, WEBKB, CADE 12 و بر اساس معيارهاي ارزيابي مختلفي مورد آزمايش و ارزيابي قرار گرفته است. مقايسهي نتايج روش پيشنهادي با ساير روشهاي مطرح در دسته بندي متون نشان ميدهد كه روش پيشنهادي عملكرد بهينه اي را در دسته بندي اسناد متني دارد.
عنوان نشريه :
علوم رايانشي
عنوان نشريه :
علوم رايانشي