شماره ركورد كنفرانس :
5391
عنوان مقاله :
دستهبندي اخبار و استخراج ويژگي با استفاده از الگوريتم Naive Bayes توسعه يافته
پديدآورندگان :
مرسلي رضا tanin313@gmail.com دانشگاه آزاد اسلامي، سمنان، ايران , صباغي آرش a.sabbaghi@gmail.com گروه مهندسي كامپيوتر، دانشگاه آزاد اسلامي، سمنان، ايران , قدس سمانه s1ghods@gmail.com گروه رياضي، دانشگاه آزاد اسلامي، سمنان، ايران
كليدواژه :
دسته بندي اخبار , استخراج ويژگي ها , Selective Naïve Bayes , اخبار فارسي و عربي
عنوان كنفرانس :
دهمين كنفرانس بين المللي هوش مصنوعي و رباتيك
چكيده فارسي :
Naïve Bayesالگوريتمي پركاربرد در دادهكاوي است كه كارايي آن مبتني بر فرض استقلال ويژگيها ميباشد. براي كاهش اين فرض، جهت كارايي بيشتر اين الگوريتم در دنياي واقعي، انتخاب ويژگي رويكردي حايز اهميت است، هرچند كه روشهاي مرسوم در انجام اين مهم، داراي سربار محاسباتي بالايي است. ما در اين مقاله براي دسته بندي متون، يك الگوريتم Naïve Bayes انتخابي را معرفي ميكنيم كه از يك تكنيك انتخاب ويژگي جديد، بر اساس تكرار و همبستگي، بهره ميبرد تا تنها برخي از ويژگيها را براي ساخت مدلهاي Naïve Bayes انتخابي مورد استفاده قرار دهد كه اين مدلها به گونهاي ساخته شدهاند كه هريك به عنوان جزئي از زنجيرهي كامل و در امتداد يكديگر قرار گيرند. روش اين تكنيك علاوه بر ارتباط، تعامل بين ويژگيها را نيز در نظر گرفته و استفاده از وابستگي را بعنوان معياري براي ارزيابي ارتباط بين هدف و ويژگيها، مورد توجه قرار ميدهد. ما براي نمايش نتايج اين روش، آن را براي دسته بندي اخبار در يك گروه خبري خاص در زبان فارسي به كار برده و سپس به زبان عربي نيز تعميم ميدهيم. نتايج نشاندهندهي آن است كهNaïve Bayes انتخابي علاوه بر حفظ دقت ناشي از فرض استقلال ويژگيها از بازده كارايي بسيار بالايي نيز برخوردار است.