شماره ركورد كنفرانس :
5306
عنوان مقاله :
الگوريتم انتخاب ژن جديد مبتني برادغام SFE و Chi-Squared
پديدآورندگان :
آقايي ليلا leyla.aghaei@yahoo.com گروه مهندسي پزشكي، واحد خميني شهر، دانشگاه آزاد اسلامي، اصفهان، ايران (نويسنده مسئول) , محرري صدف sadaf.moharreri@iaukhsh.ac.ir گروه مهندسي پزشكي، واحد خميني شهر، دانشگاه آزاد اسلامي، اصفهان، ايران
كليدواژه :
انتخاب ويژگي , انتخاب ژن , الگوريتم SFE , الگوريتم Chi-Squared
عنوان كنفرانس :
اولين همايش ملي داده كاوي در علوم مهندسي و زيستي
چكيده فارسي :
انتخاب ويژگي يكي از روش هاي پيش پردازش داده ها است كه نقش مهمي در افزايش كارايي طبقهبندي دادهها دارد. علاوه بر اين، يكي از كاربردهاي مهم انتخاب ويژگي، حوزه انتخاب ژن است كه كاربرد مهمي در تعيين عامل هاي و ژن هاي تاثير گذار در بيماريهاي مختلف از جمله سرطان دارد. براي دستيابي به كارايي بالا در كاربرد انتخاب ژن، به الگوريتم هاي انتخاب ويژگي دادههاي ابعاد بالا نياز داريم، تا از بين بيش از هزاران ژن بيماري ها كه از طريق فناوريهاي مختلف از قبيل ريز آرايه ها جمع آوري ميشوند، ژنهاي مهم و تاثير گذار در بيماري ها را تشخيص دهند. يكي از الگوريتم هايي كه اخيرا براي انتخاب ويژگي دادههاي ابعاد بالا ارائه شده است، الگوريتم ساده، سريع و كارا(SFE) است. اين الگوريتم نتايج قابل توجهي نسبت به روش هاي محاسبات تكاملي ارائه كرده است، با اين وجود ميتوان كارايي آن را با روشهاي مختلفي بهبود داد. هدف اين مقاله بهبود كارايي اين الگوريتم در فازهاي انتخاب و عدم انتخاب است. در فاز عدم انتخاب از دو رويكرد متفاوت براي حذف ويژگي هاي كم اهميت استفاده ميشود. علاوه بر اين در فاز انتخاب به جاي انتخاب تصادفي ويژگي ها از ويژگي هاي مهم تعيين شده توسط الگوريتم Chi-Squared استفاده ميشود. كارايي الگوريتم هاي انتخاب ويژگي ارائه شده با استفاده از 10 مجموعه داده ابعاد بالا با ابعاد مورد بررسي قرار گرفت. مقايسه نتايج الگوريتمهاي ارائه شده نشاندهنده اين موضوع است كه روش ارائه شده ميتواند به عنوان يك روش كارا در انتخاب ويژگي داده هاي با ابعاد بالا در كاربردهاي يادگيري ماشين و داده كاوي مورد استفاده قرار گيرد.