عنوان مقاله :
تشخيص نوع سرطان پستان با استفاده از انتخاب ژنهاي موثر از دادههاي ريزآرايه
عنوان به زبان ديگر :
Diagnosis of Breast Cancer Subtypes using the Selection of Effective Genes from Microarray Data
پديد آورندگان :
طباطبايي، ابوالفضل دانشگاه يزد - پرديس فني و مهندسي - گروه مهندسي كامپيوتر، يزد , درهمي، ولي دانشگاه يزد - پرديس فني و مهندسي - گروه مهندسي كامپيوتر، يزد , پژوهان، محمدرضا دانشگاه يزد - پرديس فني و مهندسي - گروه مهندسي كامپيوتر، يزد , شيخ پور، راضيه دانشگاه اردكان - دانشكده فني و مهندسي - گروه مهندسي كامپيوتر، اردكان
كليدواژه :
سرطان پستان , انتخاب ويژگي , داده بندي
چكيده فارسي :
مقدمه: تشخيص زودهنگام سرطان پستان و ژنهاي موثر در آن نقش بسيار كليدي در درمان و حيات بيمار ايفا ميكند. با استفاده ازدادههاي بيان ژن استخراج شده از فناوري ريزآرايه و الگوريتمهاي يادگيري ماشين ميتوان روشهاي نوين و هوشمندي درنظام سلامت و درمان ارايه داد كه با دقت بالايي قادر به تشخيص سرطان پستان باشند.
روش بررسي: دادههاي استفاده شده در اين پژوهش، شامل دادههاي بيان 9216 ژن مربوط به 84 بيمار در 5 نوع مختلف سرطان است كه با استفاده از فناوري ريزآرايه به دست آمده است. در اين مطالعه براي افزايش كارايي سيستمهاي تشخيص سرطان پستان، روش انتخاب ويژگي مبتني بر ارتباط بين بيان غيرنرمال ژن و سرطان ارايه شده است. سپس از سه دستهبند پركاربرد و رايج K- نزديكترين همسايه (KNN)، ماشين بردار پشتيبان (SVM) و بيزي ساده (NB) براي سنجش كارايي ژنهاي انتخاب شده استفاده شد.
يافتهها: بررسيهاي انجام شده نشان دادند كه با روش انتخاب ويژگي پيشنهادي و با استفاده از دستهبند KNN ميتوان فقط با انتخاب 38 ژن از ميان 9216 ژن مربوط به دادههاي بيماران سرطاني كه با استفاده از فناوري ريزآرايه به دست آمده است، انواع سرطان پستان بيماران در دادههاي آزمايش را با دقت 100% تشخيص داد و ژنهاي مرتبط با هر كلاس را نيز تفكيك كرد. همچنين با استفاده از دستهبند NB، دقت 90% با 17 ژن و با دستهبند SVM، دقت 96/67% با 22 ژن انتخابي بهدست آمد.
نتيجهگيري: نتايج اين مطالعه نشان دادند كه روش انتخاب ويژگي پيشنهادي، با در نظر گرفتن همزمان دو معيار دقت و تعداد ژن انتخابي، عملكرد مناسبي نسبت به ساير روشها دارد. توانايي تفكيك ژنهاي موثر در هر كلاس سرطان، بهعلاوه تشخيص بيان بيشتر از حد يا كمتر از حد ژنهاي انتخابي، از خصوصيات ويژه روش پيشنهادي است كه ميتواند مورد استفاده متخصصين و پژوهشگران حوزه درمان و مراقبت قرار گيرد.
چكيده لاتين :
Introduction
Early diagnosis of breast cancer and the identification of effective genes are important issues in the treatment and survival of the patients. Gene expression data obtained using DNA microarray in combination with machine learning algorithms can provide new and intelligent methods for diagnosis of breast cancer.
Methods
Data on the expression of 9216 genes from 84 patients across 5 different types of cancer was obtained using microarray technology. In this study, we proposed a feature selection method based on the correlation between abnormal expression of genes and cancer for diagnosis of breast cancer. Then, we used K-nearest neighbor (KNN), support vector machine (SVM), and naive Bayesian (NB) classifiers to evaluate the performance of the proposed method in the selection of relevant genes.
Results
The proposed feature selection method coupled with the KNN classifier predicted all types of cancer with 100% accuracy and using 38 of the 9216 genes. The proposed method could also identify the genes associated with each class. Moreover, the proposed feature selection method coupled with NB and SVM classifiers achieved accuracy rates of 90% and 96.67% using 17 and 22 genes, respectively.
Conclusion
The results of this study demonstrated that the proposed feature selection method has better performance compared with other methods. The proposed method is able to distinguish the genes involved in each cancer class and detect overexpression or underexpression of selected genes, which can be used by physicians and researchers in the field of health care.
عنوان نشريه :
بيماري هاي پستان ايران
عنوان نشريه :
بيماري هاي پستان ايران