عنوان مقاله :
تبديل توالي پروتئين به تصوير جهت طبقه بندي با شبكه عصبي كانولوشني
عنوان به زبان ديگر :
Converting protein sequence to image for classification with convolutional neural network
پديد آورندگان :
احسن، رضا دانشگاه قم - دانشكده فني مهندسي، قم، ايران , ابراهيمي، منصور دانشگاه قم - دانشكده علوم پايه، قم، ايران , ديانت، روح الله دانشگاه قم - دانشكده فني مهندسي، قم، ايران
كليدواژه :
تبديل توالي پروتئين به تصوير , فيلتر گابور , شبكه عصبي كانولوشني , طبقه بندي توالي پروتئين
چكيده فارسي :
از آنجا كه روشهاي مخصوص طبقهبندي توالي يادگيري ماشين، جهت طبقهبندي پروتئينهاي سالم و سرطاني موفق نبودند بنابراين يافتن راهكاري براي بازنمايي اين تواليها جهت طبقه بندي افراد سالم و مريض با رويكردهاي يادگيري عميق ضرورت تام دارد. در اين مطالعه، روشهاي مختلف بازنمايي توالي پروتئين، جهت طبقهبندي توالي پروتئين افراد سالم و سرطان خون، مورد بررسي قرار گرفته است. نتايج نشان داد كه تبديل حروف اسيد آمينه به بردار ويژگي يكبعدي در طبقه بندي 2 كلاس موفق نبود و فقط يك كلاس مريض تشخيص داده شد. با تغيير بردار ويژگي بهصورت اعداد رنگي دقت تشخيص كلاس سالم كمي بهبود يافت. روش بازنمايي توالي پروتئيني بهصورت يكپارچه دودويي، با ابتكار حفظ دنباله توالي در دو حالت يكبعدي و دوبعدي(تصوير با اعمال فيلتر گابور)، نسبت به روشهاي قبلي موثرتر بود. بازنمايي توالي پروتئين به شكل تصوير دودويي با اعمال فيلتر گابور با دقت 100% توالي پروتئين افراد سالم و 98.6% توالي پروتئين افراد داراي سرطان خون را طبقهبندي كرد. يافتههاي اين تحقيق نشان داد كه بازنمايي توالي پروتئين به شكل تصوير دودويي با اعمال فيلتر گابور، ميتواند بهعنوان روش موثر جديد دربازنمايي تواليهاي پروتئيني جهت طبقهبندي، ارايه نمايد
چكيده لاتين :
Since methods for sequencing machine learning sequences were not successful in classifying healthy and cancerous proteins, it is imperative to find a way to represent these sequences to classify healthy and ill individuals with deep learning approaches. In this study different methods of protein sequence representation for classification of protein sequence of healthy individuals and leukemia have been studied. Results showed that conversion of amino acid letters to one-dimensional feature vectors in classification of 2 classes was not successful and only one disease class was detected. By changing the feature vector to colored numbers, the accuracy of the healthy class recognition was slightly improved. The binary protein sequence representation method was more efficient than the previous methods with the initiative of sequencing the sequences in both one-dimensional and two-dimensional (image by Gabor filtering). Protein sequence representation as binary image was classified by applying Gabor filter with 100% accuracy of the protein sequence of healthy individuals and 98.6% protein sequence of those with leukemia. The findings of this study showed that the representation of protein sequence as binary image by applying Gabor filter can be used as a new effective method for representation of protein sequences for classification.
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران