شماره ركورد :
1274214
عنوان مقاله :
تبديل توالي پروتئين به تصوير جهت طبقه بندي با شبكه عصبي كانولوشني
عنوان به زبان ديگر :
Converting protein sequence to image for classification with convolutional neural network
پديد آورندگان :
احسن، رضا دانشگاه قم - دانشكده فني مهندسي، قم، ايران , ابراهيمي، منصور دانشگاه قم - دانشكده علوم پايه، قم، ايران , ديانت، روح الله دانشگاه قم - دانشكده فني مهندسي، قم، ايران
تعداد صفحه :
14
از صفحه :
155
از صفحه (ادامه) :
0
تا صفحه :
168
تا صفحه(ادامه) :
0
كليدواژه :
تبديل توالي پروتئين به تصوير , فيلتر گابور , شبكه عصبي كانولوشني , طبقه بندي توالي پروتئين
چكيده فارسي :
از آنجا كه روش‌‌هاي مخصوص طبقه‌‌بندي توالي يادگيري ماشين، جهت طبقه‌‌بندي پروتئين‌‌هاي سالم و سرطاني موفق نبودند بنابراين يافتن راهكاري براي بازنمايي اين توالي‌‌ها جهت طبقه بندي افراد سالم و مريض با رويكردهاي يادگيري عميق ضرورت تام دارد. در اين مطالعه، روش‌‌هاي مختلف بازنمايي توالي پروتئين، جهت طبقه‌‌بندي توالي پروتئين افراد سالم و سرطان خون، مورد بررسي قرار گرفته است. نتايج نشان داد كه تبديل حروف اسيد آمينه به بردار ويژگي يك‌‌بعدي در طبقه بندي 2 كلاس موفق نبود و فقط يك كلاس مريض تشخيص داده شد. با تغيير بردار ويژگي به‌‌صورت اعداد رنگي دقت تشخيص كلاس سالم كمي بهبود يافت. روش بازنمايي توالي پروتئيني به‌‌صورت يكپارچه دودويي، با ابتكار حفظ دنباله توالي در دو حالت يك‌بعدي و دوبعدي(تصوير با اعمال فيلتر گابور)، نسبت به روشهاي قبلي موثرتر بود. بازنمايي توالي پروتئين به شكل تصوير دودويي با اعمال فيلتر گابور با دقت 100% توالي پروتئين افراد سالم و 98.6% توالي پروتئين افراد داراي سرطان خون را طبقه‌‌بندي كرد. يافته‌‌هاي اين تحقيق نشان داد كه بازنمايي توالي پروتئين به شكل تصوير دودويي با اعمال فيلتر گابور، مي‌‌تواند به‌‌عنوان روش موثر جديد دربازنمايي توالي‌‌هاي پروتئيني جهت طبقه‌‌بندي، ارايه نمايد
چكيده لاتين :
Since methods for sequencing machine learning sequences were not successful in classifying healthy and cancerous proteins, it is imperative to find a way to represent these sequences to classify healthy and ill individuals with deep learning approaches. In this study different methods of protein sequence representation for classification of protein sequence of healthy individuals and leukemia have been studied. Results showed that conversion of amino acid letters to one-dimensional feature vectors in classification of 2 classes was not successful and only one disease class was detected. By changing the feature vector to colored numbers, the accuracy of the healthy class recognition was slightly improved. The binary protein sequence representation method was more efficient than the previous methods with the initiative of sequencing the sequences in both one-dimensional and two-dimensional (image by Gabor filtering). Protein sequence representation as binary image was classified by applying Gabor filter with 100% accuracy of the protein sequence of healthy individuals and 98.6% protein sequence of those with leukemia. The findings of this study showed that the representation of protein sequence as binary image by applying Gabor filter can be used as a new effective method for representation of protein sequences for classification.
سال انتشار :
1399
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران
فايل PDF :
8606502
لينک به اين مدرک :
بازگشت