عنوان مقاله :
بهبود تخمين اثر بيولوژيكي ملكولهاي مهاركننده پروتئين كيناز، با استفاده از شبكه عصبي و مينيمم خطاي جزئي
عنوان به زبان ديگر :
Improving biological activity prediction of protein kinase inhibitors using artificial neural network and partial least square methods
پديد آورندگان :
آرين، رويا دانشگاه علوم پزشكي اصفهان - دانشكده فناوريهاي نوين علوم پزشكي - گروه بيوالكتريك , مهري دهنوي، عليرضا دانشگاه علوم پزشكي اصفهان - دانشكده فناوري هاي نوين علوم پزشكي - گروه بيوالكتريك , قاسمي، فهيمه دانشگاه علوم پزشكي اصفهان - دانشكده فناوري هاي نوين علوم پزشكي - گروه بيوانفورماتيك
كليدواژه :
پروتئين كيناز , طبقهبندي , شبكه عصبي , رگرسيون , مينيمم خطاي جزئي
چكيده فارسي :
مقدمه: پروتئين كيناز عامل ايجاد بسياري از بيماريها از جمله سرطان است؛ بنابراين مهار آن ها در درمان بسياري از بيماريها نقش بسزايي ايفا ميكند. كشف داروهاي جديد با روشهاي آزمايشگاهي، از جمله موضوعات هزينه بردار و زمانبر ميباشد؛ يافتن مدلهاي محاسباتي قابل اطمينان براي شناسايي مهاركنندهها ميتواند هزينهها را به حداقل برساند. هدف از اين مطالعه به كارگيري روش شبكه عصبي جهت طبقهبندي تركيبات در دو گروه فعال و غير فعال و مدل رگرسيون خطي مينيمم خطاي جزئي به منظور تخمين ميزان اثر بيولوژيكي آنها است.
روش: در اين پژوهش، پس از استخراج توصيفگرها از دادهها، به منظور جلوگيري از بيش برازش مدلها، كاهش ابعاد داده از طريق الگوريتم ژنتيك صورت پذيرفت. همچنين جهت طبقهبندي دادهها در كلاس فعال و غير فعال از مدل شبكه عصبي و جهت تخمين مقادير اثر بيولوژيكي ريزملكولها از مدل رگرسيون خطي مينيمم خطاي جزئي استفاده شد.
نتايج: نتايج نشان داد بعد از كاهش بعد توصيفگرهاي ملكولي، صحت مدل شبكه عصبي از 74/45% به 86/7% تغيير يافت. اين مدل در تعداد گرههاي لايه پنهان برابر با 6، صحت 86/7%، حساسيت 83/4%، اختصاصي بودن 89/6% و ضريب همبستگي متيو 73/2% را ارائه ميدهد. مدل رگرسيون خطي مينيمم خطاي جزئي نيز با ميزان همبستگي متوسط 85/8% مقادير بيولوژيكي را تخمين ميزند.
نتيجهگيري: مدل طبقهبندي شبكه عصبي و مدل رگرسيون خطي مينيمم خطاي جزئي تا ميزان قابل قبولي ميتوانند مهاركنندههاي پروتئين كيناز را پيشبيني كنند و الگوريتم كاهش بعد ژنتيك عملكرد اين مدلها را بهبود ميبخشد.
چكيده لاتين :
Introduction: Protein kinase causes many diseases, including cancer; therefore, inhibiting them
plays an important role in the treatment of many diseases. Traditional discovery inhibitors of this
enzyme is a time-consuming and costly process. Finding a reliable computer-aided drug discovery
tools which can detect the inhibitors will reduce the cost. In this study, it is attempted to separate
kinase inhibitors into two groups, active and inactive, using artificial neural network and finally
predict biological activities of the predicted active compounds by partial least square .
Method: In this study, after extracting the molecular descriptors in order to avoid overfitting
problem, dimensional reduction was applied using Genetic algorithm. Moreover, artificial neural
network was applied to distinguish active compounds from inactive ones and the biological activities
of the small molecules were predicted using partial least square linear regression.
Results: The results show that accuracy of the Neural networkmodel was improved from 74.45% to
86.7%, after reducing molecular descriptor dimensions. . The number of hidden nodes of this model
was six with 86.7% accuracy, 83.4% sensitivity, 89.6% specificity and 73.2% Mathew's correlation
coefficient. Moreover the partial least square linear regression model predicts the biological activity
valuesby 85.8% correlation.
Conclusion: The Neural network model and the partial least square linear regression model can
sufficiently predict Kinase inhibitors and Genetic algorithm will improve the models performance.
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي