عنوان مقاله :
كاربرد و مقايسه روشهاي يادگيري ماشيني رندم فارست و درخت كلاسبندي- رگرسيوني در مطالعه وابستگي ژنتيكي در بيماران مبتلا به شريانهاي كرونري
عنوان فرعي :
Application and Comparison of Random Forest and CART in genetic Association Study in coronary artery disease
پديد آورندگان :
مددكار، آتوسا نويسنده دانشگاه علوم بهزيستي و توانبخشي Madadkar, Atoosa , كريملو، مسعود نويسنده Karimlou, M. , رهگذر، مهدي نويسنده گروه آمار زيستي, دانشگاه علوم بهزيستي و توانبخشي تهران,تهران,ايران rahgozar, mahdi , جمال الديني، سيد حميد نويسنده دانشگاه علوم بهزيستي و توانبخشي Jamaldini, seyed hamid , مظفري، رضا نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1392 شماره 5
كليدواژه :
اثر متقابل , پليمورفيسم تكنوكليوتيدي , روشهاي يادگيري ماشيني , بيماري شريانهاي كرونر
چكيده فارسي :
چكيده
هدف:در مطالعات ژنتيك، برگزيدن تعداد معدودي از پليمورفيسم تكنوكليوتيديكه نسبت به ساير پليمورفيسمها ارتباط بيشتري با بيماري مورد نظر دارند، امري ضروري است. اين تحقيق با هدف مقايسه دو روش يادگيري ماشيني مبتني بر درخت رندم فارست و درخت كلاسبندي-رگرسيوني، بهمنظور پيشبيني افراد مبتلا به بيماري شريانهاي كرونر با استفاده از پليمورفيسم تك نوكليوتيدي انجام شد.
روشبررسي:بهمنظور انجام اين پژوهش، از مراجعين بيمارستان قلب و شريانهاي شهيد رجايي تهران در فاصله سالهاي 1390و 1391 تمام شماري به عمل آمد. اطلاعات 141 فرد مبتلا به بيماري شريانهاي كرونر و 83شاهد توسط مركز تحقيقات ژنتيك اين بيمارستان گردآوري شد. از طريق روش تعيين توالي، ژنوتيپ پليمورفيسم تكنوكليوتيدي انتخابشده در جايگاه ژن LDLR و پروموتر ژن PCSK9 هر فرد مشخص شد. همچنين بهمنظور كشف ارتباط ميان پليمورفيسم تكنوكليوتيدي و بيماري شريانهاي كرونر، از دو روش يادگيري ماشيني: درخت كلاسبندي-رگرسيوني و رندم فارست استفاده شد. اعتبارسنجي مدل براساس اعتبارسنجي ده قسمتي انجام شد. مدلها پس از برازش، با استفاده از سه ملاك حساسيت و ويژگي و خطا ارزيابي شدند. تحليل دادهها با استفاده از نرم افزار R(2.15.0)صورت گرفت.
يافتهها:با توجه به ملاكهاي معرفيشده،درخت كلاسبندي-رگرسيوني نسبت به روش رندم فارست، عملكرد موفقتري داشت.اين روش حساسيت و ويژگي و خطايي معادل0.575و0.684و 0.264 داشت.همچنين مدلي بهمنظور كلاسبندي مراجعين جديد ارايه شد.
نتيجهگيري:هرچند بر اساس ملاكهاي مقايسهشده دو روش تفاوت چنداني با يكديگر نداشته و در نهايت هر دو روش در تحليل پليمورفيسمهاي تكنوكليوتيدي توصيه ميشوند. اما روش درخت كلاسبندي-رگرسيوني بهعنوان اولين انتخاب پژوهشگر بهمنظور كشف ارتباط ميان پليمورفيسم و بيماري مورد نظر توصيه ميشود.
چكيده لاتين :
Abstract
Objective: In the studies of genomics, it is essential to select a small number of single nucleotide polymorphisms (SNPs). That is more significant than the others for the association studies of disease susceptibility. Data mining technology provides an important means for extracting valuable medical rules hidden in medical data and acts as an important role in disease prediction and clinical diagnosis. In this study, our goal was to compare two machine learning methods using genetic factor and single nucleotide polymorphisms.
Materials & Methods: In order to perform the data analysis, a total of 141 patients and 83 controls in the geneticsʹ section of Shahid Rajaeeʹs heart center. The blood samples to draw conclusions about the LDLR and PCSK9 genesʹ SNPs was used. Also, the random forest and CART was used in order to discover the relationship between CAD and SNPs. These models were assessed by using four criteria including: sensitivity, specificity, precision and error. Data analysis was performed by SPSS (16.0) and R (2.15.0.)
Results: CART had the better performance than Random Forest. Sensitivity, specificity, precision and error were 0.893, 0.506, 0.250 and 0.754 relatively. We introduced an algorithm to classify the high risk and low risk cases.
Conclusion: CART is suggested in order to assess the relationship between CAD and SNPs.
عنوان نشريه :
مطالعات ناتواني
عنوان نشريه :
مطالعات ناتواني
اطلاعات موجودي :
فصلنامه با شماره پیاپی 5 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان