شماره ركورد :
700253
عنوان مقاله :
كاربرد و مقايسه روش‌هاي يادگيري ماشيني رندم فارست و درخت كلاس‌بندي- رگرسيوني در مطالعه وابستگي ژنتيكي در بيماران مبتلا به شريان‌هاي كرونري
عنوان فرعي :
Application and Comparison of Random Forest and CART in genetic Association Study in coronary artery disease
پديد آورندگان :
مددكار، آتوسا نويسنده دانشگاه علوم بهزيستي و توانبخشي Madadkar, Atoosa , كريملو، مسعود نويسنده Karimlou, M. , رهگذر، مهدي نويسنده گروه آمار زيستي, دانشگاه علوم بهزيستي و توانبخشي تهران,تهران,ايران rahgozar, mahdi , جمال الديني، سيد حميد نويسنده دانشگاه علوم بهزيستي و توانبخشي Jamaldini, seyed hamid , مظفري، رضا نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1392 شماره 5
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
8
از صفحه :
1
تا صفحه :
8
كليدواژه :
اثر متقابل , پلي‌مورفيسم تك‌نوكليوتيدي , روش‌هاي يادگيري ماشيني , بيماري شريان‌هاي كرونر
چكيده فارسي :
چكيده هدف:در مطالعات ژنتيك، برگزيدن تعداد معدودي از پلي‌مورفيسم تك‌نوكليوتيديكه نسبت به ساير پلي‌مورفيسم‌ها ارتباط بيشتري با بيماري مورد نظر دارند، امري ضروري است. اين تحقيق با هدف مقايسه دو روش يادگيري ماشيني مبتني بر درخت رندم فارست و درخت كلاس‌بندي-رگرسيوني، به‌منظور پيش‌بيني افراد مبتلا به بيماري شريان‌هاي كرونر با استفاده از پلي‌مورفيسم تك نوكليوتيدي انجام شد. روش‌بررسي:به‌منظور انجام اين پژوهش، از مراجعين بيمارستان قلب و شريان‌هاي شهيد رجايي تهران در فاصله سال‌هاي 1390و 1391 تمام شماري به عمل آمد. اطلاعات 141 فرد مبتلا به بيماري شريان‌هاي كرونر و 83شاهد توسط مركز تحقيقات ژنتيك اين بيمارستان گردآوري شد. از طريق روش تعيين توالي، ژنوتيپ پلي‌مورفيسم تك‌نوكليوتيدي انتخاب‌شده در جايگاه ژن LDLR و پروموتر ژن PCSK9 هر فرد مشخص شد. همچنين به‌منظور كشف ارتباط ميان پلي‌مورفيسم تك‌نوكليوتيدي و بيماري شريان‌هاي كرونر، از دو روش يادگيري ماشيني: درخت كلاس‌بندي-رگرسيوني و رندم فارست استفاده شد. اعتبارسنجي مدل براساس اعتبارسنجي ده قسمتي انجام شد. مدل‌ها پس از برازش، با استفاده از سه ملاك حساسيت و ويژگي و خطا ارزيابي شدند. تحليل داده‌ها با استفاده از نرم افزار R(2.15.0)صورت گرفت. يافته‌ها:با توجه به ملاك‌هاي معرفي‌شده،درخت كلاس‌بندي-رگرسيوني نسبت به روش رندم فارست، عملكرد موفق‌تري داشت.اين روش حساسيت و ويژگي و خطايي معادل0.575و0.684و 0.264 داشت.همچنين مدلي به‌منظور كلاس‌بندي مراجعين جديد ارايه شد. نتيجه‌گيري:هرچند بر اساس ملاك‌هاي مقايسه‌شده دو روش تفاوت چنداني با يكديگر نداشته و در نهايت هر دو روش در تحليل پلي‌مورفيسم‌هاي تك‌نوكليوتيدي توصيه مي‌شوند. اما روش درخت كلاس‌بندي-رگرسيوني به‌عنوان اولين انتخاب پژوهشگر به‌منظور كشف ارتباط ميان پلي‌مورفيسم و بيماري مورد نظر توصيه مي‌شود.
چكيده لاتين :
Abstract Objective: In the studies of genomics, it is essential to select a small number of single nucleotide polymorphisms (SNPs). That is more significant than the others for the association studies of disease susceptibility. Data mining technology provides an important means for extracting valuable medical rules hidden in medical data and acts as an important role in disease prediction and clinical diagnosis. In this study, our goal was to compare two machine learning methods using genetic factor and single nucleotide polymorphisms. Materials & Methods: In order to perform the data analysis, a total of 141 patients and 83 controls in the geneticsʹ section of Shahid Rajaeeʹs heart center. The blood samples to draw conclusions about the LDLR and PCSK9 genesʹ SNPs was used. Also, the random forest and CART was used in order to discover the relationship between CAD and SNPs. These models were assessed by using four criteria including: sensitivity, specificity, precision and error. Data analysis was performed by SPSS (16.0) and R (2.15.0.) Results: CART had the better performance than Random Forest. Sensitivity, specificity, precision and error were 0.893, 0.506, 0.250 and 0.754 relatively. We introduced an algorithm to classify the high risk and low risk cases. Conclusion: CART is suggested in order to assess the relationship between CAD and SNPs.
سال انتشار :
1392
عنوان نشريه :
مطالعات ناتواني
عنوان نشريه :
مطالعات ناتواني
اطلاعات موجودي :
فصلنامه با شماره پیاپی 5 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت