پديد آورندگان :
آرام احمدی، محمد نويسنده Department of Biostatistics and Epidemiology, Faculty of Health, kerman University of Medical Sciences, kerman, Iran Aram Ahmadi, M , بهرامپور، عباس نويسنده Bahrampour , A.
كليدواژه :
حساسيت , رگرسيون لجستيك , منحني راك , ويژگي , Discriminant analysis , logistic regression , Sensitivity , Specificity , ROC curve , تحليل جداسازي
چكيده فارسي :
مقدمه و اهداف: بیماری دیابت از جمله بیماریهای مزمن بوده، كه درمان قطعی ندارد و شایعترین علت قطع اندام، نابینایی و نارسایی كلیوی و از عوامل خطر در ایجاد بیماریهای قلبی است. رگرسیون لجستیك و تحلیل جداسازی از مدلهای تحلیل آماری برای امر پیشبینی و جداسازی چند متغیره میباشند. هدف تعیین متغیرهای تأثیرگذار بر دیابت نوع 2 و مقایسه مدلهای رگرسیون لجستیك و تحلیل جداسازی میباشد.
روش كار: دادهها شامل اطلاعات 5357 نفر از مركز فیزیولوژی دانشگاه علوم پزشكی كرمان میباشد. متغیر پاسخ دیابت ومتغیرهای وزن، قد،(BMI) Body Mass Index)(، دور كمر، دور باسن، نسبت كمر به باسن (WHR) ، Waist hip Ratio)( كلسترول و ... در مدل در نظر گرفته شدند. برای مقایسه از حساسیت، ویژگی، دقت، منحنی راك و شبیه سازی استفاده شد.
نتایج: حساسیت، ویژگی و دقت پیشبینی در مدل لجستیك و تحلیل جداسازی به ترتیب 74، 1/71 و 5/71 و 4/22،22/95 و 3/85 بود. منحنی راك برای مدل رگرسیون لجستیك 3/80 درصد 0 و تحلیل جداسازی 1/80 درصد بهدست آمد. شبیهسازی نشان داد كه حساسیت، ویژگی، دقت و منحنی راك در مدل لجستیك و مدل جداسازی به ترتیب 18/99، 49/98 ، 59/98 و 9/99 و 62/92 ، 19/99 ، 26/98 و 56/99 شدند.
نتیجه گیری: نتایج نشان داد كه دور كمر، سن، جنس، مصرف داروی كاهنده فشار خون، اندازه فشار خون سیستولیك و سطح LDL مهم میباشند. حساسیت در مدل لجستیك بیشتر ، اما ویژگی و دقت پیشبینی در تحلیل جداسازی بالاتر بود. منحنیهای راك نشان داد كه مقادیر پیشبینی به طور مجانبی یكسان بودند.
چكيده لاتين :
Background and Objectives: Diabetes is a chronic and common metabolic disease which has no curative treatment. Logistic regression (LR) is a statistical model for the analysis and prediction in multivariate statistical techniques. Discriminant analysis is a method for separating observations in terms of dependent variable levels which can allocate any new observation after making discriminating functions. The aim of this study was to compare and determine the effective variables in type 2 diabetes.
Methods: The data included 5357 persons obtained through a cohort study in Kerman, southeastern Iran, in 2009-11. Diabetes was considered the response variable. The independent variables after deleting colinearity and correlated variables included height, waist circumference, age, gender, occupation, education, drugs, systolic blood pressure, HDL, LDL, drug abuse, activities, and triglyceride. Sensitivity, specificity, accuracy, and ROC curve were applied for determining and comparing the prediction power of the models.
Results: The results in the reduced model with extracted significant variables from the full model, the sensitivity of the LR model and DA was 74% and 22.4%, the specificity of the LR model and DA was 71.1 % and 95.4 %, the prediction accuracy of the LR model and DA was 71.5% and 85.3%, and the ROC curve of the LR model and DA was 80.3% and 80.1%, respectively.Simulation showed the sensitivity, specificity, accuracy, and ROC curve was 99.18%, 98.49%, 98.59%, and 99.9% for the LR model and 92.62%, 99.19%, 98.26%, and 99.56% for DA, respectively.
Conclusion: The results showed that the risk factors of diabetes in the logistic regression reduced model were waist circumference, age, gender, LDL level, systolic pressure, and drugs. Also, the sensitivity of the LR model was more than DA while DA had a higher specificity and prediction accuracy. Comparison of the ROC curve showed that the prediction estimated values were rather similar in both models, but the two models were the same asymptotically.