پديد آورندگان :
زند كريمي، اقبال دانشگاه علوم پزشكي كردستان، سنندج , صادقي فر، مجيد دانشگاه بوعلي سينا همدان - گروه آمار، همدان , رضايي، منصور دانشگاه علوم پزشكي كرمانشاه - مركز تحقيقات توسعه اجتماعي و ارتقاي سلامت - گروه آمارزيستي و اپيدميولوژي،كرمانشاه
كليدواژه :
شبكه عصبي مصنوعي پرسپترون چندلايه , رگرسيون لجستيك , تحليل مميزي , Wrapper , منحني راك
چكيده فارسي :
هدف: در اين مطالعه عملكرد پيشبيني سه مدل آماري جهت تعيين ريسك فاكتورهاي ديابت مقايسه گرديد.
مواد و روشها: شاخص توده بدن (BMI)، قندخون ناشتا (FBS)، فشارخون (HT)، چربيهاي خون (TC، TG، HDL و LDL، HbA1C)، وزن و سابقه سيگار كشيدن از پرونده درماني افراد تحت بررسي گردآوري شد. مدلهاي شبكه عصبي مصنوعي پرسپترون چندلايه (MLP) و تحليل مميزي (DA) رگرسيون لجستيك (LR) به منظور شناسايي ريسك فاكتورها بر دادهها برازش و از منحني راك جهت مقايسه قدرت پيشبيني مدلها استفاده شد. بهمنظور رفع مشكل بيش برازش(Overfitting ) در مدل MLP از الگوريتم Wrapper استفاده شد.يافتهها: قدرت پيشبيني سه مدل MLP، DA و LR بر اساس سطح زير منحني راك به ترتيب برابر 984/0 و 981/0 و 983/0 برآورد گرديد. متغيرهاي FBS (0001/0P<) و HbA1C (0001/0P<)، وزن (001/0P<)، BMI (01/0P<) و LDL (003/0P<) در مدل LR و متغيرهاي HT ,SIGAR ,Hba1c ,FBS با 0001/0 P<در مدل DA و متغيرهاي سن، FBS، TG، HbA1C، BMI، HT و TC با توجه به روش راپر، در مدلMLP معنادار بودند. مدل MLP (97%) حساسيت بالاتري را نسبت به LR (94%)و DA (92%) نشان داد. همچنين مدلMLP (97%) ويژگي بالاتري نسبت بهLR (92%) وDA (3/93%) را داشت.نتيجهگيري: با توجه به يافتههاي اين مطالعه سه روش LR، DA و MLP، جهت كشف تفاوتها تقريبا مشابه بودند. بنابراين پيشنهاد مي شود در مواردي كه نياز به تفسير ساده اثر متغيرها وجود دارد از روش LR كه معياري مانند or را فراهم مينمايد، استفاده شود. اين در حالي است كه روش MLP مانند يك جعبه سياه عمل ميكند كه نوع رابطه بين متغيرها در آن نامشخص است. همچنين پيشنهاد ميشود كه عملكرد روشهاي فوق با استفاده مجموعه دادههاي ديگر نيز با يكديگر مقايسه شود و مطالعات بيشتري انجام شود.
چكيده لاتين :
Introduction: The present study aimed to evaluate the performance of three statistical models in predicting diabetes type 2 as well as to identify its risk factors.
Materials and Methods: The data related to the potential risk factors of body mass index (BMI), fasting blood sugar (FBS), hypertension (HT), lipids (TC, TG, HDL and LDL), HbA1C and smoking history of 300 patients were extracted from medical records. Artificial neural network multi-layer perceptron (MLP), discriminant analysis (DA) and logistic regression (LR) were applied to identify risk factors. ROC curve was used to compare the performance of the models. To fix the problem "over fitting", the MLP model algorithm was used Wrapper.
Results: The prediction power of the MLP, DA and LR based on the ROC curve were 0.984, 0.981and 0.983, respectively. In the LR model, variables FBS (P<0.0001) and HbA1C (P<0.0001), weight (P<0.001), BMI (P<0.01) and LDL (P<0.003) were significant. In the DA model, variables HT, Smoking status, Hba1c, FBS (all, P<0.0001) were significant. Age, FBS, TG, HbA1C, BMI, HT and TC were significant in the MLP model. The MLP showed higher sensitivity (97%) compared with the LR (94%) and the DA (92%). Also, the model MLP (97%) exhibited high specificity than the LR (92%) and DA (93.3%).
Conclusion: According to the findings of the present study, the performance of the three used methods of MLP, LR and DA were similar. It is suggested to use the LR where there is a need to simple interpretation as it provides or for a group relative to the other one while MLP acts like a black box that does not show the relationship between variables. It is also suggested to conduct studies for further investigation of the performance of these methods.