شماره ركورد :
1098114
عنوان مقاله :
مقايسه كارايي روش‌هاي داده‌كاوي در پيش‌بيني ابتلا به بيماري ديابت نوع 2
عنوان به زبان ديگر :
Comparison of the efficiency of data mining methods in predicting type 2 diabetes
پديد آورندگان :
تيره، حسين دانشگاه علوم پزشكي مشهد , شاكري، محمدتقي دانشگاه علوم پزشكي مشهد , رسولي‌نژاد، صادق دانشگاه علوم پزشكي مشهد , اسماعيلي، حبيب‌اله دانشگاه علوم پزشكي مشهد , يوسفي، راضيه دانشگاه علوم پزشكي مشهد
تعداد صفحه :
7
از صفحه :
301
تا صفحه :
307
كليدواژه :
حساسيت و ويژگي , بيماري‌هاي متابوليك , ديابت شيرين , داده‌كاوي
چكيده فارسي :
زمينه و هدف: ديابت بيماري مزمني است كه شايع‌ترين بيماري اختلالات متابوليسم و يكي از عمده‌ترين مسايل بهداشتي-درماني در سرتاسر دنيا است. امروزه تكنيك‌هاي داده‌كاوي (Data mining techniques) با توجه به توانمندي آن‌ها، در حوزه‌هاي مختلف به‌كار برده مي‌شوند. بنابراين در اين پژوهش به مقايسه كارايي روش‌هاي داده‌كاوي در پيش‌بيني ابتلا به بيماري ديابت نوع 2 پرداخته شد. روش بررسي: در اين مطالعه تحليلي-مقطعي، از مجموع 7000 نفر شركت‌كننده در طرح غربالگري ديابت سال 1395 در منطقه ثامن مشهد كه شامل بررسي ميزان قند‌خون، چشم‌ها، آسيب كليوي و سلامت پاها بود، تعداد 540 نفر مبتلا به بيماري ديابت (درمان نشده) بودند و براي حفظ توازن 600 فرد سالم به‌صورت نمونه‌گيري متناسب با حجم انتخاب شدند (حجم كل نمونه 1140 نفر). در اين مطالعه مبتلايان به ديابت بالاي 30 سال وارد مطالعه گرديدند و افرادي كه از پيش سابقه‌ي ديابت نوع 2 داشتند و اكنون به‌سبب استفاده از دارو و يا رعايت ساير نكات مقدار قند‌خون طبيعي داشتند از مطالعه حذف گرديدند. يافته‌ها: صحت هر سه مدل برابر بود (86%) اما از نظر سطح زيرمنحني راك (Receiver operating characteristic, ROC)، مدل‌هاي رگرسيون لجستيك (Logistic regression model) و بيزين ساده (Simple Bayesian model) با90% سطح زيرمنحني راك عملكرد بهتري داشتند. در مدل بيزين ساده و رگرسيون لجستيك به‌ترتيب متغيرهاي شاخص توده بدني و سن داراي بيشترين ميزان اهميت بودند، در‌حالي‌كه در مدل ماشين‌بردار پشتيبان (Support vector machine, SVM)، متغيرهاي شاخص توده بدني و فشارخون داراي بيشترين اهميت بودند. نتيجه‌گيري: صحت هر سه مدل برابر بود. از نظر سطح زيرمنحني راك، مدل‌هاي رگرسيون لجستيك و بيزين ساده مناسب‌تر بودند. در مجموع هر سه مدل عملكرد مشابهي داشتند. در هر سه مدل شاخص توده بدني داراي بيشترين اهميت بود
چكيده لاتين :
Background: Diabetes mellitus as a chronic disease is the most common disease caused by metabolic disorders and it is one of the most important health issues all around the world. Nowadays, data mining methods are applied in different fields of sciences due to data mining methods capability. Therefore, in this study, we compared the efficiency of data mining methods in predicting type 2 diabetes. Methods: In this cross-sectional study, the data of 7,000 participants in the Diabetes Screening Project in Samen, Mashhad City, Iran, were considered in 2016. There were 540 untreated diabetic patients. The Samen Project was included in the routine examinations of diabetes patients like blood glucose, eyes health, nephropathy, and legs health. So, in order to maintain balance, 600 healthy individuals were selected in a proportional volume sampling in this study. Therefore, the total sample size was 1140 people. In this study, people with diabetes aged over 30 years old were enrolled and participants with the previous history of type 2 diabetes, with normal blood glucose due to drug use or other issues at the time of the study, were excluded. Results: All three models (Logistic regression, simple Bayesian and support vector machine models) had the same test accuracy (86%), however, in terms of area under the receiver operating characteristic (ROC) curve (AUC), logistic regression and simple Bayesian models had better performance (AUC=90% against AUC=88%). In the simple Bayesian model and logistic regression, body mass index (BMI) and age variables were the most important variables, while BMI and blood pressure variables were the most important factors in the support vector machine model. Conclusion: According to the results, all three models had the same accuracy. In terms of area under the curve (AUC), logistic and simple Bayes models had better performance than the support vector machine model. Totally all three models had almost the same performance. Based on all three models, BMI was the most important variable
سال انتشار :
1398
عنوان نشريه :
مجله دانشكده پزشكي دانشگاه علوم پزشكي تهران
فايل PDF :
7687152
لينک به اين مدرک :
بازگشت