عنوان مقاله :
استخراج دانش از دادههاي بيماران ديابتي با استفاده از روش درخت تصميم C5.0
عنوان فرعي :
Knowledge Extraction of Diabeticsʹʹ Data by Decision Tree Method
پديد آورندگان :
عامري، حكيمه نويسنده كارشناس ارشد تجارت الكترونيك، گروه مهندسي فناوري اطلاعات، دانشكده مهندسي صنايع، دانشگاه خواجه نصيرالدين طوسي، تهران، ايران , , عليزاده، سميه نويسنده ستاديار گروه مهندسي فناوري اطلاعات، دانشكده مهندسي صنايع، دانشگاه خواجه نصيرالدين طوسي، تهران، ايران؛ نويسنده مسيول (s_alizadeh@kntu.ac.ir) Alizade, S , برزگري، اكبر نويسنده پزشك، دانشگاه علوم پزشكي استان گلستان Barzegari, A
اطلاعات موجودي :
فصلنامه سال 1392 شماره 53
كليدواژه :
الگوريتم C 5.0 , ديابت نوع دو , شبكه عصبي مصنوعي , عوارض ديابت
چكيده فارسي :
مقدمه: بروز ديابت در ده سال اخير در سطح جهان دو برابر شده است . حدود 200 ميليون نفر به اين بيماري مبتلا هستند و سالانه شيوع ديابت در جهان حدود شش درصد افزايش مييابد. بيش از دو ميليون نفر در ايران به اين بيماري مبتلا هستند. در اين تحقيق به بررسي ارتباط بين عوارض مشاهده شده در بيماران ديابتي نوع دو و برخي ويژگيهاي آنها از قبيل ميزان قند خون، فشار خون، سن و سابقه خانوادگي بيماران ميپردازيم. هدف اين مطالعه، پيش بيني عوارض بيماران بر اساس علايم مشاهده شده در آنها است.
روش كار: دادههاي مورد نياز براي اين تحقيق از پروندههاي سال 1388 مركز ديابت استان گلستان جمع آوري شده است. تعداد پروندههاي اوليه بيماران 856 ركورد بود. در اين مقاله مدل جديدي بر اساس متدولوژي استاندارد CRISP ارايه شده است. در بخش مدل سازي از دو روش شناخته شده در داده كاوي به نامهاي درخت تصميم C5.0 و شبكه عصبي استفاده شده است. براي تحليل دادهها از نرم افزار Celementine 12.0 استفاده شده است.
يافتهها: در اين تحقيق براي اولين بار احتمال بروز عوارض ميكروواسكولار، ماكروواسكولار و يا هر دو نوع عارضه در بيماران و ويژگيهاي تاثيرگذار بر آنها مورد بررسي قرار گرفته است. با استفاده از داده كاوي و روشهاي آن تعيين شده است كه متغيرهاي فشار خون بالا، سن و سابقه خانوادگي در عوارض مشاهده شده بيشترين تاثير را داشته اند. به كمك درخت تصميم ايجاد شده، قوانيني استخراج شده اند كه ميتواند به عنوان الگويي براي پيش بيني وضعيت بيماران و احتمال بروز عوارض در آنها استفاده شود. صحت مدل ايجاد شده بر روي دادههاي مورد استفاده در درخت تصميم C5.0، 89.74 درصد و در شبكه عصبي مصنوعي 51.28 درصد ميباشد.
نتيجه گيري: با توجه به روشهاي استفاده شده، بالاترين دقت با استفاده از الگوريتم C5.0 به دست آمده است. بيشترين عوامل تاثيرگذار بر بروز عوارض شناسايي شدند. با توجه به قوانين ايجاد شده براي يك نمونه جديد با ويژگيهاي مشخص، ميتوان پيش بيني كرد بيمار احتمالاً دچار چه نوع عارضه اي خواهد شد.
كليد واژهها: ديابت نوع دو، عوارض ديابت، داده كاوي، الگوريتم C 5.0، شبكه عصبي مصنوعي
چكيده لاتين :
Introduction: In the last 10 years The incidence of diabetes has doubled worldwide with annual increasing rate of about 6%. More than 2 million people in Iran are now affected by this disease. The present research deals with the relation between the observed complications of type 2 diabetic patients and some related features like Blood Glucose Level, Blood Pressure, Age, and Family History. The main purpose was to predict the patients’ complications based on the observed signs.
Methods: The research data were gathered from 856 patient records related to the 2009’s cases in the Diabetes Center of Golestan province. A new model based on the standard methodology CRISP was developed. In the modeling section, two well-known data mining techniques called C5.0 decision tree and Neural Network were used. Celementine 12.0 software was implemented For data analysis.
Results: The results of data mining showed that the variables of high blood pressure, age, and family history had the most impact on the observed complications. Based on the created decision tree, some rules have been extracted which can be used as a pattern to predict the probability of occurring these complications in the patients. The accuracy of the C5.0 model on the data was shown to be 89.74% and on the Artificial Neural Network was 51.28%.
Conclusion: As the highest accuracy was shown to be achieved using C5.0 algorithm, according to the created rules, it can be predicted which complication(s) any diabetic patient with new specified features may probably suffer from.
Keywords: type 2 diabetic, diabetic complications, Data mining, C5.0 Algorithm, Artificial neural network
عنوان نشريه :
مديريت سلامت
عنوان نشريه :
مديريت سلامت
اطلاعات موجودي :
فصلنامه با شماره پیاپی 53 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان