شماره ركورد :
1009018
عنوان مقاله :
تشخيص بيماري عروق كرونر قلبي با استفاده از درخت تصميم c4.5
عنوان به زبان ديگر :
Detection of Coronary Artery Disease Using C4.5 Decision Tree
پديد آورندگان :
صباغ گل، حامد دانشگاه پيام نور بيرجند - گروه كامپيوتر
تعداد صفحه :
13
از صفحه :
287
تا صفحه :
299
كليدواژه :
داده‌كاوي بيماري عروق كرونر قلبي , درخت تصميم c4.5
چكيده فارسي :
يكي از شايع ترين بيماري ها و علل مرگ و مير در دنياي امروز بيماري هاي قلبي است. استفاده از تكنيك هاي داده كاوي براي ايجاد مدل هاي پيشگويي كننده، جهت شناسايي افراد در معرض خطر براي كاهش عوارض ناشي از بيماري بسيار كمك كننده است. در اين پژوهش با استفاده از درخت تصميم c4.5 به روش هاي پيشگيري و تشخيص اين بيماري پرداخته مي شود.روش: اين پژوهش از نوع كاربردي و توصيفي مي باشد. در اين پژوهش از داده هاي استاندارد uci و مجموعه داده cleveland استفاده نموديم. اين پايگاه داده شامل 297 ركورد مي باشد. تجزيه و تحليل به كمك نرم افزار weka با به كارگيري متدولوژي crisp3 انجام شده است. در بخش مدل سازي درخت تصميم c4.5 با به كارگيري متغيرهاي ورودي و تعيين متغير هدف ايجاد شد.نتايج: با توجه به مدل استفاده شده مشخص شد كه به ترتيب متغيرهاي سطح بالاي كلسترول، جنسيت، سن بالا، بالا بودن ماكزيمم ضربان قلب، اسكن تاليوم بالاتر از 3 و نوار قلب غيرنرمال بيشترين تاثير را در ابتلا به بيماري عروق كرونر قلبي دارا هستند. همچنين به كمك درخت تصميم ايجاد شده، قوانيني استخراج شده است كه مي تواند به عنوان الگويي در جهت پيشگويي احتمال ابتلا افراد به بيماري عروق كرونر قلبي استفاده شود. صحت مدل ايجاد شده با استفاده از درخت تصميم بيش از 80 درصد بوده است.نتيجه گيري: با توجه به محاسبات انجام شده، نرخ دسته بندي برابر با 72/6% و دقت الگوريتم c4.5 برابر با 80/2% به دست آمد كه در مقايسه با نتايج مطالعات انجام شده در حوزه داده كاوي بيماري قلبي، دقت به دست آمده الگوريتم پيشنهادي قابل قبول است.
چكيده لاتين :
Introduction: Today, one of the most common diseases and causes of death in the world is heart diseases. Data mining techniques are very useful to create predictive models for identifying people at risk and decreasing the disease complications. In this study, using C4.5 decision tree method, the prevention and diagnosis of this disease are discussed. Methods: This was an applied descriptive study. UCI standard data and Cleveland data collection were used. The database contains 297 records. Analysis was performed through Weka software and using CRISP3 methodology. The C4.5 decision tree model, using input variables and determining the target variable, was created. Results: According to the applied model, it was found that high levels of cholesterol, sex, age, high maximum heart rate, scan thallium higher than 3 and abnormal ECG have the greatest impact on the risk of coronary heart disease. Furthermore, by using the created decision tree, some rules were extracted that can be used as a model to predict the risk of coronary heart disease. The accuracy of the model created by using decision tree was over 80 percent. Conclusion: According to our calculations, the rate of categorization was 72.6% and the accuracy of C4.5 algorithm was 80.2% that in comparison with the results of studies in the field of data mining of heart diseases, the obtained accuracy for the suggested algorithm is acceptable.
سال انتشار :
1395
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
فايل PDF :
7448422
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
لينک به اين مدرک :
بازگشت