عنوان مقاله :
تشخيص بيماري عروق كرونر قلبي با استفاده از درخت تصميم c4.5
عنوان به زبان ديگر :
Detection of Coronary Artery Disease Using C4.5 Decision Tree
پديد آورندگان :
صباغ گل، حامد دانشگاه پيام نور بيرجند - گروه كامپيوتر
كليدواژه :
دادهكاوي بيماري عروق كرونر قلبي , درخت تصميم c4.5
چكيده فارسي :
يكي از شايع ترين بيماري ها و علل مرگ و مير در دنياي امروز بيماري هاي قلبي است. استفاده از تكنيك هاي داده كاوي براي ايجاد مدل هاي پيشگويي كننده، جهت شناسايي افراد در معرض خطر براي كاهش عوارض ناشي از بيماري بسيار كمك كننده است. در اين پژوهش با استفاده از درخت تصميم c4.5 به روش هاي پيشگيري و تشخيص اين بيماري پرداخته مي شود.روش: اين پژوهش از نوع كاربردي و توصيفي مي باشد. در اين پژوهش از داده هاي استاندارد uci و مجموعه داده cleveland استفاده نموديم. اين پايگاه داده شامل 297 ركورد مي باشد. تجزيه و تحليل به كمك نرم افزار weka با به كارگيري متدولوژي crisp3 انجام شده است. در بخش مدل سازي درخت تصميم c4.5 با به كارگيري متغيرهاي ورودي و تعيين متغير هدف ايجاد شد.نتايج: با توجه به مدل استفاده شده مشخص شد كه به ترتيب متغيرهاي سطح بالاي كلسترول، جنسيت، سن بالا، بالا بودن ماكزيمم ضربان قلب، اسكن تاليوم بالاتر از 3 و نوار قلب غيرنرمال بيشترين تاثير را در ابتلا به بيماري عروق كرونر قلبي دارا هستند. همچنين به كمك درخت تصميم ايجاد شده، قوانيني استخراج شده است كه مي تواند به عنوان الگويي در جهت پيشگويي احتمال ابتلا افراد به بيماري عروق كرونر قلبي استفاده شود. صحت مدل ايجاد شده با استفاده از درخت تصميم بيش از 80 درصد بوده است.نتيجه گيري: با توجه به محاسبات انجام شده، نرخ دسته بندي برابر با 72/6% و دقت الگوريتم c4.5 برابر با 80/2% به دست آمد كه در مقايسه با نتايج مطالعات انجام شده در حوزه داده كاوي بيماري قلبي، دقت به دست آمده الگوريتم پيشنهادي قابل قبول است.
چكيده لاتين :
Introduction: Today, one of the most common diseases and causes of death in the world is heart
diseases. Data mining techniques are very useful to create predictive models for identifying people at
risk and decreasing the disease complications. In this study, using C4.5 decision tree method, the
prevention and diagnosis of this disease are discussed.
Methods: This was an applied descriptive study. UCI standard data and Cleveland data
collection were used. The database contains 297 records. Analysis was performed through
Weka software and using CRISP3 methodology. The C4.5 decision tree model, using input
variables and determining the target variable, was created.
Results: According to the applied model, it was found that high levels of cholesterol, sex, age, high
maximum heart rate, scan thallium higher than 3 and abnormal ECG have the greatest impact on the
risk of coronary heart disease. Furthermore, by using the created decision tree, some rules were
extracted that can be used as a model to predict the risk of coronary heart disease. The accuracy of
the model created by using decision tree was over 80 percent.
Conclusion: According to our calculations, the rate of categorization was 72.6% and the accuracy of
C4.5 algorithm was 80.2% that in comparison with the results of studies in the field of data mining
of heart diseases, the obtained accuracy for the suggested algorithm is acceptable.
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي