پديد آورندگان :
نبوتي، احسان نويسنده and Lecturer, Management and Health Information Technology Department, Faculty of Paramedicine, Kashan University of PhD Candidate, Medical Informatics, Student Research Committee, Faculty of Medicine, Mashhad University of Medical Sciences, Mashhad , , عزيزي، اميرعباس نويسنده دانشكده پيراپزشكي-دانشگاه علوم پزشكي جندي شاپور اهواز azizi, amir abbas , عباسي، ابراهيم نويسنده PhD Candidate, Medical Informatics, Student Research Committee, Faculty of Medicine, Mashhad University of Medical Sciences, Mashhad , , وكيلي اركي، حسن نويسنده PhD Candidate, Medical Informatics, Student Research Committee, Faculty of Medicine, Mashhad University of Medical Sciences, Mashhad , , زارعي، جواد نويسنده PhD Candidate, Health Information Management, Health Management and Economics Research Center, School of Health Management andInformation Sciences, Iran University of Medical Sciences, Tehran, Iran , , رضوي، اميررضا نويسنده ,
كليدواژه :
پيشبيني , دادهكاوي , درخت تصميم , سوختگيها , يادگيري ماشين , شبكهي عصبي مصنوعي
چكيده فارسي :
مقدمه: در دههي اخير الگوريتمهاي يادگيري ماشين به ابزار مفيدي جهت دادهكاوي در دادههاي پزشكي، براي توليد مدلهاي پيشبيني تبديل شدهاند. سوختگي از جمله بيماريهايي است كه پيشبيني پيامد آن از اهميت زيادي برخوردار است. هدف اين مطالعه بررسي عملكرد دو الگوريتم پراستفادهي يادگيري ماشين يعني شبكهي عصبي و درخت تصميم و مقايسه با روش آماري رگرسيون لجستيك در پيشبيني پيامد بيماران سوختگي بوده است.
روش بررسي: در اين مطالعه مشاهدهاي گذشتهنگر، پس از انجام پردازش اوليهي دادهها و تعيين پيامد (زنده يا فوت)، دو الگوريتم يادگيري ماشين (شبكهي عصبي و درخت تصميم) به همراه روش آماري رگرسيون لجستيك براي توليد مدلهاي پيشبيني روي دادههاي 4804 بيمار سوختگي بيمارستان طالقاني اهواز مربوط به سالهاي 1380 تا 1386 اعمال گرديد. براي پردازش اوليهي دادهها نرمافزار SPSS16 و در مرحلهي مدلسازي از Clementine 12.0 استفاده شد. همچنين با بهكارگيري تكنيك 10-Fold Cross Validation، معيارهاي ارزيابي كارايي براي دادههاي تست محاسبه و مقايسه شدند.
يافتهها: نتايج نشان داد الگوريتم شبكهي عصبي با دقت 97 درصد منجر به دقيقترين مدل روي دادههاي مورد مطالعه ميشود. مدل درخت تصميم با دقت 95 درصد در ردهي دوم و مدل رگرسيون لجستيك با دقت 90 درصد كمترين دقت را داشت. ساير معيارهاي ارزيابي مانند حساسيت (Sensitivity)، ويژگي (Specificity)، PPV (Positive Predictive Value) و NPV (Negative Predictive Value) و AUC (Area Under the Curve) نيز كارايي مدل شبكهي عصبي را بالاتر از دو مدل ديگر نشان دادند.
نتيجهگيري: تحليل نتايج اين مطالعه و مطالعات مشابه نشان ميدهند كه الگوريتمهاي يادگيري ماشين نسبت به روشهاي آماري منجر به توليد مدلهاي دقيقتري ميشوند. بسته به ماهيت و ميزان دادهها و همچنين جامعهي پژوهش، الگوريتمهاي مختلف يادگيري ماشين، رفتارهاي متفاوتي دارند كه بهنظر ميرسد دقت مدلهاي شبكهي عصبي از ساير مدلها بيشتر ميباشد.
واژههاي كليدي: دادهكاوي؛ يادگيري ماشين؛ پيشبيني؛ درخت تصميم؛ شبكهي عصبي مصنوعي؛ سوختگيها
چكيده لاتين :
Abstract
Introduction: In the past decades, machine learning algorithms have become a useful tool for data mining within huge amounts of health data to create prediction models. Burn is one of the diseases that predicting of its outcome has high importance. The aim of this study was to survey two widely used machine learning algorithms; Artificial Neural Network (ANN) and decision tree, and compare them with logistic regression method to predict the outcome of burn patients.
Methods: In this retrospective observational study, following preprocessing of the data and determining the outcome of patient (Life or death), two well-known machine learning algorithms (ANN and decision tree) and logistic regression method were used to create prediction models using data from 4804 burn patients hospitalized in Taleghani Burn Center in Ahvaz during the years 2001-2007. The preprocessing of the data was performed using SPSS (Version 16.0), and in the modeling phase, Clementine (Version 12.0) software was used. Moreover, 10-fold cross validation technique was used to validate the model and criteria for evaluating the performance of models were measured and compared.
Results: The results showed that the ANN algorithm with accuracy of 97% resulted the most accurate model on the studied data. The decision tree model with 95% accuracy was in the second place and the logistic regression model with an accuracy of 90% was the least accurate. Moreover other evaluating criteria such as sensitivity, specificity, PPV, NPV and AUC showed that performance of the ANN model was better than the others.
Conclusion: The current study shows that machine learning algorithms compared with statistical methods create more accurate models. In analyzing the current data, the model created by ANN is more accurate than the other machine learning algorithm, decision tree.
Keywords: Data Mining; Machine Learning; Forecasting; Decision Tree; Artificial Neural Network; Burns