شماره ركورد كنفرانس :
4658
عنوان مقاله :
استفاده از رويكرد استخراج، بارگذاري، تبديل و تحليل براي داده كاوي در محيط سلامت (مطالعه موردي : بيماري كبد)
عنوان به زبان ديگر :
The Use of Extracting,Loading,Transforming and Analysing for Data Mining in healthcare environment (A Case Study of disease of liver)
پديدآورندگان :
حسن نتاج جلوداري جواد ie_javid@yahoo.com دانشگاه علوم و فنون مازندران; , مهدوي ايرج irajarash@rediffmail.com دانشگاه علوم و فنون مازندران;
كليدواژه :
ELTA , داده كاوي , بيماري كبد , الگوريتم C5.0 , تكنيك تقويت كنندگي , الگوريتم CHAID
عنوان كنفرانس :
دومين كنفرانس بين المللي پژوهش هاي دانش بنيان در كامپيوتر و فن آوري اطلاعات
چكيده فارسي :
دانش نوين داده كاوي يكي از ده دانش در حال توسعه است. با توجه به اينكه امروزه با رشد وسيع بيماري ها حجم زيادي از داده ها طي فرآيندهاي مراقبت و درمان حاصل مي شود تحليل و تفسير آنها با هدف كشف الگوها و دانش جديد مي تواند منتج به ارتقاي سلامت شود. هدف اين تحقيق استفاده از رويكردي بنام استخراج، بارگذاري، تبديل و تحليل (ELTA ) براي داده كاوي در حوزه سلامت و پياده سازي عملي با ابزارها و تكنيك هاي داده كاوي براي يك تصميم بهينه در خصوص تشخيص زود هنگام بيماري كبد مي باشد. اين رويكرد از دو مرحله اساسي تحت پيش پردازش داده ها و تحليل الگوريتم هاي پيشنهادي C5.0 تقويت شده و CHAID تشكيل شده است. با مقايسه عملكرد اين الگوريتم ها مشخص شد كه الگوريتم C5.0 از طريق تكنيك تقويت كنندگي(Bosting) داراي دقت 93.75 درصد است در حاليكه دقت الگوريتم CHAID، 65 درصد شده است. يكي ديگر از دستاوردهاي مهم اين تحقيق در مورد توانايي هر دو الگوريتم در توليد قوانين براي كلاس هاي مربوط به بيماري كبد مي باشد. همچنين نتايج ارزيابي ما نشان مي دهد كه الگوريتم C5.0 تقويت شده، جنسيت را در بيماري كبد در نظر مي گيرد در حالي كه اين عامل در بسياري از مطالعات ديگر ناديده گرفته شد. بنابراين روش هاي تشخيصي پيشنهاد شده به عنوان يك سيستم متخصص و هوشمند تاثير مهمي در تشخيص بيماري كبد دارند. براساس نتايج حاصل از تحليل داده ها مدل ما عملكرد بهتري نسبت به روش هاي موجود در ادبيات تحقيق دارد.
چكيده لاتين :
Modern science data mining is one of the developing ten pieces of knwoledge. Given that todays widespread disease of a large amount of data is achieved through care and treatment processes, their analysis and exploration with the aim of discovering new patterns and knowledge can lead to health promotion. The purpose of this research is to use an approach called extraction, loading, transformation and analysis (ELTA) for data mining in the field of health and practical implementation with data mining tools and techniques for taking an optimal decision on early diagnosis of liver disease. By comparing the performance of these algorithms, it becomes clear that the C5.0 algorithm has an accuracy of 93.75% through the Boosting technique, while the accuracy of the CHAID algorithm is 65%. Another important achievement of this paper is about the ability of both algorithms to produce rules in classes for liver disease. Also, our assessment show that Boosted C5.0 algorithm considers the gender in liver disease a factor which was neglected many other studies. Therefore, our proposed diagnostic methods as an expert and intelligent system have impressive impact on liver disease detection. Based on the results obtained through analyzing the data, we observed that our model had better performance compared to existing methods in the literature.