عنوان مقاله :
تعيين عوامل موثر در بروز سرطان معده با استفاده از رويكرد داده كاوي
عنوان به زبان ديگر :
Determining the Effective Factors in the Incidence of Gastric Cancer by Using Data Mining Approach
پديد آورندگان :
محمودي، عباس دانشگاه آزاد اسلامي يزد - دانشكده فني و مهندسي - گروه مهندسي كامپيوتر , ميرزائي، كمال دانشگاه آزاد اسلامي ميبد - دانشكده فني و مهندسي - گروه مهندسي كامپيوتر , محمودي، مصطفي دانشگاه علوم پزشكي شهيد صدوقي يزد - دانشكده دندانپزشكي
كليدواژه :
داده كاوي , قوانين انجمني , الگوريتم Apriori , سرطان معده , الگوريتم ID3
چكيده فارسي :
سرطان معده دومين علت مرگ ناشي از سرطان در جهان است. با توجه به اينكه اين بيماري جزو كشنده ترين بيماري ها در كشور ماست بررسي و شناخت عوامل تاثيرگذار در ايجاد اين بيماري، بسيار اهميت دارد. در اين پژوهش از دو تكنيك داده كاوي يعني الگوريتم Apriori و الگوريتم ID3 به منظور بررسي عوامل موثر در بروز سرطان معده استفاده شده است.
روش بررسي: مجموعه داده هاي اين پژوهش از 490 بيمار شامل 220 نمونه ي مبتلا به سرطان و270 نمونه ي سالم مراجعه كننده به بيمارستان امام رضاي تبريز جمع آوري شد. با استفاده از الگوريتم Apriori و پياده سازي آن در نرم افزار متلب، بهترين قوانين حاكم بر روي اين مجموعه داده، استخراج شده است. همچنين از الگوريتم ID3 نيز جهت بررسي اين عوامل استفاده شد.
يافته ها: نتايج داده كاوي نشان مي دهد كه داشتن سابقه رفلاكس معده بيشترين تاثير را در بروز اين بيماري دارد. با استفاده از الگوريتم Apriori قوانيني به دست آمد كه مي تواند به عنوان الگويي براي پيش بيني وضعيت بيماران و احتمال بروز اين بيماري و بررسي عوامل تاثيرگذار در ايجاد اين بيماري استفاده شود. همچنين دقت پيش بيني به دست آمده از الگوريتم ID3 برابر 85/56 به دست آمد كه نتيجه ي بسيار خوبي در پيش بيني سرطان معده است.
نتيجه گيري: استفاده از داده كاوي به خصوص در داده هاي پزشكي با توجه به حجم بالاي داده ها و وجود روابط ناشناخته بين ويژگي هاي سيستميك، شخصي و رفتاري بيماران بسيار مفيد است. نتايج حاصل از اين پژوهش مي تواند به پزشكان در شناسايي عوامل موثر در بروز اين بيماري و نيز پيش بيني بروز اين بيماري كمك فراواني كند
چكيده لاتين :
Background and Aim: Gastric cancer is the second leading cause of cancer death
in the world. Due to the prevalence of the disease and the high mortality rate of
gastric cancer in Iran, the factors affecting the development of this disease should
be taken into account. In this research, two data mining techniques such as Apriori
and ID3 algorithm were used in order to investigate the effective factors in gastric
cancer.
Materials and Methods: Data sets in this study were collected among 490 patients
including 220 patients with gastric cancer and 270 healthy samples referred to
Imam Reza hospital in Tabriz. The best rules related to this data set were extracted
through Apriori algorithm and implementing it in MATLAB. ID3 algorithm was
also used to investigate these factors.
Results: The results showed that having a history of gastro esophageal reflux has
the greatest impact on the incidence of this disease. Some rules extracted through
Apriori algorithm can be a model to predict patient status and the incidence of
the disease and investigate factors affecting the disease. The prediction accuracy
achieved through ID3 algorithm is 85.56 which was a very good result in the
prediction of gastric cancer.
Conclusion: Using data mining, especially in medical data, is very useful due to the
large volume of data and unknown relationships between systemic, personal, and
Behavioral Features of patients. The results of this study could help physicians to
identify the contributing factors in incidence of the disease and predict the incidence
of the disease.
عنوان نشريه :
پياورد سلامت
عنوان نشريه :
پياورد سلامت