شماره ركورد :
1076813
عنوان مقاله :
مقايسه روش‌هاي جنگل تصادفي و رگرسيون لجستيك در پيش‌بيني مرگ‌ومير مبتلايان به سرطان كولوركتال و عوامل مرتبط با آن
عنوان به زبان ديگر :
Comparison of Random Forest and Logistic Regression Methods in Predicting Mortality in Colorectal Cancer Patients and its Related Factors
پديد آورندگان :
كشت ورز حسام آبادي، علي محمد دانشگاه تربيت مدرس - دانشكده علوم پزشكي , حاجي زاده، ابراهيم دانشگاه تربيت مدرس - دانشكده علوم پزشكي - گروه آمار زيستي , پورحسينقلي، محمد امين دانشگاه علوم پزشكي شهيد بهشتي - پژوهشكده بيماري‌هاي گوارش و كبد - مركز تحقيقات گوارش و كبد , ناظم الحسيني مجرد، احسان دانشگاه علوم پزشكي شهيد بهشتي - پژوهشكده بيماري‌هاي گوارش و كبد - مركز تحقيقات گوارش و كبد
تعداد صفحه :
10
از صفحه :
375
تا صفحه :
384
كليدواژه :
سرطان كولوركتال , جنگل تصادفي , رگرسيون لجستيك , مرگ‌ومير
چكيده فارسي :
مقدمه و اهداف: هدف اين مطالعه پيش بيني مرگ ومير حاصل از سرطان كولوركتال در بيماران ايراني و تعيين عوامل موثر بر آن با استفاده از روش جنگل تصادفي و رگرسيون لجستيك است. روش كار: از اطلاعات 304 بيمار مبتلا به سرطان كولوركتال ثبت مركز تحقيقات گوارش و كبد دانشگاه علوم پزشكي شهيد بهشتي طي سال‌هاي 88‌ تا ‌93 به صورت يك مطالعه گذشته نگر استفاده شد. تجزيه و تحليل داده‌ها با استفاده از روش‌هاي جنگل تصادفي و رگرسيون لجستيك انجام شد. براي تحليل داده‌ها از نرم افزار R نسخه 3 .4 .3 استفاده شد. يافته‌ها: ده متغير مهمي كه با مرگ ومير سرطان كولوركتال ارتباط دارند، توسط روش جنگل تصادفي انتخاب شدند. چندين معيار مانند مساحت زير منحني مشخصه عملكرد (AUC) براي مقايسه روش جنگل تصادفي با رگرسيون لجستيك در نظر گرفته شد. با توجه به هر دو معيار، پنج متغير اثر گذار رتبه بندي شده توسط جنگل تصادفي عبارتند از: مرحله سرطان، سن تشخيص بيماري، سن بيمار، مكانيسم فرار از سلول ايمني و درجه تمايز يافتگي تومور. از نظر معيارهاي مختلف، روش جنگل تصادفي عملكرد بهتري نسبت به رگرسيون لجستيك داشت (مساحت زير منحني ROC به ترتيب براي روش جنگل تصادفي و رگرسيون لجستيك برابر با 98%، %80 ). نتيجه‌گيري: متغيرهاي سن تشخيص، مرحله سرطان، سن بيمار، مكانيسم فرار از سلول ايمني و درجه تمايز يافتگي تومور به عنوان مهمترين عوامل موثر بر مرگ ومير در سرطان كولوركتال به حساب مي‌آيند كه با تشخيص زودرس سرطان با برنامه هاي بيماريابي و غربالگري مي‌توان بر طول عمر بيماران افزود.
چكيده لاتين :
Background and Objectives: The purpose of this study was to predict the mortality rate of colorectal cancer in Iranian patients and determine the effective factors on the mortality of patients with colorectal cancer using random forest and logistic regression methods. Methods: Data from 304 patients with colorectal cancer registry from the Gastroenterology and Liver Research Center of Shahid Beheshti University of Medical Sciences during the years 2009 to 2014 were used as a retrospective study. Data analysis was performed using random forest and logistic regression methods. To analyze the data, R software version 3.4.3 was considered. Results: Ten important variables related to colorectal cancer deaths were selected by random forest method. Several criteria such as the area under the characteristic curve (AUC) were used to compare the random forest method with logistic regression. According to both criteria, five important variables ranked by random forest were Cancer stage, age of diagnosis, patient's age, HLA, and degree of differentiation (tumor differentiation). In terms of different criteria, the random forest method had better performance than logistic regression (Area under the ROC curve for random forest and logistic regression methods was: 98%; 80% respectively). Conclusion: Variables such as Cancer stage, age of diagnosis, patient's age, HLA, and degree of differentiation are considered as the most important factors affecting mortality in colorectal cancer, that the patients' longevity can be increased with the early diagnosis of cancer and screening programs.
سال انتشار :
1397
عنوان نشريه :
اپيدميولوژي ايران
فايل PDF :
7662080
عنوان نشريه :
اپيدميولوژي ايران
لينک به اين مدرک :
بازگشت