پديد آورندگان :
دولت خواهي، كسري دانشگاه تهران - پرديس فارابي - دانشكده مديريت و حسابداري، قم، ايران , آذر، عادل دانشگاه تربيت مدرس - دانشكده مديريت و اقتصاد - گروه مديريت صنعتي، تهران، ايران , كريمي، تورج دانشگاه تهران - پرديس فارابي - دانشكده مديريت و حسابداري - گروه مديريت صنعتي و تكنولوژي، قم، ايران , هادي زاده، محمد دانشگاه علوم پزشكي و خدمات بهداشتي درماني شهيدبهشتي- مركز تحقيقات سرطان، تهران، ايران
كليدواژه :
سرطان پستان , تحليل محتوا , روش دلفي , جنگل تصادفي , درخت تصميم , ماشينبردار پشتيبان
چكيده فارسي :
زمينه و هدف: سرطان و بهطور جزيي سرطان پستان در زمره بيماريهايي بهشمار ميروند كه در ايران پس از بيماريهاي قلبي بيشترين آمار مرگ ومير را به خود اختصاص داده است. پيشبيني صحيح سرطان پستان داراي اهميت است و وجود علايم و ويژگيهاي مختلف اين بيماري، تشخيص را براي پزشكان دشوار ميكند. هدف اين پژوهش، شناسايي عوامل موثر بر سرطان پستان و تشخيص احتمال ابتلا به سرطان پستان است.
روش بررسي: در مطالعهي حاضر، ابتدا به روش تحليل محتوا و مطالعات كتابخانهاي، عوامل تاثيرگذار در ابتلا به سرطان پستان شناسايي شده سپس با همراهي تيم خبرگان مشتمل بر پزشكان متخصص و يا داراي فوقتخصص سرطانشناسي و جراحي پستان با كمك روش دلفي، تعديل گرديده و 26 عامل نهايي كه بهصورت عددي صحيح و رشتهاي بودند براساس شرايط بومي و اقليمي تاييد شدند. در ادامه و با توجه به عوامل نهايي و براساس پرونده پزشكي 5208 بيمار در مركز تحقيقات سرطان دانشگاه علوم پزشكي و خدمات بهداشتي درماني شهيدبهشتي به منظور تشخيص ابتلا به سرطان از روشهاي درخت تصميم (Decision Tree)، جنگل تصادفي (Random Forest) و ماشينبردار پشتيبان (Support Vector Machine) بهعنوان روشهاي يادگيري ماشين بهره گرفته شد.
يافتهها: در گام نخست و با روش تحليل محتوا، 29 عامل تاثيرگذار در ابتلا به سرطان پستان شناسايي شد. در ادامه و با در نظر گرفتن شرايط بومي و اقليمي و با استفاده از روش دلفي و با بهرهگيري از نظرات 18 خبره در طي سه دوره، 26 عامل تعديل و نهايي شد. در گام نهايي و با استفاده از پرونده پزشكي مراجعهكنندگان كه در طي 3 سال گردآوري شده و معيارهاي استخراجشده از سه روش ذكر شده، جنگل تصادفي، بيشترين دقت به ميزان 94/75% و صحت 97/26% را در تشخيص ابتلا به سرطان پستان به خود اختصاص داد، كه اين ميزان در قياس با ساير پژوهشهاي مشابه كه از پايگاههاي داده بومي بهره گرفتهاند، دقتهاي بهدست آمده بسيار نزديك به كارهاي پيشين بوده و در بعضي موارد نيز دقت بهتري داشته است.
نتيجهگيري: با استفاده از روش جنگل تصادفي و با بهرهگيري از عوامل تاثيرگذار بر سرطان پستان، قابليت تشخيص ابتلا به سرطان با بيشترين دقت فراهم شده است.
چكيده لاتين :
Background and Aim: Cancer and in particular Breast cancer are among the diseases that have the highest mortality rate in Iran after heart disease. The accurate prognosis for Breast cancer is important, and the presence of various symptoms and features of this disease makes it difficult for doctors to diagnose. This study aimed to identify the factors affecting Breast cancer, modeling and ultimately diagnosing the risk of Breast cancer.
Materials and Methods: In the present study, first, by content analysis and library studies, the effective factors in Breast cancer were identified, then with the help of a team of experts consisting of physicians and subspecialists in Breast oncology and Breast surgery; With the help of the Delphi method, the factors were adjusted and 26 final factors that were numerically correct and string based on local and climatic conditions were approved. Then, according to the final factors and based on the medical records of 5208 patients in the Cancer Research Center of Shahid Beheshti University of medical sciences, to diagnose cancer, Decision Tree, Random Forest, and Support Vector Machine methods were used as machine learning methods.
Results: In the first step, by content analysis method, 29 effective factors in Breast cancer were identified. Then, taking into account the indigenous and climatic conditions and using the Delphi method and also using the opinions of 18 Experts during three years, 26 factors were finalized. In the final step, using the medical records of the patients and the results obtained from the three methods mentioned, random forest, had the highest accuracy of 94.75% and precision of 97.26% in diagnosing Breast cancer. It has been noted that, compared to other similar studies, indigenous databases have been exploited, the accuracy obtained has been very close to previous studies, and in many cases much better.
Conclusion: Using the random forest method and taking advantage of the factors affecting Breast cancer, the ability to diagnose cancer has been provided with greatest accuracy.