شماره ركورد :
741773
عنوان مقاله :
كشف الگوهاي پنهان در مجموعه داده هاي واقعي بيماران مبتلا به سرطان پستان با استفاده از تكنيك داده كاوي
عنوان فرعي :
Discovery of Hidden Patterns in Breast Cancer Patients Data Using Data Mining to Examine the Data with a Real Data Set
پديد آورندگان :
آتشي، عليرضا نويسنده كميته تحقيقات دانشجويي، دانشگاه علوم پزشكي مشهد، مشهد Atashi, Alireza , كياني، بهزاد نويسنده كميته تحقيقات دانشجويي، دانشگاه علوم پزشكي مشهد Kiani, Behzad , عباسي، ابراهيم نويسنده دانشگاه الزهرا Abbasi, E , ناظري، نجمه نويسنده گروه پژوهشي انفورماتيك سرطان، مركز تحقيقات سرطان پستان جهاد دانشگاهي، تهران Nazeri, Najmeh
اطلاعات موجودي :
فصلنامه سال 1394 شماره 28
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
6
از صفحه :
59
تا صفحه :
64
كليدواژه :
Association rules , breast cancer , DATA MINING , داده كاوي , قوانين انجمني , سرطان پستان
چكيده فارسي :
چكيده مقدمه: روند رو به رشد سرطان پستان در سال هاي اخير، لزوم اتكا به شيوه هاي مطمين و جديد را براي شناسايي و كنترل اين بيماري بيشتر آشكار مي كند. داده كاوي يكي از اين روش هاست كه از پرطرف دارترين كاربردهاي آن، كشف الگوهاي پنهان مابين داده هاي بيماران در پايگاه هاي داده بزرگ است. در اين مطالعه، پژوهشگران به بررسي و كشف الگوهاي ناشناخته در يك مجموعه داده واقعي سرطان پستان مي پردازند. روش بررسي: به دليل گمشدگي بالاي داده ها در 145 ركورد، تنها اطلاعات 665 بيمار قابل استفاده بود. در فاز پيش پردازش داده ها، مقادير تهي از طريق الگوريتم EM در نرم افزار SPSS19 تخمين زده شده است. سپس فيلدهاي پيوسته تبديل به فيلدهاي گسسته شده ، داده ها از طريق الگوريتم APRIORI تحليل و روابط پنهان بين اين داده ها كشف شده است. پس از استخراج، روابط در اختيار پزشك خبره حوزه سرطان پستان قرار گرفته تا روابط بي معني حذف گردند. يافته ها: تعداد 100 رابطه انجمني با ضريب اطمينان بالاتر از 9/0 توسط الگوريتم كشف شده است. پس از اين كه اين روابط در اختيار فرد خبره قرار گرفته، تعداد 10 رابطه از اين روابط به لحاظ باليني بامعني تشخيص و گزارش شده اند. نتيجه گيري: در اين پژوهش، تعدادي از الگوهاي كمتر شناخته شده و جالب توجه يك مجموعه داده واقعي استخراج گرديده اند. استفاده از داده كاوي بخصوص در داده هاي پزشكي با توجه به حجم بالاي داده ها و وجود روابط ناشناخته فراوان بين علل بيماري ها، مشخصات دموگرافيك بيماران و ريزفاكتورهاي خطر ابتلا به بيماري ها، مفيد است. الگوها و مدل هاي حاصل از داده كاوي، در واقع فرضيات مطالعات بعدي را مشخص مي نمايند كه انجام آنها از جمله انجام انواع RCTها مي توان اين فرضيات را رد يا اثبات نمود. واژه هاي كليدي: سرطان پستان، داده كاوي، قوانين انجمني.
چكيده لاتين :
Abstract Introduction: The growing trend of breast cancer in recent years has shown the necessity of reliance on new and safe methods to diagnose and control of this disease. Data mining, as one of the most accurate and reliable techniques, has been frequently used to diagnose or predict various cancers. Data mining is one of this techniques that a well-known applications of is "Pattern Recognition" among large patient data sets. In this paper, the researches recognize and explore the unknown patterns in a real breast cancer data set using data mining algorithms. Method: Due to excessive missing data in the collection, only data on 665 patients were available. Since the number of fields in the remaining records had null values, as one of the data preprocess and preparation phases, these values were estimated using the EM algorithm in SPSS20 software. Fields have been converted into discrete fields and finally the APRIORI algorithm has been used to analyze and explore the unknown patterns. After the rule extraction, an expert in the field of breast cancer eliminated redundant and meaningless relations. Results: 100 association rules with a confidence value of more than 0.9 explored by the APRIORI algorithm and after the clinical expert feedback, 8 clinically meaningful relations have been detected and reported. Conclusion: In this study, a number of less -known and interesting patterns have been extracted using the data mining algorithms. The use of data mining concepts, especially in medical data is very useful with considering the large volume of data and unknown relationships between causes of disease and the demographic characteristics. Due to the high number of risk factors, the use of these techniques is effective for cancer data. After pattern recognition these patterns or models provide the future study hypotheses and the next studies, for example RCTs will confirm or reject the hypotheses. Keywords: Breast Cancer- Data Mining- Association Rules.
سال انتشار :
1394
عنوان نشريه :
بيماري هاي پستان ايران
عنوان نشريه :
بيماري هاي پستان ايران
اطلاعات موجودي :
فصلنامه با شماره پیاپی 28 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت