پديد آورندگان :
حيدري، سلبي نويسنده دانشگاه علوم پزشكي قم Heydari, S , سعيديفر، ابوالفضل نويسنده دانشگاه آزاد اسلامي، واحد اراك Saeedifar, A
كليدواژه :
Algorithms K-means , DATA MINING , decision trees , Infertility , الگوريتم K-Means , داده كاوي , درخت تصميم , ناباروري
چكيده فارسي :
زمينه و هدف: با توجه به جمعآوري حجم بالاي دادهها در مراكز درماني و استفاده مناسب از آنها جهت كشف و تشخيص بيماري، نياز به علم و ابزاري كه روي اين دادهها تحليل انجام دهد، لازم و ضروري است. در اين مطالعه تشخيص ناباروري به كمك تكنيكهاي داده كاوي مورد بررسي قرار گرفت.
روش بررسي: در اين مطالعه اطلاعات از ميان پروندههاي مراجعهكنندگان مركز درمان ناباروري جهاد دانشگاهي قم استخراج و 700 نمونه از ميان 14242 پرونده موجود در 15 سال انتخاب شد و از متغيرهاي سن، مدت ناباروري، نسبت خانوادگي، سابقه ناباروري خانوادگي، شغل مرد، نوع سيكل قاعدگي زن، هيرسوتيسم، گالاكتوره، آمنوره، نوع ناباروري، شاخص توده بدني زن، مصرف دخانيات و آزمايشهاي اسپرم مرد استفاده شد. جهت پيشبيني از الگوريتمهاي C5.0، C&R tree، CHAID و خوشهبندي از الگوريتم K-means و براي تعيين تعداد خوشه بهينه از شاخص ديويس - بولدين استفاده گرديد.
يافتهها: با توجه به مدل مورد قبول الگوريتم CHAID كه خطاي كمتري دارد، مهمترين عوامل تاثيرگذار در ناباروري به ترتيب شاخص توده بدني زن، سن زن، بيماري هيرسوتيسم، ناباروري خانوادگي، بيماري گالاكتوره، مقدار اسپرم مرد در هر ميليليتر، مدت ناباروري، سن مرد و نسبت فاميلي زوجين بود. طبق اين مدل، عوامل زنانه مهمتر از عوامل مردانه شناسايي شد.
نتيجهگيري: در نتايج اين پژوهش، تاثير بيشتر عوامل زنانه در ناباروري پيشبيني شده است.
چكيده لاتين :
Background and Objectives: According to wide mass data collection at medical centers and proper use of it in order to diagnosis of a malady needs to relevant tools and medical science for data analyzing. Infertility diagnosis studied by data mining techniques.
Methods: All information had been extract from patientʹs documents of ACECR Center for Infertility Treatment, Qom Branch; 700 sample were selected among 14,242 cases in 15 years of age, duration of infertility, family connections, infertility, family, job, male, female menstrual cycle type, hirsutism, galactorrhea, amenorrhea, cause of infertility, female body mass index, smoking and semen tests were used. The prediction algorithms C5.0, C & R tree, CHAID and K-means clustering algorithm to determine the optimal number of clusters Davis - Buldian used.
Results: According to the accepted model, the error is less CHAID algorithm, the most important factor in infertility in the female body mass index, age, disease, hirsutism, infertility, family, illness, galactorrhea, the amount of sperm per milliliter, duration of infertility, old man, were consanguineous couples. According to this model, most of the menʹs wear agents were identified.
Conclusion: In this study, the effect of female infertility factors predicted.