عنوان مقاله :
مقايسه روشهاي مدلبندي پاسخ ترتيبي از قبيل درخت تصميم، انباشت تصادفي ترتيبي و رگرسيون نسبت پيوسته جريمه شده در دادههاي با ابعاد بالا
پديد آورندگان :
تركاشوند ، زهرا دانشگاه علوم پزشكي همدان - دانشكده بهداشت - گروه آمار زيستي , محجوب ، حسين دانشگاه علوم پزشكي همدان - دانشكده بهداشت, مركز تحقيقات علوم بهداشتي - گروه آمار زيستي , سلطانيان ، عليرضا دانشگاه علوم پزشكي همدان - دانشكده بهداشت, مركز تحقيقات مدلسازي بيماريهاي غيرواگير - گروه آمار زيستي , فرهاديان ، مريم دانشگاه علوم پزشكي همدان - دانشكده بهداشت, مركز تحقيقات علوم بهداشتي - گروه آمار زيستي
كليدواژه :
پاسخ ترتيبي , روش رگرسيون نسبت پيوسته جريمه شده , روش انباشت ترتيبي , دادههاي بيان ژن
چكيده فارسي :
زمينه: در بسياري از تحقيقات در حوزههاي پزشكي و بهداشتي متغير پاسخ ماهيت ترتيبي دارد. روش هاي مرسوم مبتني بر فرض استقلال ميان متغيرهاي پيشگو و همچنين زياد بودن تعداد نمونه ها (n) در مقايسه با تعداد كووريت ها (p) هستند. لذا براي داده هاي ژنتيكي با ابعاد بالا كه در آنها p n مي باشد، استفاده از مدل هاي مرسوم امكانپذير نيست. در پژوهش حاضر از روش هاي رگرسيون نسبت پيوسته جريمه شده، درخت تصميم و انباشت ترتيبي براي پيش بيني پاسخ هاي ترتيبي استفاده خواهد شد. مواد و روشها: در مطالعه حاضر از سه ديتاست استفاده شد. مجموعه داده Bcell حاوي اطلاعات 12625 ژن در 128 بيمار كه پاسخ در چهار سطح ترتيبي قرار داشت، داده HCC مرتبط با سرطان كبد شامل 1469 ژن در 56 بيمار كه پاسخ در سه سطح ترتيبي قرار داشت و همچنين داده قلب شامل اطلاعات پنج متغير در 294 بيمار تحت آنژيوگرافي كه پاسخ در 5 سطح قرار داشت. عملكرد روش هاي مدنظر با استفاده از مجموعه داده يكسان آموزش و آزمون براساس شاخصهايي از قبيل دقت، گاما و كاپا مورد مقايسه قرار گرفت. يافتهها: در دو مجموعه داده با ابعاد بالا مدل انباشت ترتيبي از توانايي پيشبيني بالاتري برخوردار بود. در حالي كه براي مجموعه داده با ابعاد پايين مدل رگرسيون نسبت پيوسته جريمه شده عملكرد پيشبيني بهتري داشت. نتيجهگيري: انتخاب بهترين مدل پيشبيني از بين مدلهاي بكار رفته بستگي به مجموعه داده مورد استفاده دارد و براي هر مجموعه داده بايستي روشهاي مختلف را مورد بررسي قرار داد تا به بهترين مدل دست يافت.