شماره ركورد كنفرانس :
5509
عنوان مقاله :
افزايش دقت طبقه بندي در تصاوير ماموگرافي از سرطان سينه با مجموعه داده هاي نامتعادل با استفاده از روش SMOTE
پديدآورندگان :
دلشاد گنجگاه زينب zeynab.delshad2020@gmail.com دانشگاه لرستان خرم آباد , كريمي سلمان karimi.salman@lu.ac.ir دانشگاه لرستان خرم آباد
كليدواژه :
داده نامتعادل , طبقه بندي كننده , ماشين بردار پشتيبان , دادگان CBIS-DDSM.
عنوان كنفرانس :
دومين كنفرانس بين المللي و هفتمين كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي
چكيده فارسي :
در بررسي پايگاه هاي داده هاي مختلف چنين به نظر مي رسد كه اكثر اين دادگان نامتعادل هستند و تعداد نمونه هاي برخي از كلاس هاي آن ها كمتر از نمونه هاي كلاس هاي ديگر است. به طور مثال در دادههاي پزشكي، نمونههاي عادي معمولاً بسيار بيشتر از نمونههاي بيمار هستند. در آموزش طبقهبنديكننده هايي نظير ماشين بردار پشتيبان كه با استفاده از دادههاي نامتعادل آموزش داده مي شوند، نمونههاي با داده هاي بيشتر (عادي) بهتر دسته بندي مي شوند. مشكل زماني رخ مي دهد كه قصد بر دسته بندي نمونه با داده هاي كمتر (بيماري) است. اين نمونه ها معمولاً بيشتر مورد توجه هستند و از آنها داده كمتري در اختيار است لذا ممكن است در زمره كلاس هاي ديگر دسته بندي شوند. بنابراين هنگام دسته بندي، اين كلاسها از شانس انتخاب شدن پايين تري به نسبت كلاس هاي اكثريت برخوردار هستند. در اين پژوهش، قصد بر ارائه روش براي بيش نمونه گيري از كلاس اقليت در سطح تصوير و ايجاد تصاوير مصنوعي است. مجموعه داده مورد استفاده CBIS-DDSM مي باشد كه در سه كلاس ابتدايي، ابتدايي بدون بازخواني و پيشرفته دسته بندي شده است. در بين اين سه كلاس، كلاس ابتدايي بدون بازخواني كلاس اقليت مي باشد. بدليل آنكه كلاس هاي موجود در اين مجموعه داده متقارن نمي باشد، با استفاده از روش SMOTE داده در كلاس اقليت افزايش داده شد. نتايج دسته بندي كلاس اقليت با استفاده از ماشين بردار پشتيبان قبل از استفاده از SMOTE، احتمال خوش خيم بدون بازخواني را 20 درصد و بعد از استفاده از آن 70 درصد پيش بيني كرد كه رشد درصد تشخيص نشان دهنده كيفيت روش پيشنهادي است.