شماره ركورد كنفرانس :
5448
عنوان مقاله :
پيش بيني بيماري ديابت با رويكرد يادگيري ماشين
عنوان به زبان ديگر :
Predicting diabetes using machine learning approach
پديدآورندگان :
نصراله پور احمد ahmad.nasrollahpour@modares.ac.ir دانشگاه تربيت مدرس , خطيبي توكتم toktam.khatibi@modares.ac.ir دانشگاه تربيت مدرس
كليدواژه :
بيماري ديابت , يادگيري ماشين , داده كاوي , الگوريتم هاي طبقه بندي , يادگيري با ناظر , انتخاب ويژگي
عنوان كنفرانس :
نهمين كنفرانس بين المللي مهندسي صنايع و سيستمها
چكيده فارسي :
يكي از بيماري هاي مزمن ديابت است، ديابت يك دسته اختلال متابوليك است كه به دليل ادامه سطوح بالاي قند خون ايجاد مي شود. اين بيماري به عنوان يكي از كشنده ترين بيماري ها در جهان شناخته مي شود. اگر پيش بيني اوليه دقيق امكان پذير باشد، شدت ديابت و عامل خطر را مي توان به ميزان قابل توجهي كاهش داد. يادگيري ماشين در نتيجه صعود آن در جامعه پزشكي و به ويژه در زمينه بيماري ها محبوبيت بيشتري پيدا كرده است. در اين تحقيق، ما مدلي را پيشنهاد ميكنيم كه ميتواند پيشبيني كند كه بيمار ديابت دارد يا ندارد. مدل ما مبتني بر دقت پيشبيني الگوريتمهاي يادگيري ماشين قدرتمند بر اساس معيارهاي مختلف مانند دقت، يادآوري و اندازهگيري F1 است.. نتايجي كه با استفاده از درختان مازاد، جنگل تصادفي، XGBoost، Adaboost به دست آورديم به ترتيب 96٪، 95٪، 94%، و92% بودند. نتايج نشان ميدهد كه الگوريتم درختان مازاد در پيشبيني ديابت در مقايسه با ساير الگوريتمها كارآمدتر است. از طرفي ديگر برترين ويژگي ها براي تشخيص بيماري ديابت معرفي شدند كه بر اساس يافته هاي اين پژوهش ميزان گلوكز در خون برترين ويژگي براي تشخيص ابتلاي افراد به بيماري ديابت است. در آخر دسته بند درختان مازاد با برترين ويژگي هاي پيشنهادي حاصل از اجراي مدل هاي مختلف به اجرا درآمد و بهترين دقت بدست آمده مربوط به ويژگي هاي پيشنهادي مدل Lasso با دقت 89% است.