شماره ركورد كنفرانس :
5530
عنوان مقاله :
تنظيم مستقيم ماشين بردار پشتيبان براي دستهبندي مجموعه دادههاي نامتوازن
پديدآورندگان :
مفتاحي سعيد meftahi9860583@shirazu.ac.ir دانشگاه شيراز , طاهري محمد motaheri@shirazu.ac.ir دانشگاه شيراز , حمزه علي ali@cse.shirazu.ac.ir دانشگاه شيراز
كليدواژه :
دستهبند كارا , ضريب تنظيم , ماشين بردار پشتيبان , دادههاي نامتوازن
عنوان كنفرانس :
بيستمين سمپوزيوم بينالمللي هوش مصنوعي و پردازش سيگنال
چكيده فارسي :
چكيده - يكي از چالشهاي مهم در زمينه دادهكاوي مسئله دستهبندي مجموعه دادههاي نامتوازن است. به گونهاي كه تعداد نمونههاي يك كلاس از باقي كلاسها كمتر است. همچنين يكي از مدلهاي دستهبندي، ماشينهاي بردار پشتيبان است كه به دليل رويكرد پهن حاشيه و تعميمپذيري مناسبي كه دارد از محبوبيت بالايي برخوردار است. در واقع اين الگوريتم صحت عملكرد (Accuracy) را در كنار خطاي ساختاري مدل بهينه ميكند كه در دادههاي نامتوازن، منجر به تضعيف دستهبندي دادههاي اقليت ميشود. يكي از شيوههاي مقابله با عدم توازن بهينه كردن معياري مانند F-Measure است كه متناسب با شرايط عدم توازن طراحي شده است. از سوي ديگر خروجي مدل بردار پشتيبان بسيار وابسته به يك ضريب است كه وظيفه تنظيم بين خطاي تجربي و ساختاري را به عهده دارد. در اين مقاله با بررسي مدل در تمام مسير تنظيم، مقدار اين ضريب مستقيماً به گونههايي تعيين ميشود كه عملكرد نهايي از منظر F-Measure روي دادههاي اعتبارسنجي بيشينه شود. پيچيدگي محاسباتي مدل نهايي به دست آمده از نتايج مطلوبي در مقايسه با روشهاي پايه روي تعدادي از مجموعه دادههاي نامتوازن برخوردار است.