شماره ركورد كنفرانس :
5421
عنوان مقاله :
مقايسه روش هاي يادگيري ماشين در تحليل داده هاي نامتوازن
پديدآورندگان :
نبيان جواد j.nabiyan@gmail.com دانشگاه آزاد اسلامي واحد نجف آباد , رستگاري حميد rastegari@iaun.ac.ir دانشگاه آزاد اسلامي واحد نجف آباد
تعداد صفحه :
8
كليدواژه :
داده هاي متوازن , داده هاي نامتوازن , طبقه بندي , يادگيري ماشين
سال انتشار :
1402
عنوان كنفرانس :
اولين كنفرانس بين المللي و هفتمين كنفرانس ملي مهندسي برق و سيستم‌هاي هوشمند
زبان مدرك :
فارسي
چكيده فارسي :
چكيده: داده ها نامتوازن، داده هايي هستند كه توزيع كلاس ها در مجموعه داده ها يكنواخت نيست. به دليل اين كه فراواني برخي از كلاس ها پايين است ممكن است در روش هاي طبقه بندي جزء داده هاي پرت شناخته شود. اين مطالعه به بررسي تكنيك هاي مديريت داده هاي نامتوازن و همچنين تاثير آن بر ميزان صحت در طبقه بندي مي پردازد. در اين مطالعه از چندين الگوريتم يادگيري ماشين نظير(جنگل تصادفي، درخت تصميم، ماشين بردار پشتيبان، نزديكترين همسايه، تقويت گراديان درخت تصميم تصادفي)استفاده شده است و برخورد اين الگوريتم ها با داده هاي نامتوازن و متوازن مورد بررسي و آزمايش قرار گرفته است، همچنين لازم به ذكر است داده ها با دو روش بيش نمونه گيري و كم نمونه گيري متوازن شده اند و هر بار بصورت جداگانه به الگوريتم هاي يادگيري ماشين داده شده است و صحت الگوريتم ها و ميزان F1-Score مورد سنجش قرارگرفته است. علاوه برصحت الگوريتم در مواجه با داده هاي متوازن و نامتوازن دو روش متوازن كردن داده ها يعني بيش نمونه گيري و كم نمونه گيري هم مورد ارزيابي قرارگرفته است، در نهايت الگوريتم جنگل تصادفي بالاترين صحت را براي داده هاي متوازن و نامتوازن بدست آورد، و همچنين متوازن كردن داده ها با روش بيش نمونه گيري تاثير بالاتري در صحت نهايي الگوريتم را نشان مي دهد. نتيجه نهايي اين مطالعه را مي توانيد در قسمت ارزيابي و نتايج مشاهده نماييد.
كشور :
ايران
لينک به اين مدرک :
بازگشت