شماره ركورد كنفرانس :
4090
عنوان مقاله :
بهبود دقت رده‌بندهاي تشخيص تقلب روي مجموعه داده نامتوازن بيمه با استفاده از نمونه‌برداري تركيبي
پديدآورندگان :
ربطي مينا سادات كارشناس ارشد مهندسي كامپيوتر نرم افزار، دانشگاه آزاد واحد علوم تحقيقات
تعداد صفحه :
11
كليدواژه :
تشخيص تقلب در بيمه , داده نامتوازن , تشخيص داده پرت , ماشين بردار پشتيبان ازدحام ذرات , تحليل مولفه‌هاي اصلي
سال انتشار :
1396
عنوان كنفرانس :
اولين كنفرانس ملي كاربردسازي هوش تجاري (راهكارها و چالش ها)
زبان مدرك :
فارسي
چكيده فارسي :
در سال‌هاي اخير با افزايش حجم اطلاعات، استفاده از سيستم‌هاي هوشمند مانند داده‌كاوي جهت يافتن الگوهاي پنهان تقلب در حجم وسيعي از داده‌ها، بيش‌ازپيش مورد توجه قرارگرفته است. از طرفي در بيشتر پرونده‌هاي خسارت بيمه، موارد تقلب درصد كمتري نسبت به موارد قانوني دارند؛ و پايگاه داده مدل‌هاي كشف تقلب مانند اين پژوهش، نامتوازن است. ازاين‌رو در اين تحقيق هدف، ساخت يك سيستم كشف تقلب روي مجموعه داده به شدت نامتوازن بيمه خودرو و افزايش نرخ دقت درست كلاس اقليت (تقلب) است كه اهميت بيشتري دارد. در روش پيشنهادي فوق به دليل بالابودن نرخ پرتي كلاس اكثريت، از دو تكنيك كانزديكترين همسايه و عامل پرت محلي جهت توازن و حذف داده پرت استفاده شد؛ و در ادامه جهت كاهش ابعاد، روش آماري تحليل مولفه هاي اصلي مورد استفاده قرار گرفت. سپس داده ها با رده بندهاي مختلف مدلسازي شد؛ و در مقايسه، رده‌بند ماشين بردار پشتيبان كه از ازدحام ذرات جهت بهينه‌سازي پارامترها استفاده مي‌كند، با دقت 94.26% بهبود خوبي در معيار دقت كلاس مثبت داشت. اين تحقيق لزوم استفاده از روش‌هاي مؤثر كاهش ابعاد در ميان متغيرهاي نامتوازن اين مجموعه داده را به اثبات رساند. هم‌چنين تنظيم پارامترهاي بردار پشتيبان با ازدحام ذرات، تاثير بسزايي درافزايش دقت رده‌بندي داشت.
كشور :
ايران
لينک به اين مدرک :
بازگشت