شماره ركورد كنفرانس :
4090
عنوان مقاله :
بهبود دقت ردهبندهاي تشخيص تقلب روي مجموعه داده نامتوازن بيمه با استفاده از نمونهبرداري تركيبي
پديدآورندگان :
ربطي مينا سادات كارشناس ارشد مهندسي كامپيوتر نرم افزار، دانشگاه آزاد واحد علوم تحقيقات
كليدواژه :
تشخيص تقلب در بيمه , داده نامتوازن , تشخيص داده پرت , ماشين بردار پشتيبان ازدحام ذرات , تحليل مولفههاي اصلي
عنوان كنفرانس :
اولين كنفرانس ملي كاربردسازي هوش تجاري (راهكارها و چالش ها)
چكيده فارسي :
در سالهاي اخير با افزايش حجم اطلاعات، استفاده از سيستمهاي هوشمند مانند دادهكاوي جهت يافتن الگوهاي پنهان تقلب در حجم وسيعي از دادهها، بيشازپيش مورد توجه قرارگرفته است. از طرفي در بيشتر پروندههاي خسارت بيمه، موارد تقلب درصد كمتري نسبت به موارد قانوني دارند؛ و پايگاه داده مدلهاي كشف تقلب مانند اين پژوهش، نامتوازن است. ازاينرو در اين تحقيق هدف، ساخت يك سيستم كشف تقلب روي مجموعه داده به شدت نامتوازن بيمه خودرو و افزايش نرخ دقت درست كلاس اقليت (تقلب) است كه اهميت بيشتري دارد.
در روش پيشنهادي فوق به دليل بالابودن نرخ پرتي كلاس اكثريت، از دو تكنيك كانزديكترين همسايه و عامل پرت محلي جهت توازن و حذف داده پرت استفاده شد؛ و در ادامه جهت كاهش ابعاد، روش آماري تحليل مولفه هاي اصلي مورد استفاده قرار گرفت. سپس داده ها با رده بندهاي مختلف مدلسازي شد؛ و در مقايسه، ردهبند ماشين بردار پشتيبان كه از ازدحام ذرات جهت بهينهسازي پارامترها استفاده ميكند، با دقت 94.26% بهبود خوبي در معيار دقت كلاس مثبت داشت. اين تحقيق لزوم استفاده از روشهاي مؤثر كاهش ابعاد در ميان متغيرهاي نامتوازن اين مجموعه داده را به اثبات رساند. همچنين تنظيم پارامترهاي بردار پشتيبان با ازدحام ذرات، تاثير بسزايي درافزايش دقت ردهبندي داشت.