شماره ركورد كنفرانس :
4848
عنوان مقاله :
مروري بر الگوريتم هاي حذف داده هاي پَرت و تقويت داده‌ها در الگوريتم هاي داده كاوي
عنوان به زبان ديگر :
An Overview Of Data Deletion Algorithms And Strengthen Data In Data Mining Algorithms
پديدآورندگان :
رحيمي فر زهرا zahrarf65@gmail.com دانشگاه پيام نور;
تعداد صفحه :
14
كليدواژه :
دسته بندي , داده پرت , كلاسه بندي , خوشه بندي , الگوريتم هاي فرا ابتكاري
سال انتشار :
1397
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري در مهندسي برق، كامپيوتر
زبان مدرك :
فارسي
چكيده فارسي :
يكي از مهم‌ترين اهداف مدل‌هاي دسته‌بندي، افزايش درصد كارايي در كنار كاهش ميزان خطا در نمونه‌هاي موجود هست. بروز مشكلاتي در ديتاست هاي آموزشي همانند وجود داده هاي تكراري و البته نمونه‌هايي كه از آن به‌عنوان داده هاي پَرت ياد مي‌گردد، مي‌تواند منجر به تشكيل گروهي به نام رده هاي نامتوازن شود. اين گروه كه اعضاي تشكيل‌دهنده آن در كلاس هاي اقليت، دسته‌بندي مي‌گردند، داراي ميزان خطاي دسته بالايي مي‌باشند تا آنجا كه كارايي مدل را به‌شدت كاهش خواهند داد. تاكنون روش هاي متفاوتي براي از بين بردن مشكل فوق در فاز پيش‌پردازشي داده‌ها ارائه گرديده است؛ اما مشكل درست زماني به وجود مي‌آيد كه داده هاي كم تكرار در ديتاست، به‌عنوان نمونه‌هاي پَرت در نظر گرفته نشده و با آن‌ها درست مثل داده هاي عادي برخورد گردد. براي غلبه بر مشكل فوق، فرا الگوريتم آدابوست ارائه گرديده است كه مي‌تواند با در نظر داشتن يك٬ فرضيه، ميزان خطاي كلاسه بندهاي موجود را محاسبه نموده و به هر يك٬‌بر اساس عملكردشان يك٬ ضريب تقويت اختصاص دهد. اين ضرايب به حدي بر روي يك٬ مجموعه داده‌اي تأثير مي‌گذارند كه پس از گذشت چندين دور از الگوريتم، يك٬ تركيب خطي از كلاسه بندهاي ضعيف به‌عنوان خروجي نهايي معرفي گرديده و ميزان خطاي آن را به طرز چشمگيري كاهش مي‌دهد. اين روش، مشكلاتي نظير عدم حساسيت به نويز را دارا هست كه مدل‌هاي متفاوتي براي غلبه بر آن ارائه گرديده است.
كشور :
ايران
لينک به اين مدرک :
بازگشت