شماره ركورد كنفرانس :
4848
عنوان مقاله :
مروري بر الگوريتم هاي حذف داده هاي پَرت و تقويت دادهها در الگوريتم هاي داده كاوي
عنوان به زبان ديگر :
An Overview Of Data Deletion Algorithms And Strengthen Data In Data Mining Algorithms
پديدآورندگان :
رحيمي فر زهرا zahrarf65@gmail.com دانشگاه پيام نور;
كليدواژه :
دسته بندي , داده پرت , كلاسه بندي , خوشه بندي , الگوريتم هاي فرا ابتكاري
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري در مهندسي برق، كامپيوتر
چكيده فارسي :
يكي از مهمترين اهداف مدلهاي دستهبندي، افزايش درصد كارايي در كنار كاهش ميزان خطا در نمونههاي موجود هست. بروز مشكلاتي در ديتاست هاي آموزشي همانند وجود داده هاي تكراري و البته نمونههايي كه از آن بهعنوان داده هاي پَرت ياد ميگردد، ميتواند منجر به تشكيل گروهي به نام رده هاي نامتوازن شود. اين گروه كه اعضاي تشكيلدهنده آن در كلاس هاي اقليت، دستهبندي ميگردند، داراي ميزان خطاي دسته بالايي ميباشند تا آنجا كه كارايي مدل را بهشدت كاهش خواهند داد. تاكنون روش هاي متفاوتي براي از بين بردن مشكل فوق در فاز پيشپردازشي دادهها ارائه گرديده است؛ اما مشكل درست زماني به وجود ميآيد كه داده هاي كم تكرار در ديتاست، بهعنوان نمونههاي پَرت در نظر گرفته نشده و با آنها درست مثل داده هاي عادي برخورد گردد. براي غلبه بر مشكل فوق، فرا الگوريتم آدابوست ارائه گرديده است كه ميتواند با در نظر داشتن يك٬ فرضيه، ميزان خطاي كلاسه بندهاي موجود را محاسبه نموده و به هر يك٬بر اساس عملكردشان يك٬ ضريب تقويت اختصاص دهد. اين ضرايب به حدي بر روي يك٬ مجموعه دادهاي تأثير ميگذارند كه پس از گذشت چندين دور از الگوريتم، يك٬ تركيب خطي از كلاسه بندهاي ضعيف بهعنوان خروجي نهايي معرفي گرديده و ميزان خطاي آن را به طرز چشمگيري كاهش ميدهد. اين روش، مشكلاتي نظير عدم حساسيت به نويز را دارا هست كه مدلهاي متفاوتي براي غلبه بر آن ارائه گرديده است.