شماره ركورد كنفرانس :
4848
عنوان مقاله :
چارچوب جديد براي بهبود كارايي خوشهبندي تركيبي مبتني بر استفاده از زيرمجموعهاي از خوشههاي اوليه
عنوان به زبان ديگر :
Clustering ensemble into a mathematical optimization problem and provide an approach for solving with optimization toolbox
پديدآورندگان :
همتيان مائده sadeghi366@yahoo.com دانشگاه پيام نور آغاجاري;
كليدواژه :
خوشه بندي تركيبي , پايداري خوشه , معيار فيشر , ماتريس همبستگي , الگوريتم ژنتيك
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري در مهندسي برق، كامپيوتر
چكيده فارسي :
چكيده ما در جهاني پر از داده زندگي ميكنيم. هر روزه انسانها با حجم وسيعي از اطلاعات روبهرو هستند كه بايد آنها را ذخيره سازي يا نمايش دهند. يكي از روشهاي حياتي كنترل و مديريت اين دادهها، گروه بندي و دسته بندي آنها در خوشهها ميباشد. امروزه خوشهبندي نقش حياتي در روشهاي بازيابي اطلاعات براي سازماندهي مجموعههاي بزرگ درون تعداد كمي خوشه معنادار دارد. يكي از مهمترين انگيزههاي استفاده از خوشهبندي، تعيين و آشكار كردن ساختار ذاتي و پنهان يك مجموعه داده است. كاربران انساني به علت تفاوت در سليقه و طرز تفكرات مختلف از كشف ساختار ذاتي و دروني مجموعه داده اي بزرگ متون ناتوان هستند. الگوريتم هاي خوشهبندي تركيبي چند الگوريتم خوشهبندي را باهم تركيب ميكنند تا در نهايت به يك سيستم كلي خوشهبندي برسد. روشهاي خوشهبندي تركيبي براي يافتن راههاي بهتري با استفاده از بيرون كشيدن اطلاعات از چندين افراز اوليه دادهها ميباشد. از آنجا كه الگوريتمهاي خوشهبندي مختلف به نقاط مختلف داده نگاه ميكنند، آنها ميتوانند افرازهاي مختلفي را از اين چنين دادههايي توليد كنند. با تركيب افرازهاي بدست آمده از الگوريتمهاي مختلف، ايجاد يك افراز با كارايي بالا ممكن است، حتي اگر خوشهها از هم بسيار متراكم باشند. اكثر مطالعات در اين حوزه تمامي خوشه هاي اوليه را بررسي ميكنند. در اين پايان نامه به روش جديدي مي پردازيم كه به جاي استفاده از تمامي خوشههاي اوليه توليد شده، از پايدارترين آنها استفاده كنيم. براي انتخاب خوشه هاي پايدارتر از تابع توافقي مبتني بر ماتريس همبستگي استفاده مي كنيم. روش انتخاب پايدارترين خوشهها بر اساس معيار پايداري خوشه مبتني بر معيار فيشر صورت ميگيرد و سپس خوشه هاي بدست آمده را توسط الگوريتم ژنتيك مورد ارزيابي قرار ميدهيم و طيق اين الگوريتم پايدارترين خوشه ها انتخاب ميشود. نتايج تجربي روي چندين مجموعه داده نشان مي هد كه خروجي روش پيشنهادي خوشه هاي متنوع و با پايداري بالا ميباشد. كلمات كليدي: خوشه بندي تركيبي، پايداري خوشه، معيار فيشر، ماتريس همبستگي، الگوريتم ژنتيك.