شماره ركورد كنفرانس :
4270
عنوان مقاله :
خوشهبندي مبتني بر تراكم در جريان دادۀ توسعه دهنده با نويز
پديدآورندگان :
صفري صبوره sabure.safari@gmail.com دانشگاه آزاد اسلامي واحد همدان , اسماعيل پور منصور esmaeilpour@iauh.ac.ir دانشگاه آزاد اسلامي واحد همدان , شيرمحمدي محمدمهدي دانشگاه آزاد اسلامي واحد همدان
كليدواژه :
الگوريتمهاي استخراج داده , خوشهبندي مبتني بر تراكم , جريانات داده در حال گسترش
عنوان كنفرانس :
سومين همايش ملي شهر الكترونيك
چكيده فارسي :
خوشهبندي وظيفه مهمي در استخراج جريانات داده در حال توسعه است. علي رغم حافظه محدود و محدوديتهاي يك پاسي ، ماهيت جريانات داده در حال گسترش حاكي از نيازهاي زير براي خوشهبندي جريان است. فرضيه اي در خورد تعداد خوشهها، كشف خوشهها با شكل اختياري و توانايي براي كنترل outlier ها وجود ندارد. در حالي كه بسياري از الگوريتمهاي خوشهبندي براي جريانات داده مطرح شده اند، آنها راه حلي را براي تركيب اين نيازها پيشنهاد نميدند. در اين مقاله ما رويكرد جديد براي كشف خوشهها در جريان داده در حال گسترش را بيان ميكنيم. ميكرو خوشه «متراكم» (به نام core- micro-cluster) براي خلاصه كردن خوشهها با شكل اختياري معرفي شده است، اما ساختارهاي core- micro-cluster و putlier micro- cluster براي حفظ و تمايزخوشههاي بالقوه و outlierها مطرح شده اند. استراتژي جديد هرس (Pruning) بر پايه اين مفاهيم طراحي شده است، كه دقت وزنهاي و خوشهها را با حافظه محدود تضمين ميكند. مطالعه عملكرد ما در مورد تعداد مجموعه دادههاي واقعي و مصنوعي، اثر بخشي وكارايي روش ما را توضيح ميدهد.