عنوان مقاله :
خوشه بندي داده هاي جريان داده داراي برچسب
پديد آورندگان :
بيات، زهرا دانشگاه تهران - دانشكده رياضي، آمار و علوم كامپيوتر - پرديس علوم , ساجدي، هديه دانشگاه تهران - دانشكده رياضي، آمار و علوم كامپيوتر - پرديس علوم
كليدواژه :
توده جريان داده , جريان داده , خوشه بندي , خوشه بندي نظارت شده
چكيده فارسي :
امروزه مسئله پيداكردن الگوريتم هاي خوشه بندي نظارت شده براي داده هاي پويا و جريان داده اهميت زيادي دارد. محققان سعي مي كنند براي حل كردن اين مسئله الگوريتم هاي جديد ارائه نمايند و يا الگوريتم هاي موجود را بهبود دهند. در ميان اين الگوريتم ها، روش SAIC براي خوشه بندي داده هاي پويا با خوشه هاي با اندازه و شكل دلخواه ارائه شده است. در اين روش، تعداد خوشه ها به طور خودكار توسط الگوريتم مشخص مي شود اما اين الگوريتم قادر به تشخيص صحيح خوشه هاي مسائل تك دسته اي نيست. اين امر موجب مي شود كه بعضا در خوشه بندي جريان داده اختلال ايجاد شود. در اين مقاله ضمن توضيح علت ايجاد اين مشكل، الگوريتمISAIC براي بهبود الگوريتم SAIC پيشنهاد مي شود. همچنين عملكرد الگوريتم ISAIC با الگوريتم SAIC روي چند مجموعه داده مورد مقايسه قرار گرفته و نتايج ارايه شده است. ميزان بهبود دقت دسته بندي بر روي مجموعه داده هاي مورد آزمايش حداقل صفر و حداكثر حدود 65% است.
عنوان نشريه :
علوم رايانشي
عنوان نشريه :
علوم رايانشي