عنوان مقاله :
ارائه يك الگوريتم خوشه بندي مبتني بر چگالي توسعه يافته در كلان دادهها
پديد آورندگان :
قائمي ، رضا دانشگاه آزاد اسلامي واحد قوچان - گروه مهندسي كامپيوتر , آراد ، يعقوب دانشگاه آزاد اسلامي واحد علوم و تحقيقات - گروه مهندسي كامپيوتر , حاج قاضي ، فرشته دانشگاه آزاد اسلامي واحد علوم و تحقيقات - گروه مهندسي كامپيوتر
كليدواژه :
كلان دادهها , خوشه بندي , K-Means , H-DBSCAN , K-DBSCAN , DBSCAN
چكيده فارسي :
امروزه توليد داده از طريق تجهيزات هوشمند، ازجمله تلفن هاي همراه، با رشد چشمگيري روبهرو بوده و خوشهبندي يكي از تكنيكهاي پركاربرد كشف دانش در كلاندادهها است. خوشهبندي مبتني بر چگالي (DBSCAN)، از الگوريتمهاي خوشهبندي كارا در دادهكاوي بوده و با وجود داشتن مزايا، داراي مشكلاتي ازجمله سختي در تعيين پارامترهاي ورودي و همچنين، نداشتن توانايي در كشف خوشههايي با چگالي متفاوت نيز هست. در الگوريتم پيشنهادي اين مقاله، از الگوريتم K-DBSCAN در گروهبندي دادههاي حجيم با هدف كاهش زمان اجراي خوشهبندي الهام گرفته شده است. بهعلاوه، با استفاده از الگوريتمهاي K-Means و H-DBSCAN، چگاليهاي مختلف مجموعهداده تشخيص داده ميشود، براي هر چگالي يك شعاع Eps تعيين شده و سپس، الگوريتم پيشنهادي خوشهبندي مبتني بر چگالي توسعهيافته با پارامترهاي منطبق روي دادهها اعمال ميشود. در واقع، نوآوري اين مقاله استفاده از خوشهبندي K-Means و تخمين چگاليهاي مختلف در روش خوشهبندي DBSCAN است. الگوريتم پيشنهادي روي چهار مجموعهداده استاندارد Image segmentation، Pendigit، Letters و Shuttle control با الگوريتم خوشهبندي DBSCAN ساده و دو الگوريتم توسعهيافته K-DBSCAN و H-DBSCAN مقايسه شده است. نتايج نشان ميدهد كه الگوريتم پيشنهادي در زماني كه هر دو معيار زمان و دقت در خوشهبندي ملاك باشند، در مقايسه با الگوريتمهاي ديگر، الگوريتم برتري است.
عنوان نشريه :
مديريت اطلاعات
عنوان نشريه :
مديريت اطلاعات