شماره ركورد :
1395383
عنوان مقاله :
ارائه يك الگوريتم خوشه ‌بندي مبتني بر چگالي توسعه‌ يافته در كلان ‌داده‌ها
پديد آورندگان :
قائمي ، رضا دانشگاه آزاد اسلامي واحد قوچان - گروه مهندسي كامپيوتر , آراد ، يعقوب دانشگاه آزاد اسلامي واحد علوم و تحقيقات - گروه مهندسي كامپيوتر , حاج قاضي ، فرشته دانشگاه آزاد اسلامي واحد علوم و تحقيقات - گروه مهندسي كامپيوتر
از صفحه :
21
تا صفحه :
41
كليدواژه :
كلان‌ داده‌ها , خوشه‌ بندي , K-Means , H-DBSCAN , K-DBSCAN , DBSCAN
چكيده فارسي :
امروزه توليد داده از طريق تجهيزات هوشمند، ازجمله تلفن ‌هاي همراه، با رشد چشم‌گيري روبه‌رو بوده و خوشه‌بندي يكي از تكنيك‌هاي پركاربرد كشف دانش در كلان‌داده‌ها است. خوشه‌بندي مبتني بر چگالي (DBSCAN)، از الگوريتم‌هاي خوشه‌بندي كارا در داده‌كاوي بوده و با وجود داشتن مزايا، داراي مشكلاتي ازجمله سختي در تعيين پارامترهاي ورودي و همچنين، نداشتن توانايي در كشف خوشه‌هايي با چگالي متفاوت نيز هست. در الگوريتم پيشنهادي اين مقاله، از الگوريتم K-DBSCAN در گروه‌بندي داده‌هاي حجيم با هدف كاهش زمان اجراي خوشه‌بندي الهام گرفته شده است. به‌علاوه، با استفاده از الگوريتم‌هاي K-Means و H-DBSCAN، چگالي‌هاي مختلف مجموعه‌داده تشخيص داده مي‌شود، براي هر چگالي يك شعاع Eps تعيين شده و سپس، الگوريتم پيشنهادي خوشه‌بندي مبتني بر چگالي توسعه‌يافته با پارامترهاي منطبق روي داده‌ها اعمال مي‌شود. در واقع، نوآوري اين مقاله استفاده از خوشه‌بندي K-Means و تخمين چگالي‌هاي مختلف در روش خوشه‌بندي DBSCAN است. الگوريتم پيشنهادي روي چهار مجموعه‌داده استاندارد Image segmentation، Pendigit، Letters و Shuttle control با الگوريتم خوشه‌بندي DBSCAN ساده و دو الگوريتم توسعه‌يافته K-DBSCAN و H-DBSCAN مقايسه شده است. نتايج نشان مي‌دهد كه الگوريتم پيشنهادي در زماني كه هر دو معيار زمان و دقت در خوشه‌بندي ملاك باشند، در مقايسه با الگوريتم‌هاي ديگر، الگوريتم برتري است.
عنوان نشريه :
مديريت اطلاعات
عنوان نشريه :
مديريت اطلاعات
لينک به اين مدرک :
بازگشت