عنوان مقاله :
بهبود عملكرد الگوريتم خوشهبندي فازي سي- مينز با وزندهي اتوماتيك و محلي ويژگيها
عنوان به زبان ديگر :
Improving Performance of Fuzzy C-means Clustering Algorithm using Automatic Local Feature Weighting
پديد آورندگان :
رفيعي، سميرا دانشگاه كردستان - دانشكده مهندسي , مرادي، پرهام دانشگاه كردستان - دانشكده مهندسي
كليدواژه :
خوشه بندي فازي سي- مينز , وزندهي محلي ويژگيها , معيار شباهت غير اقليدسي
چكيده فارسي :
خوشهبندي يكي از راهكارهاي مهم در تحليل دادههاست. در راهكارهاي كلاسيكِ خوشهبندي معمولاً فرض بر اين است كه همه ويژگيها از درجه اهميت يكساني برخوردارند. اين در حالي است كه در مجموعه دادههاي واقعي يك سري از ويژگيها اهميت بيشتري نسبت به ديگر ويژگيها دارند. در نتيجه ويژگيهاي مهم تأثير بيشتري در شناسايي خوشههاي بهينه نسبت به ساير ويژگيها خواهند داشت. در اين مقاله، يك الگوريتم خوشهبندي فازي با وزندهي اتوماتيك محلي ارائه شده است. الگوريتم پيشنهادي داراي سه مزيت اصلي است. مزيت اول اين است كه وزندهي ويژگيها را بهصورت محلي انجام ميدهد بهطوري كه وزن ويژگيها در يك خوشه نسبت به خوشه ديگر متفاوت است. مزيت دوم، استفاده از يك معيار شباهت غير اقليدسي براي بهدستآوردن فاصله بين نمونهها بهمنظور كاهش حساسيت الگوريتم نسبت به نويز است. مزيت سوم اين است كه وزن ويژگيها بهصورت تطبيقي و در طول فرآيند يادگيري بهدست ميآيد. در اين مقاله تحليلهاي رياضي براي بهدستآوردن توابع بهروزرساني مراكز خوشهها و وزنهاي ويژگيها ارائه شده است. همچنين تحليلهاي رياضي جهت اثبات همگرايي الگوريتم نيز ارائه شده است. آزمايشهاي انجام گرفته بر روي يك مجموعه داده مصنوعي و پنج مجموعه داده واقعي نشاندهنده كارايي بالاي الگوريتم پيشنهادي در مقايسه با ديگر الگوريتمهاي پيشنهادي با وزندهي سراسري و محلي ويژگيها است.
چكيده لاتين :
Clustering is one of the most widely used methods in data analysis. In the classical clustering methods it is assumed that all the features of the samples in a given data set make equal contribution when constructing the optimal clusters. However، in real- world datasets، some of the features can exhibit higher relevance than others. Thus، the features with higher relevance are more important to form optimal result than those with lower relevance. To address this issue، in this paper we proposed a feature weighted fuzzy clustering method called RLWFCM. The proposed algorithm has three main advantages. The first advantage is that our method assigns different weights to each feature in each cluster. This is due to the fact that each feature may have different importance in different clusters. The second advantage is using a specific kernelized distance to reduce the noise-sensitivity of the algorithm. The third one is using an analytical method for adapting feature weights during training process. Moreover، in this paper the mathematical analysis to proof the convergence of the algorithm has been presented. Several experiments were performed on an artificial dataset and also five real world datasets and the results show that the proposed method outperformed the other feature weighted clustering methods.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز