شماره ركورد :
1008414
عنوان مقاله :
بهبود عملكرد الگوريتم خوشه‌بندي فازي سي- مينز با وزن‌دهي اتوماتيك و محلي ويژگي‌ها
عنوان به زبان ديگر :
Improving Performance of Fuzzy C-means Clustering Algorithm using Automatic Local Feature Weighting
پديد آورندگان :
رفيعي، سميرا دانشگاه كردستان - دانشكده مهندسي , مرادي، پرهام دانشگاه كردستان - دانشكده مهندسي
تعداد صفحه :
12
از صفحه :
75
تا صفحه :
86
كليدواژه :
خوشه‌ بندي فازي سي- مينز , وزن‌دهي محلي ويژگي‌ها , معيار شباهت غير اقليدسي
چكيده فارسي :
خوشه‌بندي يكي از راه‌كارهاي مهم در تحليل داده‌هاست. در راه‌كارهاي كلاسيكِ خوشه‌بندي معمولاً فرض بر اين است كه همه ويژگي‌ها از درجه اهميت يكساني برخوردارند. اين در حالي است كه در مجموعه داده‌هاي واقعي يك سري از ويژگي‌ها اهميت بيش‌تري نسبت به ديگر ويژگي‌ها دارند. در نتيجه ويژگي‌هاي مهم تأثير بيش‌تري در شناسايي خوشه‌هاي بهينه نسبت به ساير ويژگي‌ها خواهند داشت. در اين مقاله، يك الگوريتم خوشه‌بندي فازي با وزن‌دهي اتوماتيك محلي ارائه شده است. الگوريتم پيشنهادي داراي سه مزيت اصلي است. مزيت اول اين است كه وزن‌دهي ويژگي‌ها را به‌صورت محلي انجام مي‌دهد به‌طوري كه وزن ويژگي‌ها در يك خوشه نسبت به خوشه ديگر متفاوت است. مزيت دوم، استفاده از يك معيار شباهت غير اقليدسي براي به‌دست‌آوردن فاصله بين نمونه‌ها به‌منظور كاهش حساسيت الگوريتم نسبت به نويز است. مزيت سوم اين است كه وزن ويژگي‌ها به‌صورت تطبيقي و در طول فرآيند يادگيري به‌دست مي‌آيد. در اين مقاله تحليل‌هاي رياضي براي به‌دست‌آوردن توابع به‌روزرساني مراكز خوشه‌ها و وزن‌هاي ويژگي‌ها ارائه شده است. هم‌چنين تحليل‌هاي رياضي جهت اثبات هم‌گرايي الگوريتم نيز ارائه شده است. آزمايش‌هاي انجام گرفته بر روي يك مجموعه داده مصنوعي و پنج مجموعه داده واقعي نشان‌دهنده كارايي بالاي الگوريتم پيشنهادي در مقايسه با ديگر الگوريتم‌هاي پيشنهادي با وزن‌دهي سراسري و محلي ويژگي‌ها است.
چكيده لاتين :
Clustering is one of the most widely used methods in data analysis. In the classical clustering methods it is assumed that all the features of the samples in a given data set make equal contribution when constructing the optimal clusters. However، in real- world datasets، some of the features can exhibit higher relevance than others. Thus، the features with higher relevance are more important to form optimal result than those with lower relevance. To address this issue، in this paper we proposed a feature weighted fuzzy clustering method called RLWFCM. The proposed algorithm has three main advantages. The first advantage is that our method assigns different weights to each feature in each cluster. This is due to the fact that each feature may have different importance in different clusters. The second advantage is using a specific kernelized distance to reduce the noise-sensitivity of the algorithm. The third one is using an analytical method for adapting feature weights during training process. Moreover، in this paper the mathematical analysis to proof the convergence of the algorithm has been presented. Several experiments were performed on an artificial dataset and also five real world datasets and the results show that the proposed method outperformed the other feature weighted clustering methods.
سال انتشار :
1395
عنوان نشريه :
مهندسي برق دانشگاه تبريز
فايل PDF :
7447364
عنوان نشريه :
مهندسي برق دانشگاه تبريز
لينک به اين مدرک :
بازگشت