عنوان مقاله :
يك راهحل افزايشي جهت خوشهبندي محتوايي- ساختاري يك گراف
پديد آورندگان :
كشوري، سامان دانشگاه جامع امام حسين (ع)، تهران , جوادزاده، محمدعلي دانشگاه جامع امام حسين (ع)، تهران , نادري، حسن دانشگاه علم و صنعت ايران، تهران
كليدواژه :
خوشهبندي گراف , خوشهبندي ساختاري- محتوايي , گراف خصوصيت , استخراج خوشه
چكيده فارسي :
خوشهبندي گرههاي گراف از جنبه ساختاري يا محتوايي، همواره موردتوجه پژوهشگران حوزه دادهكاوي بوده است؛ اما به خوشهبندي گراف بر مبناي ساختار و محتوا بهطور تركيبي كمتر توجه شده است. با توجه به نياز خوشهبندي ساختاري-محتوايي در شبكههاي اطلاعاتي كه شبكههاي اجتماعي نمونهاي از آنهاست، در اين مقاله الگوريتم خوشهبندي ICS-Cluster ارائهشده كه هر دو جنبه ساختار و محتوا را بهصورت همزمان در نظر ميگيرد. هدف اين روش، رسيدن به خوشههايي با ساختار دروني منسجم (ساختاري) و مقادير ويژگي (محتوايي) همگن در گراف است. در اين روش ابتدا گراف اوليه به يك گراف ساختاري-محتوايي تبديل ميشود كه در آن وزن هر يال (ارتباط) بيانگر شباهت ساختاري-محتوايي دو گره (موجوديت) است. خوشهبندي با توجه به وزن يالها بهصورت افزايشي انجام ميشود بدين معنا كه گرههاي يالِ با وزن بالا بهعنوان خوشه در نظر گرفته ميشوند و وزن يالهاي متصل به خوشه با يكديگر ادغامشده و بهصورت يك يال متصل به خوشه در نظر گرفته ميشوند، اين مراحل تا زماني كه الگوريتم به تعداد خوشه موردنظر كاربر برسد، ادامه خواهد يافت. الگوريتم ICS-Cluster به هر تعداد خوشه كه مدنظر كاربر است، گراف را خوشهبندي ميكند. مقايسه الگوريتم مطرحشده با سه الگوريتم خوشهبندي ساختاري- محتوايي ارائهشده، بر اساس معيارهاي ششگانه سنجش كيفيت خوشه، بيانگر عملكرد مناسب روش ICS-Cluster است. اين معيارها معيارهاي ساختاريِ تراكم خوشه، خطاي يال و پيمانگي، معيار محتواييِ ميانگين شباهت، معيار ساختاري-محتوايي CS-Measure و زمان اجراي روشها است.
چكيده لاتين :
Researchers have always been interested in graph nodes clustering based on content or structure. But less attention has been paid to clustering based on both structure and content. But a content-structural clustering is needed in information networks like social networks. In this paper, the ICS-Cluster algorithm is proposed which takes into consideration both the structure and content aspects of the nodes. The purpose of this approach is to gain a coherent internal structure (structural aspect) and homogeneous attribute values (content aspect) in the graph. In this approach firstly the graph is converted into a content-structural graph which edges’ weight show similarity between the connected nodes. Incremental clustering is done based on edges’ weight in this process the edges with the most weight is considered as clusters then the weight of connected edge to the cluster is aggregated and they’ll be one edge, the process is repeated until the algorithm reaches the number of clusters that indicated by the user. ICS-Cluster algorithm number of cluster is indicated by the user. Comparing ICS-Cluster with other content structural algorithm based on six criteria for measuring cluster quality shows that ICS-Cluster has good performance. These criteria contain structural criteria (Modularity, Error Link, and Density), content criterion (Average Similarity), content-structural criterion (CS-Measure) and the run time
عنوان نشريه :
علوم و فناوري هاي پدافند نوين