شماره ركورد :
731532
عنوان مقاله :
خوشه‌بندي اسناد، مبتني بر آنتولوژي و رويكرد فازي
پديد آورندگان :
اميري ، مريم نويسنده كارشناس ارشد، دانشگاه بوعلي‌سينا، گروه كامپيوتر، همدان Amiri , Maryam , ختن‌لو، حسن نويسنده هييت علمي، دانشگاه بوعلي‌سينا، گروه كامپيوتر، همدان Khotanlou , Hassan
اطلاعات موجودي :
فصلنامه سال 1392 شماره 17
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
24
از صفحه :
73
تا صفحه :
96
كليدواژه :
Ontology , ساختار آنتولوژيكال , آنتولوژي , گراف مفهومي اسناد , ساختار سلسله مراتبي , Cal ontology structure , Conceptual graph of documents , Hierarchical Structure , Measure of similarity , معيار شباهت
چكيده فارسي :
داده كاوي، شناسايي و پردازش اطلاعات مفيد از اسناد است كه اساس آن بر مدل نمايش مفهومي اسناد، محاسبه شباهت بين اسناد و استفاده از آن‌ها در خوشه بندي و دسته بندي اسناد، بازيابي و استخراج اطلاعات استوار است. در اين مقاله روش نويني براي نمايش آنتولوژيكال و مفهومي اسناد به صورت سلسله مراتبي ارايه شده است. با توجّه به آنتولوژي دامنه مورد نظر، گراف مفهومي از سند ايجاد مي‌شود. بر اساس اين گراف آنتولوژيكال معيار شباهت متناسبي نيز ارايه شده است كه فاصله و شباهت بين اسناد را بر اساس اين نوع نمايش مشخص مي نمايد. در گام سوم سيستم استنتاج فازي با سه ورودي و يك خروجي طراحي شده است. اين سيستم بر اساس سه شباهت ورودي، مقدار شباهت نهايي را تخمين مي‌زند. در نهايت بر اساس ماتريس شباهت اسناد، الگوريتم خوشه‌بندي سلسله مراتبي پايين به بالا به منظور خوشه‌بندي اسناد اعمال مي‌شود. براي ارزيابي الگوريتم پيشنهادي، نتايج با نتايج حاصل از روش‌هاي naïve Bayes ، دو الگوريتم مبتني بر آنتولوژي و يك الگوريتم آماري مقايسه شده است. نتايج به دست آمده نشان مي‌دهند كه روش پيشنهاد شده مقادير F-measure و Accuracy را بهبود مي‌دهد. همچنين مقادير FP و Error به ميزان قابل توجّهي كاهش مي‌يابد.
چكيده لاتين :
Data mining, also known as knowledge discovery in database, is the process to discover unknown knowledge from a large amount of data. The most important steps in document clustering are how documents are represented and the measurement of similarities between them. By giving a new ontological representation and a similarity measure, this research focuses on improving the performance of text clustering. The text clustering algorithm has been investigated in three aspects: ontological representation of documents, documents similarity measure, fuzzy inference system to measuring the final similarities. Ultimately, the clustering is carried out by bottom-up hierarchical clustering. In final step, a bottom-up hierarchical clustering algorithm is used to clustering the documents according to final similarity matrix. In order to evaluate, the offered method has been compared with the results of Naïve Bayes method and ontology based algorithms. The results indicate that the proposed method improves the precision, recall, F-measure and accuracy and produces more meaningful results
سال انتشار :
1392
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران
اطلاعات موجودي :
فصلنامه با شماره پیاپی 17 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت