شماره ركورد :
1126437
عنوان مقاله :
بازيابي و رتبه‌بندي افراد خبره با استفاده از مدل ترجمه مبتني‌بر خوشه‌بندي
عنوان به زبان ديگر :
Retrieve and Rank the Experts Using a Cluster-based Translation Model
پديد آورندگان :
دهقان، مهدي دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر، تهران , آبين، احمدعلي دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر، تهران
تعداد صفحه :
12
از صفحه :
1095
تا صفحه :
1106
كليدواژه :
بازيابي افراد خبره , مدل ترجمه‌ , خوشه‌بندي , مدل‌سازي موضوعي , فاصله‌ي واژگاني , سيستم‌هاي پاسخ به پرسش
چكيده فارسي :
استخراج دانش از ميان داده‌هاي موجود در وب باتوجه‌‌ ‌به حجم و تنوع بالاي آن به يك چالش در حوزه‌ي بازيابي اطلاعات تبديل شده‌است. در اين ميان، مسأله‌ي بازيابي و رتبه‌بندي افراد خبره با هدف بازيابي و رتبه‌بندي افراد خبره در زمينه‌ي موضوع پرس‌وجوي كاربر، به‌عنوان يكي از مهم‌ترين مسائل موجود در اين حوزه توجه بسياري از پژوهشگران را به خود جلب نموده‌است. مهم‌ترين چالش در مسئله‌ي بازيابي افراد خبره تشخيص ميزان ارتباط بين كلمات پرس‌وجو و سند‌هاي نوشته‌شده توسط ‌نامزد‌هاي خبرگي است. يك مشكل اساسي در اين حوزه فاصله‌ي واژگاني ميان كلمات پرس‌وجو و سند‌هاي نامزد‌هاي خبرگي است. در اين مقاله دو مدل ترجمه‌‌ي جديد براي مدل‌سازي فاصله‌ي واژگاني ارائه شده‌است. مدل اول يك مدل احتمالاتي مبتني‌بر خوشه‌بندي و مدل دوم مبتني‌بر مدل‌سازي موضوعي است. در هر دو مدل، كلمات پرس‌وجو به مجموعه‌اي از كلمات مرتبط با پرس‌وجو كه بيشتر نشان‌دهنده‌ي يك زمينه‌ي خبرگي هستند ترجمه شده‌است. پس از ترجمه‌ي كلمات، از يك مدل تركيب‌ كننده‌ به‌منظور بازيابي استفاده شده‌است. مدل‌هاي ارائه‌شده بر‌روي مجموعه‌ي آزمون Stack Overflow ارزيابي و تحليل شده‌است. نتايج به‌دست‌آمده بيانگر افزايش ميانگين متوسط دقت روش ارائه‌شده در مقايسه با ساير روش‌هاي بازيابي افراد خبره است.
چكيده لاتين :
With respect to the increasing volume and variety of information available on the Web, it is very difficult to find the required knowledge through the massive amount of data. Question-answering systems have been created to make easy knowledge accessing through massive amounts of data. The most important factor in the issue of expert finding is the ability to detect the relationship between query words and documents written by the candidate experts. A challenging issue in this area is the vocabulary gap between query words and the documents of the candidate experts. In this paper, two new translation models are proposed to solve the problem of the vocabulary gap. First model, a cluster-based probabilistic model, and another is based on topic modeling. In these models, the query words are translated into a collection of query-related words, which are written in documents written by more candidate experts. Then, using these words and using a simple composite model, we have retrieved the experts. The proposed models are implemented and evaluated on the Stackoverflow test set and finally, we have analyzed the outputs. The results indicate an increase in the Mean Average Precision of the proposed method compared with other methods of expert finding.
سال انتشار :
1398
عنوان نشريه :
مهندسي برق دانشگاه تبريز
فايل PDF :
7823009
لينک به اين مدرک :
بازگشت