عنوان مقاله :
استخراج ويژگيهاي متني و معنايي در يادگيري رتبه بندي جهت بازيابي اسناد وب
پديد آورندگان :
محجوب ، محدثه دانشگاه فردوسي مشهد - دانشكده مهندسي - گروه كامپيوتر , انسان ، فائزه دانشگاه فردوسي مشهد - دانشكده مهندسي , كشوري ، ساناز دانشگاه فردوسي مشهد - دانشكده مهندسي - گروه كامپيوتر , جعفرزاده ، پرستو دانشگاه رايرسون - گروه مهندسي برق كامپيوتر و بيومديكال , كيوان زاد ، محمد امين دانشگاه نيوبرانزويك
كليدواژه :
يادگيري رتبه بندي , ويژگيهاي معنايي , بازيابي اسناد وب , دادههاي پيوندي
چكيده فارسي :
با ظهور وب معنايي، تعريف و استفاده از ويژگيهاي معنايي در الگوريتمهاي يادگيري رتبه بندي هم مطرح شده است. يك چالش مهم در اين زمينه عدم استفاده از ويژگيهاي جامع و همچنين، عدم تركيب كامل از ويژگيهاي متني و معنايي است. در اين مقاله، با تعريف ويژگيهاي معنايي جديد در چهار دسته ويژگيهاي مبتني بر گراف و پايگاه دانش، ويژگيهاي مبتني بر تكرار موجوديت، ويژگيهاي مبتني بر فيلدهاي متني، و ويژگيهاي مبتني بر نمايش برداري كلمات و متون به اين چالش پاسخ داده شده است. جهت ارزيابي از مجموعه داده MQ-2007 متعلق به LETOR4، كه حاوي ويژگيهاي متني آماده است، و شش الگوريتم يادگيري رتبه بندي استاندارد استفاده شده است. نتايج تجربي نشان ميدهد كه ويژگيهاي معنايي و نيز تركيب آنها با ويژگيهاي متني باعث بهبود 50 درصدي نسبت به استفاده از تنها ويژگيهاي متني ميشوند. در انتها، از يك الگوريتم انتخاب ويژگي براي انتخاب بهترين ويژگيهاي معنايي استفاده شده كه منجر به بهبود 7 درصدي نسبت به الگوريتمهاي رتبه بندي بدون انتخاب ويژگي شده است.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات