• شماره ركورد
    1160976
  • عنوان مقاله

    يادگيري رتبه ‏بندي محتواي فارسي وب بر مبناي برنامه‏ نويسي ژنتيك چند لايه

  • پديد آورندگان

    كيهاني پور ، اميرحسين دانشگاه تهران- پرديس فارابي - دانشكده مهندسي - گروه مهندسي كامپيوتر

  • از صفحه
    45
  • تا صفحه
    70
  • كليدواژه
    يادگيري رتبه بندي , مدل برنامه نويسي ژنتيك چند لايه , ويژگي هاي كليك از گذر داده , محتواي فارسي وب , مجموعه داده dotIR
  • چكيده فارسي
    يادگيري رتبه‏بندي، يك رويكرد نو ظهور به منظور رفع چالش‏هاي موجود و بهبود عملكرد جويشگرهاي وب، بسيار اميد بخش و كارآمد است. در عين حال عدم توجه جدي به سوابق تعاملات كاربران با جويشگر طي فرآيند جستجو و ارزيابي نتايج بدست آمده، يكي از معضلات جدي آن بشمار مي‏رود. در عين حال حجم بسيار زياد ويژگي‏هاي مورد نياز از اسناد و پرس‏وجوهاي كاربران نيز كاربردي بودن اين رويكرد را در شرايط واقعي با ابهام مواجه ساخته است. استفاده از مدل اطلاعات كليك از گذر داده‏ها و توليد ويژگي‏هاي كليك از گذر داده، راهكار نويني است كه بر مبناي آن و با بكارگيري مدل برنامه‏نويسي ژنتيك چند لايه، مدل رتبه‏بندي مناسبي تحت عنوان MGPRank براي بازيابي اطلاعات انگليسي وب، عرضه شده است. در اين پژوهش اين، با عنايت به ويژگي‏هاي خاص زبان فارسي، از طريق ارائه سناريوهاي مناسب براي ايجاد ويژگي‏هاي كليك از گذر داده اين الگوريتم، اين الگوريتم بومي‏سازي شده است. نتايج حاصل از ارزيابي عملكرد اين الگوريتم در حوزه زبان فارسي با استفاده از مجموعه داده dotIR، حاكي از توانمندي قابل ملاحظه آن نسبت به روش‏هاي مرجع رتبه‏بندي اطلاعات است. اين بهبود عملكرد، بخصوص در بخش ابتدايي فهرست نتايج جستجو كه غالباً بيشتر مورد مراجعه كاربران است، قابل توجه است.
  • عنوان نشريه
    فناوري اطلاعات و ارتباطات ايران
  • عنوان نشريه
    فناوري اطلاعات و ارتباطات ايران