يادگيري رتبه ‏بندي محتواي فارسي وب بر مبناي برنامه‏ نويسي ژنتيك چند لايه

پديد آورندگان

كيهاني پور ، اميرحسين دانشگاه تهران- پرديس فارابي - دانشكده مهندسي - گروه مهندسي كامپيوتر

از صفحه

تا صفحه

كليدواژه

يادگيري رتبه بندي , مدل برنامه نويسي ژنتيك چند لايه , ويژگي هاي كليك از گذر داده , محتواي فارسي وب , مجموعه داده dotIR

چكيده فارسي

يادگيري رتبه‏بندي، يك رويكرد نو ظهور به منظور رفع چالش‏هاي موجود و بهبود عملكرد جويشگرهاي وب، بسيار اميد بخش و كارآمد است. در عين حال عدم توجه جدي به سوابق تعاملات كاربران با جويشگر طي فرآيند جستجو و ارزيابي نتايج بدست آمده، يكي از معضلات جدي آن بشمار مي‏رود. در عين حال حجم بسيار زياد ويژگي‏هاي مورد نياز از اسناد و پرس‏وجوهاي كاربران نيز كاربردي بودن اين رويكرد را در شرايط واقعي با ابهام مواجه ساخته است. استفاده از مدل اطلاعات كليك از گذر داده‏ها و توليد ويژگي‏هاي كليك از گذر داده، راهكار نويني است كه بر مبناي آن و با بكارگيري مدل برنامه‏نويسي ژنتيك چند لايه، مدل رتبه‏بندي مناسبي تحت عنوان MGPRank براي بازيابي اطلاعات انگليسي وب، عرضه شده است. در اين پژوهش اين، با عنايت به ويژگي‏هاي خاص زبان فارسي، از طريق ارائه سناريوهاي مناسب براي ايجاد ويژگي‏هاي كليك از گذر داده اين الگوريتم، اين الگوريتم بومي‏سازي شده است. نتايج حاصل از ارزيابي عملكرد اين الگوريتم در حوزه زبان فارسي با استفاده از مجموعه داده dotIR، حاكي از توانمندي قابل ملاحظه آن نسبت به روش‏هاي مرجع رتبه‏بندي اطلاعات است. اين بهبود عملكرد، بخصوص در بخش ابتدايي فهرست نتايج جستجو كه غالباً بيشتر مورد مراجعه كاربران است، قابل توجه است.

عنوان نشريه

فناوري اطلاعات و ارتباطات ايران

عنوان نشريه

فناوري اطلاعات و ارتباطات ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=8&DC=1160976