شماره ركورد :
1188863
عنوان مقاله :
دگربيان: توسعه پيكره متني فارسي جملات و عبارات معادل به كمك روش جمع‌سپاري
پديد آورندگان :
معاني‌جو ، رضا داﻧﺸﮕﺎهﮔﻴﻼن - داﻧﺸﻜﺪهﻓﻨﻲ , ميرروشندل ، ابوالقاسم داﻧﺸﮕﺎهﮔﻴﻼن - داﻧﺸﻜﺪهﻓﻨﻲ
از صفحه :
22
تا صفحه :
30
كليدواژه :
پردازش زبان هاي طبيعي , پيكره , جمع سپاري , روش هاي بي ناظر , عبارات دگربيان , معيار فاصله
چكيده فارسي :
جملات و عبارات دِگَربَيان، بياني متفاوت از مفهومي يكسان هستند. شناسايي دگربيان‌ها يكي از وظايف مهم سامانه‌هاي پردازش زبان طبيعي است. با وجود اهميت اين موضوع، پيكره عبارات دگربيان در زبان فارسي توسعه‌نيافته است. هدف اين مقاله ارائه روشي جهت تهيه پيكره عبارات و جملات دگربيان در زبان فارسي است. به همين منظور سامانه‌اي خودكار و بي‌ناظر جهت استخراج عبارات و جملات دگربيان ارائه مي‌شود كه از داده‌هاي دريافت شده از خبرهاي خبرگزاري‌ها استفاده مي‌كند. با استفاده از الگوريتمي مبتني بر معيار جاكارد، نمونه‌هاي دگربيان در دو سطح عبارات و جملاتي با اندازه‌هاي متفاوت استخراج مي‌شوند. سپس نمونه‌هاي به ‌دست‌ آمده به كمك تكنيك‌هاي جمع‌سپاري و سامانه‌اي كه تحت پيام‌رسان تلگرام پياده‌سازي شده،‌ نشانه‌گذاري شده و در سه رده دگربيان، تقريباً دگربيان و نامرتبط ارائه مي‌شوند و نتايج حاصل‌شده ارزيابي مي‌گردند. در حال حاضر تعداد 1،523‌نمونه نشانه‌گذاري شده در نسخه ۱٫۰ از پيكره موجود است كه در دسترس عموم است.
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
لينک به اين مدرک :
بازگشت