عنوان مقاله :
دگربيان: توسعه پيكره متني فارسي جملات و عبارات معادل به كمك روش جمعسپاري
پديد آورندگان :
معانيجو ، رضا داﻧﺸﮕﺎهﮔﻴﻼن - داﻧﺸﻜﺪهﻓﻨﻲ , ميرروشندل ، ابوالقاسم داﻧﺸﮕﺎهﮔﻴﻼن - داﻧﺸﻜﺪهﻓﻨﻲ
كليدواژه :
پردازش زبان هاي طبيعي , پيكره , جمع سپاري , روش هاي بي ناظر , عبارات دگربيان , معيار فاصله
چكيده فارسي :
جملات و عبارات دِگَربَيان، بياني متفاوت از مفهومي يكسان هستند. شناسايي دگربيانها يكي از وظايف مهم سامانههاي پردازش زبان طبيعي است. با وجود اهميت اين موضوع، پيكره عبارات دگربيان در زبان فارسي توسعهنيافته است. هدف اين مقاله ارائه روشي جهت تهيه پيكره عبارات و جملات دگربيان در زبان فارسي است. به همين منظور سامانهاي خودكار و بيناظر جهت استخراج عبارات و جملات دگربيان ارائه ميشود كه از دادههاي دريافت شده از خبرهاي خبرگزاريها استفاده ميكند. با استفاده از الگوريتمي مبتني بر معيار جاكارد، نمونههاي دگربيان در دو سطح عبارات و جملاتي با اندازههاي متفاوت استخراج ميشوند. سپس نمونههاي به دست آمده به كمك تكنيكهاي جمعسپاري و سامانهاي كه تحت پيامرسان تلگرام پيادهسازي شده، نشانهگذاري شده و در سه رده دگربيان، تقريباً دگربيان و نامرتبط ارائه ميشوند و نتايج حاصلشده ارزيابي ميگردند. در حال حاضر تعداد 1،523نمونه نشانهگذاري شده در نسخه ۱٫۰ از پيكره موجود است كه در دسترس عموم است.
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات