شماره ركورد :
1316734
عنوان مقاله :
معرفي و آزمون پيكره عليت PerCause براي شناسايي روابط علّي فارسي
پديد آورندگان :
رحيمي ، زينب دانشگاه شهيد بهشتي - آزمايشگاه پردازش زبان طبيعي , شمس فرد ، مهرنوش دانشگاه شهيد بهشتي - آزمايشگاه پردازش زبان طبيعي
از صفحه :
607
تا صفحه :
638
كليدواژه :
PerCause , شناسايي عبارات علّي , CRF , يادگيري عميق
چكيده فارسي :
شناســايي روابــط علّــي و تعييــن مــرز عناصــر علّــي در متــن از جملــه مســائل چالش برانگيــز در پــردازش زبــان طبيعــي، به ويــژه در زبان هــاي كم منبــع ماننــد زبــان فارســي اســت. در ايــن پژوهــش در راســتاي آمــوزش سيســتمي بــراي شناســايي روابــط علّــي و مــرز عناصــر آن، يــك پيكــره‌ علّيــت برچســب خورده‌ انســاني بــراي زبــان فارســي معرفــي مي شــود. ايــن مجموعــه شــامل 4446 جملــه مســتخرج از پيكــره‌ «بيجن خــان» و متــن يــك ســري كتــاب) و 5128 رابطــه‌ علّــي اســت و در صــورت وجــود، ســه برچســب علــت، معلــول، و نشــانه‌ علّــي بــراي هــر رابطــه مشــخص شــده اســت. در ايــن پژوهــش از پيكــره بــراي آمــوزش سيســتمي به منظــور تشــخيص مرزهــاي عناصــر علّــي اســتفاده شــده اســت. همچنيــن، يــك بســتر آزمــون شناســايي علّيــت بــا ســه روش يادگيــري ماشــين و دو سيســتم يادگيــري عميــق مبتنــي بــر ايــن پيكــره ارائــه شــده اســت. ارزيابي هــاي عملكــرد نشــان مي دهــد كــه بهتريــن نتيجــه‌ كلــي از طريــق طبقه بندي كننــده‌ CRF به دســت مي آيــد كــه معيــار F برابــر 76 درصــد را ارائــه مي كنــد. افــزون بــر ايــن، بهتريــن صحــت (91/4 درصــد) در روش يادگيــري عميــق BiLSTM-CRF به دســت آمــده اســت. بــه نظــر مي رســد كــه وجــود CRF به دليــل مدل ســازي بافتــار بــه بهبــود دقــت سيســتم منجــر مي شــود.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت