شماره ركورد كنفرانس :
4817
عنوان مقاله :
گروه‌بندي معنايي تركيبات اسمي زبان فارسي به همراه ساخت بانك داده
عنوان به زبان ديگر :
Semantic Classification of Persian Noun Compounds Along with a Database Construction
پديدآورندگان :
طباطبايي سيفي شهره tabatabayiseifi@ce.sharif.edu دانشكده كامپيوتر، دانشگاه صنعتي شريف؛ , ايزدي محمد izadi@sharif.edu دانشكده كامپيوتر، دانشگاه صنعتي شريف؛
تعداد صفحه :
23
كليدواژه :
گروه بندي معنايي , روابط معنايي , بانك داده تركيبات اسمي , پردازش زبان طبيعي
سال انتشار :
1398
عنوان كنفرانس :
سومين همايش ملي زبان شناسي پيكره اي
زبان مدرك :
فارسي
چكيده فارسي :
بازنمايي معنايي جملات زبان طبيعي داراي چالش هاي فراواني است. يكي از اين چالش ها بازنمايي معنايي تركيبات دستوري است كه از تركيب دو اسم با يكديگر تشكيل مي شوند و در حالت كلي زيرمجموعه اي از گروه دستوري عبارت اسمي هستند. معناي يك تركيب اسم-اسم بسته به معناي كلمات و بافتي كه در آن آمده مي تواند انواع مختلفي داشته باشد و بازنمايي آن با تركيب صفت و اسم و يا تركيب قيد و اسم خيلي متفاوت است. برخي از محققان معتقدند تعداد روابط معنايي كه در تركيبات اسمي وجود دارد نامحدود است در حاليكه اكثريت ديگر محققان اين تعداد را محدود مي دانند. روشهاي متفاوتي براي گروه بندي معنايي تركيبات اسمي ارائه شده است. در پژوهش حاضر ابتدا با بررسي موارد مختلف در زبان فارسي يك دستورالعمل جديد براي گروه بندي معنايي تركيبات اسمي ارائه شده است. سپس از پيكره 500 هزار كلمه اي سازه كليه تركيبات اسم-اسم منحصربه‌فرد به شكل خودكار استخراج شده و بر اساس دستورالعمل تهيه‌شده توسط دو برچسب زن برچسب گذاري شدند. تعداد اين تركيبات اسمي 6917 تركيب مختلف است كه در آن هر دو كلمه شركت‌كننده برچسب مقوله دستوري اسم دارند. 2000 تركيب توسط هر دو برچسب زن برچسب گذاري شدند و معيار كاپا براي اين دو نفر كه معيار ارزيابي توافق بين برچسب زني است 0.88 به دست آمد.
كشور :
ايران
لينک به اين مدرک :
بازگشت