Title of article :
An improved joint model: POS tagging and dependency parsing
Author/Authors :
Pakzad ، A. نويسنده Department of Computer Engineering, Iran University of Science & Technology, Tehran, Iran. , , Minaei Bidgoli، B. نويسنده Department of Computer Engineering, Iran University of Science & Technology, Tehran, Iran. ,
Issue Information :
دوفصلنامه با شماره پیاپی سال 2016
Pages :
8
From page :
1
To page :
8
Abstract :
تجزيه‌ي وابستگي راهي براي تجزيه‌ي نحوي زبان طبيعي است كه به صورت خودكار به تجزيه و تحليل ساختار وابستگي جملات پرداخته و براي هر جمله‌ي ورودي يك گراف وابستگي ايجاد مي‌كند. برچسب‌زني اجزاي سخن براي انجام تجزيه‌ي وابستگي يك پيش‌نياز است. عموما تجزيه‌گرهاي وابستگي به صورت مرحله‌اي پيوسته، وظايف برچسب‌زني و تجزيه‌ي وابستگي را به صورت دو گام متوالي انجام مي‌دهند. در اين مدل‌ها خطاي ناشي از برچسب‌زني در تجزيه‌ي وابستگي انتشار مي‌يابد، همچنين در حين برچسب‌زني از اطلاعات مفيد نحوي استفاده نمي‌كند. هدف از ارايه‌ي روش‌هاي توام، كاهش همزمان خطاي هر دو وظيفه‌ي برچسب‌زني اجزاي سخن و تجزيه‌ي وابستگي است. در اين پژوهش مدل‌ توام بر روي زبان فارسي و انگليسي با استفاده از نرم‌افزار Corbit مورد آزمايش قرار گرفته و ويژگي‌هاي مدل بهينه‌سازي شده است كه سبب بهبود در دقت مدل توام گرديده ‌است. نرم‌افزار Corbit پياده‌سازي يك روش توام مبتني بر گذار براي وظايف تقسيم‌بندي كلمه، برچسب‌زني اجزاي سخن و تجزيه‌ي وابستگي است. در اين پژوهش دقت توام برچسب‌زني اجزاي سخن و اتصال بدون برچسب تجزيه‌ي وابستگي بر روي داده‌هاي آزمون در زبان فارسي براي برچسب‌هاي درشت برابر 85.59 درصد و براي برچسب‌هاي ريز 84.24 درصد به‌دست آمده است. همچنين بر روي زبان انگليسي ما به دقت 76.01 براي برچسب هاي درشت و 74.31 براي برچسب هاي ريز دست يافته‌ايم.
Abstract :
Dependency parsing is a way of syntactic parsing and a natural language that automatically analyzes the dependency structure of sentences, and the input for each sentence creates a dependency graph. Part-Of-Speech (POS) tagging is a prerequisite for dependency parsing. Generally, dependency parsers do the POS tagging task along with dependency parsing in a pipeline mode. Unfortunately, in pipeline models, a tagging error propagates, but the model is not able to apply useful syntactic information. The goal of joint models simultaneously reduce errors of POS tagging and dependency parsing tasks. In this research, we attempted to utilize the joint model on the Persian and English language using Corbit software. We optimized the modelʹs features and improved its accuracy concurrently. Corbit software is an implementation of a transition-based approach for word segmentation, POS tagging and dependency parsing. In this research, the joint accuracy of POS tagging and dependency parsing over the test data on Persian, reached 85.59% for coarse-grained and 84.24% for fine-grained POS. Also, we attained 76.01% for coarse-grained and 74.34% for fine-grained POS on English.
Journal title :
Journal of Artificial Intelligence and Data Mining
Serial Year :
2016
Journal title :
Journal of Artificial Intelligence and Data Mining
Record number :
2387951
Link To Document :
بازگشت