Title of article :
An improved joint model: POS tagging and dependency parsing
Author/Authors :
Pakzad ، A. نويسنده Department of Computer Engineering, Iran University of Science & Technology, Tehran, Iran. , , Minaei Bidgoli، B. نويسنده Department of Computer Engineering, Iran University of Science & Technology, Tehran, Iran. ,
Issue Information :
دوفصلنامه با شماره پیاپی سال 2016
Abstract :
تجزيهي وابستگي راهي براي تجزيهي نحوي زبان طبيعي است كه به صورت خودكار به تجزيه و تحليل ساختار وابستگي جملات پرداخته و براي هر جملهي ورودي يك گراف وابستگي ايجاد ميكند. برچسبزني اجزاي سخن براي انجام تجزيهي وابستگي يك پيشنياز است. عموما تجزيهگرهاي وابستگي به صورت مرحلهاي پيوسته، وظايف برچسبزني و تجزيهي وابستگي را به صورت دو گام متوالي انجام ميدهند. در اين مدلها خطاي ناشي از برچسبزني در تجزيهي وابستگي انتشار مييابد، همچنين در حين برچسبزني از اطلاعات مفيد نحوي استفاده نميكند. هدف از ارايهي روشهاي توام، كاهش همزمان خطاي هر دو وظيفهي برچسبزني اجزاي سخن و تجزيهي وابستگي است. در اين پژوهش مدل توام بر روي زبان فارسي و انگليسي با استفاده از نرمافزار Corbit مورد آزمايش قرار گرفته و ويژگيهاي مدل بهينهسازي شده است كه سبب بهبود در دقت مدل توام گرديده است. نرمافزار Corbit پيادهسازي يك روش توام مبتني بر گذار براي وظايف تقسيمبندي كلمه، برچسبزني اجزاي سخن و تجزيهي وابستگي است. در اين پژوهش دقت توام برچسبزني اجزاي سخن و اتصال بدون برچسب تجزيهي وابستگي بر روي دادههاي آزمون در زبان فارسي براي برچسبهاي درشت برابر 85.59 درصد و براي برچسبهاي ريز 84.24 درصد بهدست آمده است. همچنين بر روي زبان انگليسي ما به دقت 76.01 براي برچسب هاي درشت و 74.31 براي برچسب هاي ريز دست يافتهايم.
Abstract :
Dependency parsing is a way of syntactic parsing and a natural language that automatically analyzes the dependency structure of sentences, and the input for each sentence creates a dependency graph. Part-Of-Speech (POS) tagging is a prerequisite for dependency parsing. Generally, dependency parsers do the POS tagging task along with dependency parsing in a pipeline mode. Unfortunately, in pipeline models, a tagging error propagates, but the model is not able to apply useful syntactic information. The goal of joint models simultaneously reduce errors of POS tagging and dependency parsing tasks. In this research, we attempted to utilize the joint model on the Persian and English language using Corbit software. We optimized the modelʹs features and improved its accuracy concurrently. Corbit software is an implementation of a transition-based approach for word segmentation, POS tagging and dependency parsing. In this research, the joint accuracy of POS tagging and dependency parsing over the test data on Persian, reached 85.59% for coarse-grained and 84.24% for fine-grained POS. Also, we attained 76.01% for coarse-grained and 74.34% for fine-grained POS on English.
Journal title :
Journal of Artificial Intelligence and Data Mining
Journal title :
Journal of Artificial Intelligence and Data Mining