شماره ركورد :
919769
عنوان مقاله :
توليد درخت بانك سازه‌اي زبان فارسي به روش تبديل خودكار
عنوان به زبان ديگر :
Generating the Persian Constituency Treebank in an Automatic Converting Method
پديد آورندگان :
دهقان، محمدحسين نويسنده پرديس دانشكده هاي فني,دانشگاه تهران,ايران Dehghan, Mohammad Hossein , فيلي، هشام نويسنده پرديس دانشكده هاي فني,دانشگاه تهران,ايران Faili, Heshaam
اطلاعات موجودي :
فصلنامه سال 1395 شماره 28
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
17
از صفحه :
121
تا صفحه :
137
كليدواژه :
Persian language , Dependency Structure Treebank , Phrase Structure Treebank , Phrase Structure Parser , , پردازش زبان طبيعي , زبان فارسي , تجزيه‌گر سازه اي , Natural language processing , بانك درخت وابستگي , درخت بانك سازه اي
چكيده فارسي :
درخت بانك از مهمترين و پركاربردترين منابع مورد استفاده در زمينه پردازش زبان طبيعي است. دو نوع از پركاربردترين درخت بانكها، درخت بانك وابستگي و درخت بانك سازهاي است. با توجه به نبود درخت بانك سازهاي با حجم بزرگ در زبان فارسي در اين مقاله به بررسي روشي ارائه شده در تبديل درخت بانك وابستگي به سازهاي ميپردازيم. سپس مشكلات اين روش را در زبان فارسي و انگليسي بررسي و با ارائه راهكارهايي كيفيت تبديل را بهبود ميبخشيم. اولين راهكار، تصحيح مكان اتصال سازهها در درخت سازهاي به ازاي هر رابطهي وابستگي است. راهكار دوم، انجام مكاشفهاي به صورت پسپردازش و بر روي خروجيِ ساختار سازهاي اين روش است كه، كيفيت نهايي درخت هاي سازه اي را بهبود ميبخشد. نتايج حاصل از آزمايشها نشان ميدهد كه، روش تبديل با كمك راهكارهاي ارائه شده حدود 85/25 درصد در زبان فارسي و 39/4 درصد در زبان انگليسي داراي كيفيت بالاتري نسبت به حالتي است كه از راهكارهاي پيشنهادي استفاده نشود. در ادامه با كمك روش تبديل و درخت بانك وابستگي موجود در زبان فارسي، يك درخت بانك سازهاي توليد كرده و به كمك آن تجزيهگري سازهاي را آموزش داده ايم. كيفيت تجزيه گر آموزش داده شده با استفاده از درخت بانك حاصل از روش تبديل و راهكارهاي پيشنهادي اين پژوهش نسبت به حالتي كه از راهكارهاي پيشنهادي استفاده نشود، بهبودي 21 درصدي را نشان ميدهد.
چكيده لاتين :
Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. Also we study the algorithmrsquo;s errors and propose a solution to solve the problem and improve the quality of conversion process. The experiment results show that we can improve the quality of conversion, about 25.85 percent, in Persian and about 4.39 percent in English. With the help of the conversion algorithm and the dependency Treebank, we produce the phrase structure treebank and train a parser using the resulted treebank. Our parser output is about 21 percent, better than the same parser introduced as baseline.
سال انتشار :
1395
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
فصلنامه با شماره پیاپی 28 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت