عنوان مقاله :
ارايه يك پيكره پرسش و پاسخ مذهبي در زبان فارسي
عنوان به زبان ديگر :
Providing a Religious Corpus of Question Answering System in Persian
پديد آورندگان :
برشبان، ياسمن دانشگاه گيلان، رشت - دانشكده فني - گروه مهندسي كامپيوتر , يوسفي نسب، حامد دانشگاه گيلان، رشت - دانشكده فني - گروه مهندسي كامپيوتر , ميرروشندل، ابوالقاسم دانشگاه گيلان، رشت - دانشكده فني - گروه مهندسي كامپيوتر
كليدواژه :
سامانههاي پرسش و پاسخ , پردازش زبان طبيعي , بازيابي اطلاعات , پيكره رسائل و مسائل
چكيده فارسي :
سامانههاي پرسش و پاسخ، زيرشاخهاي از علوم پردازش زبان طبيعي و بازيابي اطلاعات محسوب ميشوند كه در چند دهه اخير مورد علاقه زياد پژوهشگران قرارگرفتهاند. با توجه به رشد فزاينده علاقهمندي به اين زمينه پژوهشي، نياز به دراختيارداشتن منابع دادهاي مناسب براي آن، بهخوبي احساس ميشود. تاكنون اغلب پژوهشهاي صورتگرفته در رابطه با توسعه پيكره پرسش و پاسخ در زبان انگليسي بوده است؛ درصورتيكه در زبانهاي ديگر مانند فارسي، نياز شديدي به وجود چنين پيكرههايي احساس ميشود. در اين مقاله، مراحل كامل توسعه يك پيكره متني پرسش و پاسخ با نام رسائل و مسائل در زبان فارسي شرح داده خواهد شد. اين پيكره شامل 2,118 سؤال غيرحقيقت و 2,051 سؤال حقيقت بوده كه براي هر سؤال، متن سؤال، نوع سؤال، سختي سؤال از نظر پرسشگر و پاسخدهنده، طبقه معنايي پاسخ در سطح درشتدانه و ريزدانه، پاسخ دقيق سؤال و شماره صفحه و پاراگراف پاسخ، نشانهگذاري شده است. پيكره پيشنهادي براي يادگيري كليه مؤلفههاي سامانههاي پرسش و پاسخ شامل دستهبندي سؤال، بازيابي اطلاعات و استخراج پاسخ، مورداستفاده ميتواند قرار گيرد و بهصورت رايگان در دسترس پژوهشگران قرار دارد. در ادامه يك سامانه پرسش و پاسخ بر روي پيكره رسائل و مسائل معرفي ميشود. نتايج نشان ميدهد كه سامانه پيشنهادي توانسته است به دقت 82/29 و ميانگين معكوس رتبه 56/73 درصد دست يابد. ميتوان اظهار كرد كه پيكره و سامانه پيشنهادي در نوع خود، نخستين پيكره و سامانه مربوط به پرسش و پاسخ با چنين ويژگيهايي براي زبان فارسي است.
چكيده لاتين :
Question answering system is a field in natural language processing and information retrieval noticed by researchers in these decades. Due to a growing interest in this field of research, the need to have appropriate data sources is perceived. Most researches about developing question answering corpus area have been done in English so far, but in other languages as Persian, the lack of these corpora is perceived. In this article, the development of a Persian question answering corpus called Rasayel&massayel will be discussed. This corpus consists of 2,118 non-factoid and 2,051 factoid questions that for each question, question text, question type, question difficulty from questioner and responder’s perspective, expected answer type in coarse-grained and fine-grained level, exact answer, and page and paraghraph number of answer are annotated. The prposed corpus can be applied to learn components of question answering system, including question classification, information retrieval, and answer extraction. This corpus is freely available for the academic purpose as well. In the following, a question answering system is presented on the Rasayel&massayel corpus. Our experimental result represents that the intended proposed system has achieved 82.29 % accuracy and 56.73 % mean reciprocal rank. It could be also claimed that this is the first ever question answering system and corpus with such features in Persian.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها