شماره ركورد :
714390
عنوان مقاله :
پيكره متني تطبيقي فارسي-انگليسي حوزه تخصصي فاوا
عنوان فرعي :
ICT English-Persian comparable textual corpus
پديد آورندگان :
دشتباني، شكوفه نويسنده دانشجوي كارشناسي ارشد دانشگاه بوعلي سينا , , منصوري زاده، محرم نويسنده دانشكده فني و مهندسي-دانشگاه تربيت مدرس Mansoorizadeh, M , نصيري، محمد نويسنده علوم پزشكي مازندران Nassiri, Mohammad
اطلاعات موجودي :
فصلنامه سال 1393 شماره 8
رتبه نشريه :
فاقد درجه علمي
تعداد صفحه :
21
از صفحه :
121
تا صفحه :
141
كليدواژه :
corpus management , longest common sub-sequence (LCS) , Sentence alignment , بلندترين زير دنباله مشترك (LCS) , پيكره تطبيقي , مديريت پيكره , ترازبندي جمله , زبانشناسي رايانشي , comprable corpus , Computational Linguistics
چكيده فارسي :
در زبانشناسي، پيكره انباره اي از داده هاي متني است. در اين مقاله، تمركز ما بر طراحي و ساخت خودكار پيكره دو زبانه فارسي-انگليسي است. ما نرم افزاري براي ساخت پيكره طراحي كرده ايم كه هزينه و زمان ساخت پيكره را كاهش مي-دهد؛ به علاوه نرم افزار ارايه شده قابليت مديريت پيكره را نيز براي كاربران فراهم مي كند. در اين مقاله، روشي براي ترازبندي جمله هاي پيكره فارسي تخصصي حوزه فاوا و جملات انگليسي پيكره تخصصي حوزه فاوا ارايه شده است. هدف ما طراحي يك سيستم ترازبندي براي استخراج جمله هاي متناظر دو زبان است. در اين روش، ما با استفاده از يك لغت نامه دو زباني كه خود مولفان ايجاد كرده ايم و با استفاده از تكنيك پيشنهاد شده، امتياز شباهت دو جمله را محاسبه مي كنيم. آزمايشات نشان مي دهد كه اين تكنيك علاوه بر اينكه از نظر دقت بسيار قوي است، تعداد جمله هاي كانديد را نيز كاهش مي دهد.
چكيده لاتين :
In Computational Linguistics, corpus is a collection of written texts or spoken materials in machine-readable form, assembled for the purpose of studying linguistic structures, language changes over time as well as natural language processing projects. In this paper, we focus on designing a bilingual corpus. This corpus is made automatically and it consists of resources and documents in ICT domain. We developed a software framework for building textual corpus to reduce the cost and construction time. In addition, this software provides corpus management capabilities. We also proposed an alignment method for Persian-English ICT corpus. Our goal is to design an alignment system for the extraction of corresponding sentences. In this method, we deployed a bilingual dictionary and artificial intelligence techniques in order to calculate score representing the similarity between two sentences. then, we automatically map each pair of sentences in both languages.
سال انتشار :
1393
عنوان نشريه :
پژوهش هاي زبان شناسي تطبيقي
عنوان نشريه :
پژوهش هاي زبان شناسي تطبيقي
اطلاعات موجودي :
فصلنامه با شماره پیاپی 8 سال 1393
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت