عنوان مقاله :
شناسايي چالشهاي برگردان اسامي فارسي به انگليسي در پايگاه وب آو ساينس
عنوان به زبان ديگر :
The Challenges of Transliteration of Persian Names to English, and Their Impact on the Recall of Web of Science’s Retrieved Results
پديد آورندگان :
كاوه، مهسا دانشگاه شيراز، شيراز، ايران , ميرزابيگي، مهديه دانشگاه شيراز، شيراز، ايران , ستوده، هاجر دانشگاه شيراز، شيراز، ايران , مولودي، اميرسعيد دانشگاه شيراز - بخش زبا نهاي خارجي و زبان شناسي، شيراز، ايران
كليدواژه :
بازيابي اطلاعات , پايگاه وب آوساينس , برگردان انگليسي به فارسي , چالشهاي برگردان نامها
چكيده فارسي :
هدف پژوهش حاضر، شناخت چالشهاي برگردان نامهاي فارسي به انگليسي و فراواني اين چالشها در پايگاه «وبآوساينس» است. اين پژوهش به لحاظ هدف، كاربردي و از نظر نحوه گردآوري دادهها، كمّي از نوع پيمايشي است. جامعه پژوهش شامل نامهاي نويسندگان ايراني در پايگاه »وبآوساينس» است كه در بازه زماني هفتساله 2010 تا 2017 مقاله انگليسي نگاشتهاند. تعداد 3110873 نام در ابتدا بازيابي شد كه پس از پالايش و يكدستسازي اسامي به 11242 نام تقليل يافت. بهمنظور پالايش، آمادهسازي و تحليل دادهها از نرمافزار «بيباكسل»، «اكسل» و پايگاه «وبآوساينس» استفاده شد. يافتههاي پژوهش نشان داد كه در برگردان نامها از فارسي به انگليسي چهار گروه چالشهاي مربوط به «همخوانها»، چالشهاي مربوط به «واكهها»، چالشهاي مربوط به «حذف يا تكرار حروف»، و چالشهاي «تلفظي» وجود دارد. در دسته اول، چالشهاي همخوانها، نويسندگان و نگارندگان در برگردان نامها در يازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ك، ج، ك، ث، س، ص، صورتهاي مختلف نگارشي داشتهاند. در دسته دوم، چالش واكهها، صورتهاي نگارشي مختلفي در برگردان واكههاي (/u/ ،/i/، توالي واجهاي /e/ و /o/ ،/j/) و پايانه (ـِه) از فارسي به انگليسي مشاهده شد. در دسته سوم، وجود حروف مشدد و حروف (ال) در برخي نامها موجب بهوجود آمدن چندگانگي در نگارش نامها شده است. و در نهايت، در در دسته آخر، آواهاي اَ و اِ، و همچنين حذف برخي حروف بهعلت تفاوت در تلفظ نامها در گويشها و زبانهاي مختلف دچار چندگانگي شدهاند. با توجه به اهميت بازيابي اسامي در جستوجوي نويسندگان و همچنين در ارزيابي پژوهش، راهكارهايي همچون استفاده از عملگرهاي بولي و نويسه جايگزين بين صورتهاي نگارشي غالب، ايجاد ساندكس زبان فارسي، مجهزكردن پايگاه به ابزارهاي دانشي ويژه نام جهت يكدستي در برگردان نامها ضرورت دارد.
چكيده لاتين :
The present study investigated the challenges of
transliteration of Persian names to English ones, and the impact of
these challenges on the recall of web of science’s retrieved results.
This study is applied in terms of objectives and quantitative (i.e.,
survey) in terms of data collection procedure. The population included
the names of Iranian authors who had published an English article in
Web of Science between 2010 and 2017. First of all, 3110873 names
were retrieved. It was reduced to 11, 242 after homogenization process.
Data was collected through Bibexcel and Excel software and Web of
Science database. The findings showed that there were three types of
challenges (i.e., vowels, consonants, and omitted or double consonants)
in transliteration of Persian names to English ones. They resulted in
non-homogenous and different written forms. In addition, the results of
Chi-square test showed that the frequency of all forms of the mentioned
challenges had a significant effect on the recall of the retrieved results.
Considering the importance of retrieving the names in retrieval studies
as well as research studies’ evaluation, some solutions such as using
Boolean operators and wildcards between the prevailing typographical
forms, creating Persian soundex, and equipping the database with the
thesaurus are suggested.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات