عنوان مقاله :
بررسي مشكلات جستوجو و بازيابي اطلاعات در پايگاههاي اطلاعاتي از جنبه ويژگيهاي نگارشي زبان فارسي
عنوان به زبان ديگر :
Survey of Information Searching and Retrieving Challenges in Databases in Connection with Persian Language Writing Features
پديد آورندگان :
هماوندي، هدي دانشگاه تهران , نوروزي، يعقوب دانشگاه قم , حسيني بهشتي، ملو ك السادات پژوهشگاه علوم و فناوري اطلاعات ايران
كليدواژه :
بازيابي اطلاعات , پايگاه هاي اطلاعاتي , زبان فارسي , ويژگي هاي نگارشي
چكيده فارسي :
اين پژوهش با هدف تشريح مشكلات عمده نوشتاري و معنايي زبان فارسي در استفاده از محيط هاي اطلاعاتي و تعيين ميزان انطباق و توجه به اين ويژگي ها هنگام جست وجو و بازيابي در پايگاه هاي اطلاعاتي فارسي و به روش پيمايشي-تحليلي و با استفاده از شيوه مشاهده مستقيم انجام گرفت. پس از مرور پژوهش هاي مرتبط، كليدواژه هاي كاوش در قالب يك سياهه شكل گرفت. هر يك از اين كليدواژه ها در پايگاه هاي اطلاعاتي مورد مطالعه شامل «پژوهشگاه علوم و فناوري اطلاعات ايران»، «پايگاه استنادي علوم جهان اسلام»، «پايگاه مجلات تخصصي نور» و «پايگاه اطلاعات علمي جهاد دانشگاهي» جست وجو و تعداد نتايج بازيابي شده ثبت گرديد. سپس، به بررسي ميزان انطباق پايگاه هاي اطلاعاتي با اين ويژگي ها پرداخته شد. برخي ويژگي هاي نوشتاري و معنايي زبان فارسي سبب بروز مشكلاتي در بازيابي اطلاعات از پايگاه هاي اطلاعاتي منتخب مي شوند. مواردي مانند پيوسته نويسي و جدانويسي واژگان مشتق، مركب و مشتق- مركب، گوناگوني جمع ها، واژگان دخيل و معادل آن ها در بخش نوشتاري و چندمعنايي، همنامي و ... در بخش معنايي از اين دست ويژگي ها هستند. فقدان پوشش مناسب ويژگي هاي يادشده در مراحل ذخيره سازي و پردازش و عدم آگاه نمودن كاربر از آن جهت اصلاح فرايند كاوش در مرحله بازيابي اطلاعات در پايگاه هاي اطلاعاتي مورد پژوهش، اثرات نامطلوبي بر فرايند كاوش و بازيابي دارد. يافته ها نشان داد كه پايگاه هاي اطلاعاتي فارسي نسبت به ويژگي هاي نوشتاري و معنايي زبان فارسي توجه كافي نداشته و بسياري از ويژگي هاي آن را در مراحل ذخيره سازي و پردازش اطلاعات ناديده مي گيرند. با توجه به تأثير اين ويژگي ها در تعامل كاربران با پايگاه هاي اطلاعاتي، احتياج كاربران فارسي زبان به ابزارهاي كاوش بومي و پايگاه هاي اطلاعاتي كه مبتني بر ويژگي هاي زبانيِ خودشان طراحي شده باشد، بيش از پيش احساس مي شود. پژوهش حاضر با بررسي ميزان توانايي پايگاه هاي اطلاعاتي فارسي زبان در پوشش برخي ويژگي هاي اين زبان كه در فرايند جست وجو و بازيابي تأثير قابل توجهي دارند، نقاط ضعف و قوت اين پايگاه ها را مشخص نموده است. نتايج آن مي تواند در جهت بهبود و اصلاح عملكرد پايگاه هاي مذكور مورد استفاده قرار گيرد.
چكيده لاتين :
The present research was carried out with the aim of
explicating the major writing and semantic problems of Persian
language when using data environments and determining the degree
of compatibility and attention to these features in Persian databases.
This research is of survey analytical type being conducted through
direct observation. Having reviewed the related literature, we kept a
checklist of search keywords. Each of these keywords was searched
in the databases under study, such as Iranian Research Institute for
Information Science and Technology, Regional Centre for Information
Science and Technology, NoorMagaz, and Scientific Information
Database affiliated with Jahad Daneshgahi, and the number of retrieved
findings was recorded.
Some of the writing and semantic features of Persian language contribute
to problems associated with retrieving information from the selected
databases. Some of these features include connected and disconnected
forms of writing of derivative, compound, and derivative-compound
words, diversity of plural forms, loanwords and their equivalents in
writing as well as polysemy, homonymy, etc., in semantics. For instance,
retrieving different results for various writing forms of the keywords
« فناوري و فن آوري » as derivative-compound words or « پتاسيوم و پتاسيم » as
various forms of recording words, or retrieving different findings for
keywords « درياي خزر، درياي مازندران و درياي كاسپين » as well as lack of their appropriate coverage as synonymous words and giving the user information about it in order
to improve the exploration process, for it has negative effects on search and retrieval process.
Findings indicated that Persian databases do not pay adequate attention to writing and
semantic features of Persian language, and disregard many of its features in searching and
retrieving information. In connection with the impact of these features on the interaction of
users with databases, Persian-speaking users’ need for native exploration tools and databases
designed in accordance with the features of their own language have become more and more
urgent. The present research has examined the ability of Persian databases in covering some
of the features of this language, which have a noticeable impact on the process of searching
and retrieval, pinpointing the weak points and strengths of these databases. The results of
the present research could be utilized to improve the performance of the above-mentioned
databases.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات