شماره ركورد :
1055075
عنوان مقاله :
معرفي رويكردي ماشيني با استفاده از الگوريتم لسك و برچسب دهي نحوي جهت رفع ابهام از معناي كلمات
عنوان به زبان ديگر :
Introducing a Machine-Based Approach for Word Sense Disambiguation: Using Lesk Algorithm and Part of Speech Tagging
پديد آورندگان :
علايي ابوذر، الهام پژوهشگاه علوم و فناوري اطلاعات ايران
تعداد صفحه :
17
از صفحه :
1165
تا صفحه :
1181
كليدواژه :
رفع ابهام از معناي كلمات , هم نگاره , برچسب دهي نحوي , الگوريتم لسك , رفع ابهام از برچسب نحوي كلمات
چكيده فارسي :
پژوهش حاضر به معرفي رويكردي ماشيني براي چگونگي رفع ابهام معنايي از كلمات مي پردازد. در زبان فارسي، كه ساخت واژه پيچيده اي دارد، هم نگاره هاي بسياري ساخته مي شوند كه معاني گوناگوني در بافت هاي گوناگون دارند. يكي از راه هايي كه كمك مي كند رفع ابهام از معناي كلمات مبهم (هم نگاره ها) با سهولت و دقت بيشتري انجام شود، تخصيص برچسب درست نحوي به كلمات است. بنابراين، اگر برچسب دهي نحوي قبل از مرحله رفع ابهام معنايي از كلمات صورت پذيرد، رفع ابهام معنايي از هم نگاره ها با دقت بيشتري انجام خواهد گرفت. از آنجا كه فراواني هم نگاره هاي اسمي و صفتي در متون فارسي، در مقايسه با ساير هم نگاره ها بالاست، پس از تخصيص برچسب نحوي به كلمات لازم است رفع ابهام از برچسب نحوي هم نگاره ها نيز صورت گيرد. در اين مقاله ابتدا روش هاي ماشيني موجود در جهت رفع ابهام از معناي كلمات معرفي مي شود و سپس، الگوريتم «لسك» (كه يكي از روش هاي يادگيري ماشيني بدون نظارت/ بدون سرپرست براي رفع ابهام معنايي از كلمات مبهم موجود در متون گوناگون است) معرفي مي شود و در نهايت، رويكردي ماشيني جهت رفع ابهام از معناي كلمات با استفاده از نتيجه مرحله برچسب زني نحوي به كلمات و رفع ابهام از برچسب نحوي كلمات و الگوريتم «لسك» معرفي مي شود. انجام برچسب دهي نحوي و رفع ابهام از برچسب نحوي هم نگاره ها باعث مي شود كه الگوريتم «لسك» تنها، معاني مرتبط با برچسب هاي نحوي را در رفع ابهام معنايي از كلمات در نظر گيرد و در نتيجه، عمل رفع ابهام از معناي كلمات با دقت و سهولت بيشتري انجام پذيرد.
چكيده لاتين :
The present study introduces a machine-based approach for word sense disambiguation (WSD). In Persian, a morphologically complex language, POS tag which lots of homographs are made, one way for doing WSD is allocating the right Part Of Speech (POS) tags to words prior to WSD. Since the frequency of noun and adjective homographs in different Persian POS tag text corpuses is high, POS tag disambiguation of such homographs seems to be necessary for WSD. This paper introduces an approach in which first POS tagging is done, then the output, which is tagged sentences, enters the next step which is POS disambiguation of Persian nouns and adjective homographs. Then the output of this step enters the final step which is applying the Lesk algorithm (a kind of unsupervised learning) for WSD. The proposed approach speeds up the WSD procedure by filtering the only relevant glosses (existing in dictionary) and increases the accuracy of the WSD procedure as well.
سال انتشار :
1397
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
فايل PDF :
7583889
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت