شماره ركورد :
1054124
عنوان مقاله :
سيستم شناسايي و طبقه بندي موجوديت هاي اسمي در متون زبان فارسي بر پايه شبكه عصبي
عنوان به زبان ديگر :
Named Entities Recognition and Classification System for Persian Texts Based on Neural Network
پديد آورندگان :
زالي، مجتبي دانشگاه آزاد اسلامي واحد تهران جنوب , فيروزبخت، محسن دانشگاه آزاد اسلامي واحد تهران جنوب - دانشكدة فني و مهندسي
تعداد صفحه :
14
از صفحه :
473
تا صفحه :
486
كليدواژه :
پردازش زبان طبيعي , شناسايي موجوديت هاي اسمي , شبكة عصبي , نمايش برداري كلمات
چكيده فارسي :
شناسايي موجوديت هاي اسمي به عنوان يك وظيفه پايه اي در حوزه پردازش زبان طبيعي و به طور كلي زير مجموعه اي از استخراج اطلاعات است. در فرآيند شناسايي موجوديت هاي اسمي به دنبال مكان يابي عناصر اسمي در متن و دسته بندي آن ها به رده هايي از پيش تعيين شده از قبيل اسامي اشخاص، سازمان ها، مكان ها، عبارت هاي زماني، و غيره هستيم. هرچند پژوهش هايي گسترده در توسعه سيستم هاي شناسايي موجوديت هاي اسمي در حوزه زبان انگليسي درطي سال هاي پيشين انجام گرفته است، متاسفانه با توجه به مشكلات موجود، مانند نبود پيكره هاي متني نشانه گذاري شده استاندارد در زبان فارسي، پژوهش هاي بسيار محدودي در زبان فارسي وجود دارد. در اين مقاله با بررسي پژوهش هاي انجام گرفته در ديگر زبان ها و با بهره گيري از روش هاي تازه در اين حوزه همانند استفاده از نمايش بردارهاي عددي براي كلمات، به توسعه سيستمي براي شناسايي موجوديت هاي اسمي بر پايه شبكه عصبي پرداخته شده است. نتايج بدست آمده از مدل پيشنهادي نشان دهنده اين واقعيت است كه استفاده از مدل هاي نمايش بردارهاي عددي براي كلمات در زبان فارسي، افزون بر مرتفع كردن مشكل انتخاب ويژگي ها، مي تواند به توسعه سيستمي كارآمد منجر شود كه كم ترين وابستگي را نيز به دامنه دارد.
چكيده لاتين :
Named Entity Recognition (NER) is a fundamental task in natural language processing and also known as a subset of information extraction. We seek to locate and classify named entities in text into predefined categories such as the names of persons, organizations, locations, expressions of times, etc. Named Entity Recognition for English texts has been researched widely for the past years, however only a few limited researches have emphasized on Persian NER due to absence of resources for Persian named entities and the limited amount of progress made in Persian natural language processing in general. In this paper, a Persian named entity recognition system has been developed based on neural network with the study of researches conducted in other languages and benefiting from the latest methods in this area such as using the vector representation of words. The results from the proposed model show that word embedding features in Persian not only resolve the problem of feature selection, but also it could lead to the development of an efficient system with the least dependence to the domain.
سال انتشار :
1397
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
فايل PDF :
7582571
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت