عنوان مقاله :
سيستم شناسايي و طبقه بندي موجوديت هاي اسمي در متون زبان فارسي بر پايه شبكه عصبي
عنوان به زبان ديگر :
Named Entities Recognition and Classification System for Persian Texts Based on Neural Network
پديد آورندگان :
زالي، مجتبي دانشگاه آزاد اسلامي واحد تهران جنوب , فيروزبخت، محسن دانشگاه آزاد اسلامي واحد تهران جنوب - دانشكدة فني و مهندسي
كليدواژه :
پردازش زبان طبيعي , شناسايي موجوديت هاي اسمي , شبكة عصبي , نمايش برداري كلمات
چكيده فارسي :
شناسايي موجوديت هاي اسمي به عنوان يك وظيفه پايه اي در حوزه پردازش زبان طبيعي و به طور كلي زير مجموعه اي از استخراج اطلاعات است. در فرآيند شناسايي موجوديت هاي اسمي به دنبال مكان يابي عناصر اسمي در متن و دسته بندي آن ها به رده هايي از پيش تعيين شده از قبيل اسامي اشخاص، سازمان ها، مكان ها، عبارت هاي زماني، و غيره هستيم. هرچند پژوهش هايي گسترده در توسعه سيستم هاي شناسايي موجوديت هاي اسمي در حوزه زبان انگليسي درطي سال هاي پيشين انجام گرفته است، متاسفانه با توجه به مشكلات موجود، مانند نبود پيكره هاي متني نشانه گذاري شده استاندارد در زبان فارسي، پژوهش هاي بسيار محدودي در زبان فارسي وجود دارد. در اين مقاله با بررسي پژوهش هاي انجام گرفته در ديگر زبان ها و با بهره گيري از روش هاي تازه در اين حوزه همانند استفاده از نمايش بردارهاي عددي براي كلمات، به توسعه سيستمي براي شناسايي موجوديت هاي اسمي بر پايه شبكه عصبي پرداخته شده است. نتايج بدست آمده از مدل پيشنهادي نشان دهنده اين واقعيت است كه استفاده از مدل هاي نمايش بردارهاي عددي براي كلمات در زبان فارسي، افزون بر مرتفع كردن مشكل انتخاب ويژگي ها، مي تواند به توسعه سيستمي كارآمد منجر شود كه كم ترين وابستگي را نيز به دامنه دارد.
چكيده لاتين :
Named Entity Recognition (NER) is a fundamental task in
natural language processing and also known as a subset of information
extraction. We seek to locate and classify named entities in text into
predefined categories such as the names of persons, organizations,
locations, expressions of times, etc. Named Entity Recognition for English
texts has been researched widely for the past years, however only a few
limited researches have emphasized on Persian NER due to absence of
resources for Persian named entities and the limited amount of progress
made in Persian natural language processing in general. In this paper, a
Persian named entity recognition system has been developed based on
neural network with the study of researches conducted in other languages
and benefiting from the latest methods in this area such as using the
vector representation of words. The results from the proposed model show
that word embedding features in Persian not only resolve the problem of
feature selection, but also it could lead to the development of an efficient
system with the least dependence to the domain.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات