عنوان مقاله :
نظركاوي بينزباني با استفاده از ويژگيهاي معنايي
پديد آورندگان :
اسمعيلي تفت ، شيما داﻧﺸﮕﺎه ﺗﻬﺮان - داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ , شاكري ، آزاده داﻧﺸﮕﺎه ﺗﻬﺮان - داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ
كليدواژه :
نظركاوي , تحليل نظرات , ويژگي محوري , ويژگي معنايي , بين زباني , ويژگي مستقل از دامنه , ويژگي وابسته به دامنه , گراف دو بخشي , رده بندي
چكيده فارسي :
نظركاوي يكي از زيربخشهاي متنكاوي است. در اين حوزه به بررسي متنهاي نظرمند پرداخته ميشود و هدف تشخيص مثبت و يا منفي بودن مفهوم اين متنها است. روشها و راهحلهاي پيشنهادي در اين حوزه به دو دسته باناظر و بدون ناظر دستهبندي ميشود. از آنجا كه روشهاي باناظر كارايي و دقت بالاتري نسبت به روشهاي بدون ناظر دارد، سعي ميشود تا آنجايي كه امكان دارد شرايط براي استفاده از روشهاي باناظر فراهم شود. اصليترين نيازمندي اين روشها، دادههاي برچسبخورده، به عنوان داده آموزش، در دامنه و زبان دادههاي آزمون است. وجود چنين دادههايي در تمام جفت دامنه و زبانها محدوديتي براي استفاده از اين گونه روشها محسوب ميشود. با توجه به زمانبر و پرهزينه بودن توليد دادههاي برچسبخورده به عنوان دادههاي آموزش، معمولاً ايجاد چنين مجموعه دادهاي به عنوان بهترين راهحل در نظر گرفته نميشود. همچنين به دليل بيان متفاوتي كه در دامنهها و زبانهاي متفاوت وجود دارد، استفاده از دادههاي آموزش موجود در دامنه و يا زبان متفاوت به طور مستقيم موجب كاهش كارايي روشها ميشود. اما وجود دادههاي آموزش در اكثر دامنهها در زبانهاي با منابع غني انگيزهاي براي استفاده غيرمستقيم از اين دادهها براي نظركاوي دادههاي آزمون در زبانهاي ديگر ايجاد ميكند. از اين رو روشهايي به عنوان روشهاي بينزباني ارائه شد كه در آنها از دادههاي آموزش موجود در زبان متفاوت با دادههاي آزمون، براي استخراج اطلاعات و در نهايت انتقال اطلاعات به زبان مورد نظر، بهره ميبرد. در اين مقاله روشي براي نظركاوي بينزباني ارائه ميشود كه اين استخراج و انتقال اطلاعات با كيفيت بالايي انجام ميشود و همچنين براي اكثر زبانها، حتي زبانهاي منابعمحدود نيز قابل استفاده ميباشد و به منابع موجود در زبان مورد نظر وابستگي كمي دارد. اين روش با استفاده از دادههاي بدون برچسب در هر دو زبان مبدأ و مقصد، يك گراف دوبخشي بين دو دسته از ويژگيهاي محوري و غيرمحوري ميسازد و ويژگيهاي معنايي را از آن استخراج ميكند. تنها منبع مورد نياز براي اين روش، يك لغتنامه است كه به دليل استفاده از تعداد محدودي از ترجمههاي آن، ميزان وابستگي بالايي به اين منبع ندارد.
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات