شماره ركورد :
1203752
عنوان مقاله :
نظركاوي بين‌زباني با استفاده از ويژگي‌هاي معنايي
پديد آورندگان :
اسمعيلي ‌تفت ، شيما داﻧﺸﮕﺎه ﺗﻬﺮان - داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ , شاكري ، آزاده داﻧﺸﮕﺎه ﺗﻬﺮان - داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ
از صفحه :
47
تا صفحه :
59
كليدواژه :
نظركاوي , تحليل نظرات , ويژگي محوري , ويژگي معنايي , بين زباني , ويژگي مستقل از دامنه , ويژگي وابسته به دامنه , گراف دو بخشي , رده بندي
چكيده فارسي :
نظركاوي يكي از زيربخش‌هاي متن‌كاوي است. در اين حوزه به بررسي متن‌هاي نظرمند پرداخته مي‌شود و هدف تشخيص مثبت و يا منفي بودن مفهوم اين متن‌ها است. روش‌ها و راه‌حل‌هاي پيشنهادي در اين حوزه به دو دسته باناظر و بدون ‌ناظر دسته‌بندي مي‌شود. از آن‌جا كه روش‌هاي باناظر كارايي و دقت بالاتري نسبت به روش‌هاي بدون ناظر دارد، سعي مي‌شود تا آن‌جايي كه امكان دارد شرايط براي استفاده از روش‌هاي باناظر فراهم شود. اصلي‌ترين نيازمندي اين روش‌ها، داده‌هاي برچسب‌خورده، به عنوان داده آموزش، در دامنه و زبان داده‌هاي آزمون است. وجود چنين داده‌هايي در تمام جفت دامنه‌ و زبان‌ها محدوديتي براي استفاده از اين گونه روش‌ها محسوب مي‌شود. با توجه به زمان‌بر و پرهزينه بودن توليد داده‌هاي برچسب‌خورده به عنوان داده‌هاي آموزش، معمولاً ايجاد چنين مجموعه داده‌اي به عنوان بهترين راه‌حل در نظر گرفته نمي‌شود. همچنين به دليل بيان متفاوتي كه در دامنه‌ها و زبان‌هاي متفاوت وجود دارد، استفاده از داده‌هاي آموزش موجود در دامنه و يا زبان متفاوت به طور مستقيم موجب كاهش كارايي روش‌ها مي‌شود. اما وجود داده‌هاي آموزش در اكثر دامنه‌ها در زبان‌هاي با منابع غني انگيزه‌اي براي استفاده غيرمستقيم از اين داده‌ها براي نظركاوي داده‌هاي آزمون در زبان‌هاي ديگر ايجاد مي‌كند. از اين رو روش‌هايي به عنوان روش‌هاي بين‌زباني ارائه شد كه در آن‌ها از داده‌هاي آموزش موجود در زبان متفاوت با داده‌هاي آزمون، براي استخراج اطلاعات و در نهايت انتقال اطلاعات به زبان مورد نظر، بهره مي‌برد. در اين مقاله روشي براي نظركاوي بين‌زباني ارائه مي‌شود كه اين استخراج و انتقال اطلاعات با كيفيت بالايي انجام مي‌شود و همچنين براي اكثر زبان‌ها، حتي زبان‌هاي منابع‌محدود نيز قابل استفاده مي‌باشد و به منابع موجود در زبان مورد نظر وابستگي كمي دارد. اين روش با استفاده از داده‌هاي بدون برچسب در هر دو زبان مبدأ و مقصد، يك گراف دوبخشي بين دو دسته از ويژگي‌هاي محوري و غيرمحوري مي‌سازد و ويژگي‌هاي معنايي را از آن استخراج مي‌كند. تنها منبع مورد نياز براي اين روش، يك لغت‌نامه است كه به دليل استفاده از تعداد محدودي از ترجمه‌هاي آن، ميزان وابستگي بالايي به اين منبع ندارد.
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
لينک به اين مدرک :
بازگشت