شماره ركورد كنفرانس :
4418
عنوان مقاله :
دسته بندي حودكار اسناد فارسي به كمك هستان شناسي فارسي نت
پديدآورندگان :
حسن پور حميد دانشگاه صنعتي شاهرود , مدني صبا سادات دانشگاه صنعتي شاهرود
تعداد صفحه :
۹
كليدواژه :
دسته بندي خودكار متون فارسي , استخراج كلمات كليدي , هستان شناسي فارس نت , مشخصات معنايي , رفع ابهام , روابط معنايي , روش اولين مفهوم
سال انتشار :
۱۳۹۱
عنوان كنفرانس :
يازدهمين كنفرانس سراسري سيستم هاي هوشمند
زبان مدرك :
فارسي
چكيده فارسي :
روش هاي رايج براي نمايش اسناد به مانند كيسه لغات (Bag of Word) ، تنها شكل ظاهري عبارات را مورد بررسي قرار مي دهند.، در حالي كه در اين روش ها، وابستگي و روابط ميان عبارات كمتر مورد توجه قرار مي گيرد. به همين منظور در اين مقاله، از مشخصه معنايي براي غلبه بر اين محدوديت و توجه به بافت معنايي متون، استفاده شده است. در رويكرد پيشنهادي، ابتدا مفاهيم توسط هستان شناسي لغوي فارس نت استخراج شده و پس از اعمال فرايند رفع ابهام، با توجه به بافت متن، اوزان مفهوم مرتط در حين فرايند وزن دهي به وزن عبارات كليدي اضافه مي شود. اين مقاله، رويكردي جديد در حين استفاده از روش اولين مفهوم به منظور رفع ابهام از مفاهيم استخراج شده، معرفي مي كند كه كارايي اين روش را بهبود مي دهد. در اين مقاله، الگوريتم χ2 در بخش انتخاب مشخصه و روش وزن دهي ويژگي نرمال شده TFIDF در وزن دهي به كار گرفته مي شود. نتايج به دست آمده نشان مي دهد كه اعمال دانش معنايي حاصل ار هستان شناسي لغوي در فرايند طبقه بندي متون يك گام موثر در بهبود كارايي دسته بند است
كشور :
ايران
لينک به اين مدرک :
بازگشت