شماره ركورد كنفرانس :
2139
عنوان مقاله :
خوشه بندي جملات فارسي مبتني بر الگوريتم هاي هوش جمعي
پديدآورندگان :
بازقندي مهدي نويسنده , تدين تبريزي قمرناز نويسنده , وفايي جهان مجيد نويسنده
تعداد صفحه :
9
كليدواژه :
بردارهاي contecxt-vector , شباهت معنايي , الگوريتم PSO , خوشه بندي
سال انتشار :
1391
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
زبان مدرك :
فارسی
چكيده فارسي :
خوشه بندی یكی از مسائل مهمی است كه امروزه بسیاری از محققین در زمینه های مختلف به آن پرداخته اند. تاكنون الگوریتم های كلاسیك زیادی در این زمینه ارائه شده است. كه اغلب این روش ها دارای ناپایداری بوده و همچنین پارامترهای آن ها محدود به انتخاب كاربر می باشد. از كاربردهای خوشه بندی می توان به خوشه بندی متون و اسناد در موضوعات خلاصه سازی متون و بازیابی اطلاعات یاد كرد. در خوشه بندی جملات یك متن برای مشخص شدن جملات مشابه، نمی توان از روش مشابه آن (دسته بندی متون مشابه) استفاده كرد. بردارهایی به طول m و با مقادیر صفر بسیار زیاد پدید خواهد آمد. برای حل این مشكل، روشی جدید مبتنی بر PSO برای خوشه بندی جملات یك متن معرفی شده است. به طوریكه به جای استفاده از فاصله اقلیدستی و فاصله كسینوسی، از یك معیار جدید در محاسبه فاصله دو جمله استفاده شده است. معیاری كه در آن؛ ارتباط معنایی كلمات با استفاده از ارتباطات آنها در متن در نظر گرفته می شود. همچنین تعیین تعداد خوشه های بهینه یكی دیگر از كارهای انجام شده در این مقاله است. برای ارزیابی یك مجموعه از خبرهای ورزشی فارسی انتخاب شده است. نتایج حاصل از ارزیابی روش پیشنهادی نشان می دهند كه استفاده از خوشه بندی PSO معنایی، با تعیین تعداد خوشه های مطلوب، دقت بهتری را در خوشه بندی جملات در مقایسه با روش های دیگر، دارد.
شماره مدرك كنفرانس :
4474716
سال انتشار :
1391
از صفحه :
1
تا صفحه :
9
سال انتشار :
1391
لينک به اين مدرک :
بازگشت