شماره ركورد كنفرانس :
2139
عنوان مقاله :
دسته بندي متون فارسي با استفاده از يادگيري نيمه نظارت شده
پديدآورندگان :
طاهري نيا محسن نويسنده
تعداد صفحه :
6
كليدواژه :
تئوري بيز , الگوريتم Em , دسته بندي متون فارسي , يادگيري نيمه نظارت شده
سال انتشار :
1391
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
زبان مدرك :
فارسی
چكيده فارسي :
امروزه با توجه به حجم و رشد روزافزون متون فارسی، دسته بندی اتوماتیك اسناد و متون از ارزش بزرگ عملی برخوردار و به طور فزاینده، زمینه ی مهمی برای تحقیق است. در این نوشتار به بررسی یكی از روش های یادگیری هوشمند به نام یادگیری هوشمند به نام یادگیری نیمه نظارت شده در دسته بندی متون فارسی خواهیم پرداخت. بسیاری از روش های یادگیری هوشمندانه مانند یادگیری نظارت شده، فقط بر روی داده های آموزشی برچسب دار تكیه می كنند، در شرایطی كه بدست آوردن این داده های آموزشی دارای برچسب بسیار پرهزینه است. حال آنكه حجم زیادی از داده های بدون برچسب به سرعت زیاد و با هزینه ی كم در دسترس هستند. در مقابل روش هایی مانند روش یادگیری بدون نظارت فقط بر روی داده های بدون برچسب تكیه می كنند. در ادامه به بررسی روش یادگیری نیمه نظارت شده كه مابین روش های یادگیری نظارت شده و یادگیری بدون نظارت قرار دارد و از تركیبی از مثال های آموزشی برچسب دار و بدون برچسب برای یادگیری استفاده می كند پرداخته و از این تكنیك برای دسته بندی متون فارسی استفاده می كنیم.
شماره مدرك كنفرانس :
4474716
سال انتشار :
1391
از صفحه :
1
تا صفحه :
6
سال انتشار :
1391
لينک به اين مدرک :
بازگشت