شماره ركورد كنفرانس
2139
عنوان مقاله
دسته بندي متون فارسي با استفاده از يادگيري نيمه نظارت شده
پديدآورندگان
طاهري نيا محسن نويسنده
تعداد صفحه
6
كليدواژه
تئوري بيز , الگوريتم Em , دسته بندي متون فارسي , يادگيري نيمه نظارت شده
سال انتشار
1391
عنوان كنفرانس
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
زبان مدرك
فارسی
چكيده فارسي
امروزه با توجه به حجم و رشد روزافزون متون فارسی، دسته بندی اتوماتیك اسناد و متون از ارزش بزرگ عملی برخوردار و به طور فزاینده، زمینه ی مهمی برای تحقیق است. در این نوشتار به بررسی یكی از روش های یادگیری هوشمند به نام یادگیری هوشمند به نام یادگیری نیمه نظارت شده در دسته بندی متون فارسی خواهیم پرداخت. بسیاری از روش های یادگیری هوشمندانه مانند یادگیری نظارت شده، فقط بر روی داده های آموزشی برچسب دار تكیه می كنند، در شرایطی كه بدست آوردن این داده های آموزشی دارای برچسب بسیار پرهزینه است. حال آنكه حجم زیادی از داده های بدون برچسب به سرعت زیاد و با هزینه ی كم در دسترس هستند. در مقابل روش هایی مانند روش یادگیری بدون نظارت فقط بر روی داده های بدون برچسب تكیه می كنند. در ادامه به بررسی روش یادگیری نیمه نظارت شده كه مابین روش های یادگیری نظارت شده و یادگیری بدون نظارت قرار دارد و از تركیبی از مثال های آموزشی برچسب دار و بدون برچسب برای یادگیری استفاده می كند پرداخته و از این تكنیك برای دسته بندی متون فارسی استفاده می كنیم.
شماره مدرك كنفرانس
4474716
سال انتشار
1391
از صفحه
1
تا صفحه
6
سال انتشار
1391
لينک به اين مدرک