• شماره ركورد كنفرانس
    2139
  • عنوان مقاله

    دسته بندي متون فارسي با استفاده از يادگيري نيمه نظارت شده

  • پديدآورندگان

    طاهري نيا محسن نويسنده

  • تعداد صفحه
    6
  • كليدواژه
    تئوري بيز , الگوريتم Em , دسته بندي متون فارسي , يادگيري نيمه نظارت شده
  • سال انتشار
    1391
  • عنوان كنفرانس
    نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
  • زبان مدرك
    فارسی
  • چكيده فارسي
    امروزه با توجه به حجم و رشد روزافزون متون فارسی، دسته بندی اتوماتیك اسناد و متون از ارزش بزرگ عملی برخوردار و به طور فزاینده، زمینه ی مهمی برای تحقیق است. در این نوشتار به بررسی یكی از روش های یادگیری هوشمند به نام یادگیری هوشمند به نام یادگیری نیمه نظارت شده در دسته بندی متون فارسی خواهیم پرداخت. بسیاری از روش های یادگیری هوشمندانه مانند یادگیری نظارت شده، فقط بر روی داده های آموزشی برچسب دار تكیه می كنند، در شرایطی كه بدست آوردن این داده های آموزشی دارای برچسب بسیار پرهزینه است. حال آنكه حجم زیادی از داده های بدون برچسب به سرعت زیاد و با هزینه ی كم در دسترس هستند. در مقابل روش هایی مانند روش یادگیری بدون نظارت فقط بر روی داده های بدون برچسب تكیه می كنند. در ادامه به بررسی روش یادگیری نیمه نظارت شده كه مابین روش های یادگیری نظارت شده و یادگیری بدون نظارت قرار دارد و از تركیبی از مثال های آموزشی برچسب دار و بدون برچسب برای یادگیری استفاده می كند پرداخته و از این تكنیك برای دسته بندی متون فارسی استفاده می كنیم.
  • شماره مدرك كنفرانس
    4474716
  • سال انتشار
    1391
  • از صفحه
    1
  • تا صفحه
    6
  • سال انتشار
    1391