عنوان :
استخراج اطلاعات خاص از اسناد نيمه ساخت يافته با استفاده از يادگيري ماشين
پديدآورندگان :
خاتون آبادي احمدرضا نويسنده , ذوالقدري جهرمي ، منصور صدرالديني ، محمدهادي نويسنده
نام دانشگاه :
دانشگاه شيراز
كليدواژه زبان طبيعي :
رده مهندسي هوش مصنوعي رباتيك كامپيوتر رايانه اطلاعات يادگيري ماشين سيستم استقراء پوشش
چكيده :
با رشد وسيع اطلاعاتي كه روزانه در وب در دسترس قرار مي گيرد، توانايي توسعه سريع عامل هاي اطلاعاتي جهت بازيابي و استخراج اطلاعات جدي تر شده است . جزء حياتي هر عامل اطلاعاتي در وب ، مجموعه اي از پوشش هاست . كه مي توانند اطلاعات مربوطه را از منابع اطلاعاتي نيمه ساخته استخراج نمايند. سيستمهاي استقراء پوشش از يادگيري استقرايي كه يكي از روشهاي يادگيري ماشين مي باشد، جهت توليد خودكار پوشش استفاده مي كنند. اين سيستمها با توجه به مثالهاي آموزشي برچسب خورده توسط كاربر، الگوهاي استخراج را استنتاج مي نمايند. برچسب گذاري مثالهاي آموزشي مهمترين محدوديت در طراحي سيستمهاي استقراء پوشش مي باشد. هدف از نمونه برداري انتخابي و توليد الگوهاي استخراج استفاده مي نمايد. اين سيستم با بهترين سيستم اسقراء پوشش يعني STALKER مقايسه شده است . نتايج آزمايشات نشان مي دهند كه سيستم طراحي شده مي تواند با برچسب گذاري كمتر، به صحتي در سطح سيستم STALKER برسد.