استخراج اطلاعات خاص از اسناد نيمه ساخت يافته با استفاده از يادگيري ماشين

پديدآورندگان

خاتون آبادي احمدرضا نويسنده , ذوالقدري جهرمي ، منصور صدرالديني ، محمدهادي نويسنده

نام دانشگاه

دانشگاه شيراز

رشته

فوق ليسانس

تعداد صفحه

سال انتشار

1380

كليدواژه زبان طبيعي

رده مهندسي هوش مصنوعي رباتيك كامپيوتر رايانه اطلاعات يادگيري ماشين سيستم استقراء پوشش

چكيده

با رشد وسيع اطلاعاتي كه روزانه در وب در دسترس قرار مي گيرد، توانايي توسعه سريع عامل هاي اطلاعاتي جهت بازيابي و استخراج اطلاعات جدي تر شده است . جزء حياتي هر عامل اطلاعاتي در وب ، مجموعه اي از پوشش هاست . كه مي توانند اطلاعات مربوطه را از منابع اطلاعاتي نيمه ساخته استخراج نمايند. سيستمهاي استقراء پوشش از يادگيري استقرايي كه يكي از روشهاي يادگيري ماشين مي باشد، جهت توليد خودكار پوشش استفاده مي كنند. اين سيستمها با توجه به مثالهاي آموزشي برچسب خورده توسط كاربر، الگوهاي استخراج را استنتاج مي نمايند. برچسب گذاري مثالهاي آموزشي مهمترين محدوديت در طراحي سيستمهاي استقراء پوشش مي باشد. هدف از نمونه برداري انتخابي و توليد الگوهاي استخراج استفاده مي نمايد. اين سيستم با بهترين سيستم اسقراء پوشش يعني STALKER مقايسه شده است . نتايج آزمايشات نشان مي دهند كه سيستم طراحي شده مي تواند با برچسب گذاري كمتر، به صحتي در سطح سيستم STALKER برسد.

يادداشت

دانشگاه شيراز

زبان

فارسي

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=16&DC=54257