شماره ركورد :
1309293
عنوان مقاله :
كاربرد يادگيري ماشيني مبتني‌بر شبكه عصبي براي دسته‌بندي مستندات علمي
پديد آورندگان :
قيومي ، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي , موسويان ، مريم دانشگاه صنعتي اميركبير - دانشكده مهندسي كامپيوتر
از صفحه :
1217
تا صفحه :
1244
كليدواژه :
مستندات علمي , علوم انساني , دسته‎بندي , شبكه عصبي , فضاي برداري , پارس برت , معناشناسي توزيعي
چكيده فارسي :
از دهه 1380 شمسي، نگارش و انتشار مقالات علمي در ايران سرعت بسيار زيادي يافته‎ و سبب شده افزون ‌‌بر سازمان‎هاي دولتي مانند «ايرانداك» و «سازمان اسناد و كتابخانه ملي جمهوري اسلامي ايران»، سامانه‌هاي برخط متعدد ديگري چون «پرتال جامع علوم انساني»، «نورمگز»، «مگ‌ايران»، «علم‌نت»، «سيويليكا» و غيره اقدام به مديريت دانش و تهيه بايگاني‌هاي ساختارمند مستندات علمي كنند. هر كدام از اين بايگاني‌ها امكاناتي را در اختيار كاربر قرار مي‌دهد. يكي ‌از اين امكانات، قابليت جست‌وجوست و جست‌وجوي دقيق مي‌تواند بر كاربريِ اين سامانه‌ها تأثير به‌سزايي بگذارد. براي افزايش دقت جست‌وجو نياز است حوزه علمي مقالات مشخص شود. دسته‌بندي حجم زياد منابع علمي در حوزه‌هاي مختلف بسيار زمان‌بر است و استفاده از روش‌هاي ماشيني به‌عنوان يك راه‌حل مي‎تواند از اين كار طاقت‌فرسا بكاهد. هدف اصلي اين مقاله ارائه يك مدل دسته‌بندي براي تعيين حوزه مقالات علمي است. اگرچه در پژوهش‌هاي پيشينِ دسته‌بندي، به‌طور عمده، الگوريتم‌هاي دسته‌بنديِ متداول براي متن ساده به‌كار رفته‌اند، در اين پژوهش تلاش مي‌شود افزون ‌بر استفاده از اين دسته‌بندي‌ها، از دسته‌بندهاي مبتني‌ بر شبكه عصبي، مانند شبكه عصبي «پيچشي» و «پرسپترون»، به ‌همراه بازنمايي معنايي مبتني ‌بر بافت، مانند «پارس‌برت» استفاده شود و نتايج آن با ساير روش‌هاي متداول در ساخت بردار مستندات، مانند «ورد2وك» مقايسه شود. براي اين هدف، از داده‌هاي «پرتال علوم انساني» كه دربرگيرنده مقالات متنوع علوم انساني است، استفاده مي‌كنيم. ويژگي اين داده مشخص ‌بودن حوزه تخصصي هر مقاله است. يكي ‌از ويژگي‌هاي شبكه عصبي اين است كه برايندي از ويژگي‌هاي نهفته از داده در فضاي برداريِ ساخته‌شده شكل مي‌گيرد و براي آموزش مدل استفاده مي‌شود. بر اساس نتايج عملي، دسته‌بند «پرسپترون» مبتني ‌بر «پارس‌برت» بالاترين كاراييِ 74.71 درصدي بر اساس امتياز F ميكرو و كارايي 72.55 درصدي بر اساس امتياز F ماكرو را به‌‌دست آورده ‌است
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت