عنوان مقاله :
كاربرد يادگيري ماشيني مبتنيبر شبكه عصبي براي دستهبندي مستندات علمي
پديد آورندگان :
قيومي ، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبانشناسي , موسويان ، مريم دانشگاه صنعتي اميركبير - دانشكده مهندسي كامپيوتر
كليدواژه :
مستندات علمي , علوم انساني , دستهبندي , شبكه عصبي , فضاي برداري , پارس برت , معناشناسي توزيعي
چكيده فارسي :
از دهه 1380 شمسي، نگارش و انتشار مقالات علمي در ايران سرعت بسيار زيادي يافته و سبب شده افزون بر سازمانهاي دولتي مانند «ايرانداك» و «سازمان اسناد و كتابخانه ملي جمهوري اسلامي ايران»، سامانههاي برخط متعدد ديگري چون «پرتال جامع علوم انساني»، «نورمگز»، «مگايران»، «علمنت»، «سيويليكا» و غيره اقدام به مديريت دانش و تهيه بايگانيهاي ساختارمند مستندات علمي كنند. هر كدام از اين بايگانيها امكاناتي را در اختيار كاربر قرار ميدهد. يكي از اين امكانات، قابليت جستوجوست و جستوجوي دقيق ميتواند بر كاربريِ اين سامانهها تأثير بهسزايي بگذارد. براي افزايش دقت جستوجو نياز است حوزه علمي مقالات مشخص شود. دستهبندي حجم زياد منابع علمي در حوزههاي مختلف بسيار زمانبر است و استفاده از روشهاي ماشيني بهعنوان يك راهحل ميتواند از اين كار طاقتفرسا بكاهد. هدف اصلي اين مقاله ارائه يك مدل دستهبندي براي تعيين حوزه مقالات علمي است. اگرچه در پژوهشهاي پيشينِ دستهبندي، بهطور عمده، الگوريتمهاي دستهبنديِ متداول براي متن ساده بهكار رفتهاند، در اين پژوهش تلاش ميشود افزون بر استفاده از اين دستهبنديها، از دستهبندهاي مبتني بر شبكه عصبي، مانند شبكه عصبي «پيچشي» و «پرسپترون»، به همراه بازنمايي معنايي مبتني بر بافت، مانند «پارسبرت» استفاده شود و نتايج آن با ساير روشهاي متداول در ساخت بردار مستندات، مانند «ورد2وك» مقايسه شود. براي اين هدف، از دادههاي «پرتال علوم انساني» كه دربرگيرنده مقالات متنوع علوم انساني است، استفاده ميكنيم. ويژگي اين داده مشخص بودن حوزه تخصصي هر مقاله است. يكي از ويژگيهاي شبكه عصبي اين است كه برايندي از ويژگيهاي نهفته از داده در فضاي برداريِ ساختهشده شكل ميگيرد و براي آموزش مدل استفاده ميشود. بر اساس نتايج عملي، دستهبند «پرسپترون» مبتني بر «پارسبرت» بالاترين كاراييِ 74.71 درصدي بر اساس امتياز F ميكرو و كارايي 72.55 درصدي بر اساس امتياز F ماكرو را بهدست آورده است
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات