عنوان مقاله :
بهينهسازي آشفتگي اسامي نويسندگان مقالات فارسي با استفاده از روش جنگل تصادفي
پديد آورندگان :
مظفري ، نيلوفر مركز منطقهاي اطلاعرساني علوم و فناوري - گروه پژوهشي طراحي و عمليات سيستمها , ورع ، نرجس مركز منطقهاي اطلاعرساني علوم و فناوري - گروه پژوهشي ارزيابي و توسعه منابع
كليدواژه :
آشفتگي نگارش , جنگل تصادفي , نويسندگان مقالات فارسي , مستندسازي نامها , الگوريتم ساندكس
چكيده فارسي :
هدف: ارائه چارچوبي جهت حل مشكل آشفتگي و پراكندگي اسامي نويسندگان در مقالات فارسي كه منجر به گسيختگي و فقدان جامعيت در بازيابي اطلاعات شده است. روششناسي: پژوهش حاضر از نوع كاربردي علمسنجي است كه به روش اسنادي انجام شده است. جامعه آماري را از 913 ركورد از نام نويسندگان مقالات فارسي برگرفته از پايگاه استنادي علوم جهان اسلام، طي بازه زماني 1395 تا 1397 تشكيل ميدهد. چارچوب پيشنهادي از سه مرحله جستجو، تطابق و گروهبندي تشكيل شده است. در اين راستا، بعد از پيشپردازش اوليه و استخراج ويژگي، عمليات جستجو با هدف يافتن ركوردهايي كه بالقوه احتمال يكسانبودن آنها وجود دارد انجام شده و سپس ركوردهاي يكسان از طريق بررسيهاي بيشتر در مرحله تطابق كه مبتني بر جنگل تصادفي است يافت ميشود. يافتهها: ويژگيهاي پست الكترونيك، نام خانوادگي و نام از مهمترين ويژگيها براي بهينهسازي آشفتگي نگارش اسامي هستند. استفاده از جنگل تصادفي بهعنوان طبقهبند در مرحله تطابق، با دقت بالاي 99 درصد ميتواند مشكل آشفتگي نگارش اسامي نويسندگان را برطرف نمايد. نتيجهگيري: نتايج نشان از كارايي بالاي اين روش در يكدستسازي اسامي با توجه به معيارهاي دقت، بازيافت و مقدار اف نسبت به طبقهبندهاي بردار پشتيبان، نزديكترين همسايه و ژنتيك دارد.
عنوان نشريه :
پژوهش نامه علم سنجي
عنوان نشريه :
پژوهش نامه علم سنجي