شماره ركورد :
1318752
عنوان مقاله :
بهينه‌سازي آشفتگي اسامي نويسندگان مقالات فارسي با استفاده از روش جنگل تصادفي
پديد آورندگان :
مظفري ، نيلوفر مركز منطقه‌اي اطلاع‌رساني علوم و فناوري - گروه پژوهشي طراحي و عمليات سيستم‌ها , ورع ، نرجس مركز منطقه‌اي اطلاع‌رساني علوم و فناوري - گروه پژوهشي ارزيابي و توسعه منابع
از صفحه :
203
تا صفحه :
220
كليدواژه :
آشفتگي نگارش , جنگل تصادفي , نويسندگان مقالات فارسي , مستندسازي نام‌ها , الگوريتم ساندكس
چكيده فارسي :
هدف: ارائه چارچوبي جهت حل مشكل آشفتگي و پراكندگي اسامي نويسندگان در مقالات فارسي كه منجر به گسيختگي و فقدان جامعيت در بازيابي اطلاعات شده است. روش‌شناسي: پژوهش حاضر از نوع كاربردي علم‌سنجي است كه به روش اسنادي انجام شده است. جامعه آماري را از 913 ركورد از نام نويسندگان مقالات فارسي برگرفته از پايگاه استنادي علوم جهان اسلام، طي بازه زماني 1395 تا 1397 تشكيل مي‌دهد. چارچوب پيشنهادي از سه مرحله جستجو، تطابق و گروه‌بندي تشكيل شده است. در اين راستا، بعد از پيش‌پردازش اوليه و استخراج ويژگي، عمليات جستجو با هدف يافتن ركوردهايي كه بالقوه احتمال يكسان‌بودن آنها وجود دارد انجام شده و سپس ركوردهاي يكسان از طريق بررسي‌هاي بيشتر در مرحله تطابق كه مبتني بر جنگل تصادفي است يافت مي‌شود. يافته‌ها: ويژگي‌هاي پست الكترونيك، نام خانوادگي و نام از مهم‌ترين ويژگي‌ها براي بهينه‌سازي آشفتگي نگارش اسامي هستند. استفاده از جنگل تصادفي به‌عنوان طبقه‌بند در مرحله تطابق، با دقت بالاي 99 درصد مي‌تواند مشكل آشفتگي نگارش اسامي نويسندگان را برطرف نمايد. نتيجه‌گيري: نتايج نشان از كارايي بالاي اين روش در يكدست‌سازي اسامي با توجه به معيارهاي دقت، بازيافت و مقدار اف نسبت به طبقه‌بندهاي بردار پشتيبان، نزديك‌ترين همسايه و ژنتيك دارد.
عنوان نشريه :
پژوهش نامه علم سنجي
عنوان نشريه :
پژوهش نامه علم سنجي
لينک به اين مدرک :
بازگشت